Skip to main content

Qu'est-ce qu'un modèle acoustique?

Un modèle acoustique est essentiellement une carte de la voix par rapport à une série de mots imprimés.Cette technologie est utilisée dans les programmes de reconnaissance vocale pour aider un ordinateur à apprendre à reconnaître les modèles de parole d'une personne.Un modèle acoustique est l'un des deux fichiers principaux nécessaires pour exécuter un programme de reconnaissance vocale;L'autre est le modèle de langue, qui indique des mots et des modèles de discours probables qui peuvent être utilisés par l'orateur.Ces modèles sont créés en comparant les détails sonores d'un fichier audio parlé au texte des mots prononcés.

Le logiciel de reconnaissance vocale est un logiciel conçu pour reconnaître et transcrire ou répondre aux mots qu'une personne dit.De nombreux systèmes d'exploitation sont conçus avec des capacités de reconnaissance vocale de base intégrées que l'utilisateur peut s'allumer et désactiver.Les capacités de reconnaissance vocale sur les systèmes d'exploitation donnent généralement à l'utilisateur la possibilité de contrôler l'ordinateur et de taper des mots à l'écran en utilisant sa voix.

Pour accéder au logiciel de reconnaissance vocale, un utilisateur a besoin d'un microphone pour amener sa voix à l'ordinateur, plus un programmequi traite le son.Alors que de nombreux ordinateurs ont des microphones intégrés, un microphone de casque externe permet à l'utilisateur le bénéfice d'un son vocal plus clair et de la liberté de se déplacer dans la pièce tout en parlant.Les marques de logiciels de reconnaissance de la parole autonomes incluent Lumenvox , Loquendo , et Dragon .

La plupart des programmes de reconnaissance vocale ont une programmation de modèles acoustique qui permet au programme de reconnaître les variations de prononciation.Ils utilisent des modèles dans le son de la voix des locuteurs pour identifier les mots dans la parole.Beaucoup sont conçus avec un logiciel de configuration fabriqué pour aider l'utilisateur à créer un modèle acoustique conçu pour interpréter sa propre voix.Certains programmes avancés de reconnaissance vocale peuvent identifier et interpréter plusieurs langues, souvent avec une infime quantité d'informations solides.Plus un programme de reconnaissance vocale est avancé, plus il est susceptible d'interpréter avec précision les mots en fonction de son contexte, y compris où dans une phrase un mot est prononcé.

Le domaine d'étude qui développe la technologie de reconnaissance vocale est appelé linguistique informatique.La linguistique informatique implique une étude et une conception qui créent des logiciels programmés pour comprendre la parole humaine.Ce domaine intègre souvent des informations de l'étude de la psychologie pour créer des modèles acoustiques qui peuvent interpréter plus précisément la parole.

Le mot acoustique fait généralement référence à tout ce qui a à voir avec le son.Bien que les modèles acoustiques soient le plus souvent utilisés dans la reconnaissance vocale, ils peuvent également être utilisés dans la musique.Un modèle acoustique d'une piste musicale peut identifier des propriétés comme les battements par minute, les clés musicales ou les emplacements dominants dans la musique.Ces informations peuvent être utilisées par un programme informatique pour identifier une piste de musique, ou elles peuvent être utilisées pour déterminer de manière lâche le genre dans lequel la musique est probablement classée.Des modèles acoustiques sont également utilisés dans un domaine d'étude appelé psychoacoustique, dans lequel les chercheurs espèrent apprendre à structurer la musique qui affecte prévisible le cerveau.