Mostrar el registro sencillo del recurso
Corrección de errores del reconocedor de voz de Google usando métricas de distancia fonética
dc.coverage.spatial | Investigación aplicada | |
dc.creator | DIEGO NIGEL JOAQUIN CAMPOS SOBRINO | |
dc.creator | MARIO ALEJANDRO CAMPOS SOBERANIS | |
dc.creator | IVAN DE JESUS MARTINEZ CHIN | |
dc.creator | VICTOR EMANUEL DE ATOCHA UC CETINA | |
dc.date | 2019-01-15 | |
dc.date.accessioned | 2021-06-22T17:37:27Z | |
dc.date.available | 2021-06-22T17:37:27Z | |
dc.identifier | https://www.rcs.cic.ipn.mx/2019_148_1/Correccion%20de%20errores%20del%20reconocedor%20de%20voz%20de%20Google%20usando%20metricas%20de%20distancia%20fonetica.pdf | |
dc.identifier.uri | http://redi.uady.mx:8080/handle/123456789/4827 | |
dc.description.abstract | Los errores en los sistemas de reconocimiento de voz para el idioma español, como por ejemplo el de Google, ocurren con bastante frecuencia cuando se utilizan en aplicaciones de un dominio específico. Estos errores se presentan mayormente cuando se intenta reconocer palabras que son nuevas para el modelo de lenguaje del reconocedor y que son ad hoc al dominio. En este artículo se presenta un algoritmo que usa la distancia de Levenshtein sobre fonemas para reducir el error del reconocedor de voz. Los resultados preliminares muestran que es posible corregir los errores del reconocedor de manera importante mediante el empleo de esta métrica y el uso de un diccionario de frases específicas del dominio de la aplicación. El algoritmo que aquí se propone, a pesar de estar diseñado para dominios muy específicos, es de aplicación general. Es decir, las frases que deben ser reconocidas pueden ser definidas específicamente para cada aplicación, sin que el algoritmo deba modificarse. Basta con indicarle al algoritmo el conjunto de frases sobre las cuales debe trabajar. La complejidad del algoritmo es O(tn), donde t es el número de palabras contenidas en la transcripción que se requiere corregir y n es el número de frases específicas del dominio. | |
dc.language | spa | |
dc.publisher | Research in Computing Science | |
dc.relation | citation:0 | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/4.0 | |
dc.source | urn:issn:1870-4069 | |
dc.subject | info:eu-repo/classification/cti/1 | |
dc.subject | CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA | |
dc.subject | info:eu-repo/classification/cti/7 | |
dc.subject | INGENIERÍA Y TECNOLOGÍA | |
dc.subject | Reconocedor de voz | |
dc.subject | Levenshtein | |
dc.subject | Corrector fonético | |
dc.title | Corrección de errores del reconocedor de voz de Google usando métricas de distancia fonética | |
dc.type | info:eu-repo/semantics/article |
Archivos en el recurso
Este recurso aparece en la(s) siguiente(s) colección(ones)
-
Artículos [523]