Mostrar el registro sencillo del recurso

dc.coverage.spatialInvestigación aplicada
dc.creatorDIEGO NIGEL JOAQUIN CAMPOS SOBRINO
dc.creatorMARIO ALEJANDRO CAMPOS SOBERANIS
dc.creatorIVAN DE JESUS MARTINEZ CHIN
dc.creatorVICTOR EMANUEL DE ATOCHA UC CETINA
dc.date2019-01-15
dc.date.accessioned2021-06-22T17:37:27Z
dc.date.available2021-06-22T17:37:27Z
dc.identifierhttps://www.rcs.cic.ipn.mx/2019_148_1/Correccion%20de%20errores%20del%20reconocedor%20de%20voz%20de%20Google%20usando%20metricas%20de%20distancia%20fonetica.pdf
dc.identifier.urihttp://redi.uady.mx:8080/handle/123456789/4827
dc.description.abstractLos errores en los sistemas de reconocimiento de voz para el idioma español, como por ejemplo el de Google, ocurren con bastante frecuencia cuando se utilizan en aplicaciones de un dominio específico. Estos errores se presentan mayormente cuando se intenta reconocer palabras que son nuevas para el modelo de lenguaje del reconocedor y que son ad hoc al dominio. En este artículo se presenta un algoritmo que usa la distancia de Levenshtein sobre fonemas para reducir el error del reconocedor de voz. Los resultados preliminares muestran que es posible corregir los errores del reconocedor de manera importante mediante el empleo de esta métrica y el uso de un diccionario de frases específicas del dominio de la aplicación. El algoritmo que aquí se propone, a pesar de estar diseñado para dominios muy específicos, es de aplicación general. Es decir, las frases que deben ser reconocidas pueden ser definidas específicamente para cada aplicación, sin que el algoritmo deba modificarse. Basta con indicarle al algoritmo el conjunto de frases sobre las cuales debe trabajar. La complejidad del algoritmo es O(tn), donde t es el número de palabras contenidas en la transcripción que se requiere corregir y n es el número de frases específicas del dominio.
dc.languagespa
dc.publisherResearch in Computing Science
dc.relationcitation:0
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/4.0
dc.sourceurn:issn:1870-4069
dc.subjectinfo:eu-repo/classification/cti/1
dc.subjectCIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA
dc.subjectinfo:eu-repo/classification/cti/7
dc.subjectINGENIERÍA Y TECNOLOGÍA
dc.subjectReconocedor de voz
dc.subjectLevenshtein
dc.subjectCorrector fonético
dc.titleCorrección de errores del reconocedor de voz de Google usando métricas de distancia fonética
dc.typeinfo:eu-repo/semantics/article


Archivos en el recurso

Thumbnail

Este recurso aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del recurso