Corrección de errores del reconocedor de voz de Google usando métricas de distancia fonética

DIEGO NIGEL JOAQUIN CAMPOS SOBRINO; MARIO ALEJANDRO CAMPOS SOBERANIS; IVAN DE JESUS MARTINEZ CHIN; VICTOR EMANUEL DE ATOCHA UC CETINA

Mostrar el registro sencillo del recurso

dc.coverage.spatial	Investigación aplicada
dc.creator	DIEGO NIGEL JOAQUIN CAMPOS SOBRINO
dc.creator	MARIO ALEJANDRO CAMPOS SOBERANIS
dc.creator	IVAN DE JESUS MARTINEZ CHIN
dc.creator	VICTOR EMANUEL DE ATOCHA UC CETINA
dc.date	2019-01-15
dc.date.accessioned	2021-06-22T17:37:27Z
dc.date.available	2021-06-22T17:37:27Z
dc.identifier	https://www.rcs.cic.ipn.mx/2019_148_1/Correccion%20de%20errores%20del%20reconocedor%20de%20voz%20de%20Google%20usando%20metricas%20de%20distancia%20fonetica.pdf
dc.identifier.uri	http://redi.uady.mx:8080/handle/123456789/4827
dc.description.abstract	Los errores en los sistemas de reconocimiento de voz para el idioma español, como por ejemplo el de Google, ocurren con bastante frecuencia cuando se utilizan en aplicaciones de un dominio específico. Estos errores se presentan mayormente cuando se intenta reconocer palabras que son nuevas para el modelo de lenguaje del reconocedor y que son ad hoc al dominio. En este artículo se presenta un algoritmo que usa la distancia de Levenshtein sobre fonemas para reducir el error del reconocedor de voz. Los resultados preliminares muestran que es posible corregir los errores del reconocedor de manera importante mediante el empleo de esta métrica y el uso de un diccionario de frases específicas del dominio de la aplicación. El algoritmo que aquí se propone, a pesar de estar diseñado para dominios muy específicos, es de aplicación general. Es decir, las frases que deben ser reconocidas pueden ser definidas específicamente para cada aplicación, sin que el algoritmo deba modificarse. Basta con indicarle al algoritmo el conjunto de frases sobre las cuales debe trabajar. La complejidad del algoritmo es O(tn), donde t es el número de palabras contenidas en la transcripción que se requiere corregir y n es el número de frases específicas del dominio.
dc.language	spa
dc.publisher	Research in Computing Science
dc.relation	citation:0
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	http://creativecommons.org/licenses/by-nc-nd/4.0
dc.source	urn:issn:1870-4069
dc.subject	info:eu-repo/classification/cti/1
dc.subject	CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA
dc.subject	info:eu-repo/classification/cti/7
dc.subject	INGENIERÍA Y TECNOLOGÍA
dc.subject	Reconocedor de voz
dc.subject	Levenshtein
dc.subject	Corrector fonético
dc.title	Corrección de errores del reconocedor de voz de Google usando métricas de distancia fonética
dc.type	info:eu-repo/semantics/article

Archivos en el recurso

Nombre:: Correccion de errores del ...
Tamaño:: 337.5Kb
Formato:: PDF
Descripción:: Artículo

Ver/

Este recurso aparece en la(s) siguiente(s) colección(ones)

Artículos [523]

Mostrar el registro sencillo del recurso