martes, 4 de mayo de 2010

Reconocimiento de voz - evaluación de desempeño de reconocedores en ambientes adversos

Las aplicaciones que ofrecen interfaces de usuario basadas en voz comprenden un extenso abanico de ambientes y situaciones de uso, algunas de las cuales pueden implicar condiciones poco estables o declaradamente adversas para el procesamiento de las señales sonoras.

Uno ejemplo natural, notorio y atractivo es el de aquellas aplicaciones desarrolladas para uso durante la conducción de motocicletas; es evidente que las condiciones de ruido ambiental, de alteración del habla por estrés o desconcentración, interferencia en la emisión y percepción de las señales y otros muchos factores de degradación de las señales sonoras se extreman en el contexto del movimiento en motocicleta, es por esto que MPORAS, IOSIF, et al. realizan en [1] una comparación entre los esquemas disponibles actualmente para el mejoramiento de la señal de voz en condiciones adversas.

Además de proveer un comparativo relevante, en el que método MSSM (Multi-band Spectral Subtraction Method) es señalado como el más eficiente, [1] proporciona un vistazo a los esfuerzos actuales (2010) en el contexto del mejoramiento en la interpretación de voz en ambientes poco amigables.

Referencias
[1] MPORAS, IOSIF, et al. "SPEECH ENHANCEMENT FOR ROBUST SPEECH RECOGNITION IN MOTORCYCLE ENVIRONMENT." International Journal on Artificial Intelligence Tools 19.2 (2010): 159-173. Computers & Applied Sciences Complete. EBSCO. Web. 4 May 2010.

1 comentario:

  1. Sería interesante aplicar estas técnicas en ambientes aparentemente más amigables. Por ejemplo el reconocedor de voz de Windows Vista aún tiene muchos problemas en identificar en qué momento el usuario le está dictando a la computadora o bien emitiendo comandos.

    Si bien un ambiente de escritorio no representa mucho reto en cuanto al ruido de fondo, los timbres de voz, la intención y tonalidad pueden ser áreas de estudio para evaluar el desempeño de reconocedores de voz.

    Dejo un video donde se ve a un usuario lidiando con el reconocedor de voz.
    http://www.youtube.com/watch?v=KyLqUf4cdwc&feature=player_embedded

    Saludos!

    ResponderEliminar