martes, 4 de mayo de 2010

Reconocimiento de Voz - usos del reconocimiento de voz

Dentro del amplio campo de acción de las interfaces basadas en voz se encuentra esta novedosa aplicación propuesta por Barras [1] en la que el reconocimiento de voz ayuda a mantener o recuperar el hilo de una junta o conversación a partir de un relativamente simple método en el que las palabras son clasificadas por su recurrencia en la conversación y los segmentos conteniendo las más comunes son elegidos para conformar un sumario de contenido total de la glosa.

De acuerdo con los comentarios de Barras, el reconocimiento de voz sumado al método propuesto de categorización genera resúmenes de menos de la mitad de la longitud inicial de la conversación que son un 80% efectivos en proporcionar a un escucha recién llegado un entendimiento consistente de la sección de la plática que se perdió.

El método completo descrito en [1] es el siguiente: procesar la conversación e interpretarla por medio de reconocimiento de voz, categorizar la relevancia de las palabras usadas por su frecuencia, eliminar palabras comunes del lenguaje, como preposiciones y muletillas, seleccionar las sentencias en las que estan presentes las palabras más relevantes, sintetizar esas sentencias en un resumen y proporcionarlo a los usuarios que no participaron en la sesión desde el principio, en modo de voz nuevamente para, además del resumen, ofrecer también el contexto de entonación y volúmen de cada sentencia.

Referencias

[1] Barras, Colin. "Could speech recognition improve your meetings?." New Scientist 205.2747 (2010): 18-19. Computers & Applied Sciences Complete. EBSCO. Web. 5 May 2010.

2 comentarios:

  1. Este tipo de aplicacionee usando voz, se me hacen muy útiles en el campo empresarial, ya que en un junta puede haber personas que se retrasen y con ellos al llegar pueden enterarse de forma rápida de lo mas importante en la junta. Sería útil que el resumen se pudiera presentan en diferentes idiomas para aquellas juntas en las que se concentren personas de diferentes nacionalidades

    ResponderEliminar
  2. Lejos de la aportación que hace el reconocimiento de voz, me intriga un poco la sección de "sintetizar oraciones en un resumen". Me pregunto si se utilizan algoritmos de inteligencia artificial o procesos estadísticos para decidir qué oraciones son más relevantes en la conversación. Comento esto porque también es común que en las empresas no se mencione el tópico de la junta muy a menudo o bien se desvíe el tema en pláticas no tan relevantes.

    Me parece que una buena aplicación de esta idea sería utilizar el reconocimiento de voz para traducir en tiempo real a lenguaje de señas. Ayudando a personas que carecen del sentido auditivo a participar activamente en una junta.

    Saludos!

    ResponderEliminar