Combinación de tecnologías del habla

audio smartphone

El empleo de interfaces que emplean la voz para la interacción con sistemas informáticos es un área de gran interés que está experimentando un gran desarrollo.

En la actualidad se están popularizando aplicaciones en forma de agentes personales que corren sobre dispositivos móviles o altavoces autónomos que son capaces de interactuar con sus usuarios a través de la voz y el procesamiento del lenguaje natural, y también otros usos como los que se usan para contratar a distancia mediante sistemas de identificación biométrica basados en la voz.

La tecnología de identificación del texto hablado se utiliza en los servicios de atención al cliente de diferentes firmas, por ejemplo para recoger lecturas de contadores tomadas por los propios clientes.

En banca, administraciones públicas, servicios de suministro (utilities), operadoras, se emplean sistemas de reconocimiento de voz que interpretan lo dicho por el usuario, para reducir los costes de gestión y reforzar el tratamiento de la privacidad.

Actualmente la tecnología permite que a través del reconocimiento del lenguaje natural -por contraste con las respuestas de sí o no o “marque un número”- una centralita automatizada nos acabe pasando con la persona con quien queremos hablar, que antes de aceptar cualquier llamada habrá leído el motivo de la llamada que da la persona que está al otro lado del hilo telefónico.

Las tecnologías basadas en teclas numéricas irán en retroceso conforme se introducen tecnologías que hacen uso de recursos de Inteligencia Artificial.

Y las tecnologías de reconocimiento del locutor o hablante se pueden combinar con las de reconocimiento de la locución. En banca online es mucho más seguro que el sistema reconozca la voz del cliente que pedir a este que teclee un número de usuario y una contraseña.

Y al revés, la síntesis de voz ha llegado a un estado de madurez que permite entonar las frases de forma que es prácticamente imposible distinguir si es un humano o un sistema informático quien las pronuncia.

Cada vez  más, los proyectos que gestionan el habla son multidisciplinares e involucran muchos especialistas.

Entre otros, los auditores de firma vocal, que ayudan a determinar que los sistemas son apropiados para la contratación a distancia en un marco legislativo cambiante.

Si te ha gustado el artículo, visita nuestro blog.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *