Identificación

You are currently browsing the archive for the Identificación category.

El empleo de interfaces que emplean la voz para la interacción con sistemas informáticos es un área de gran interés que está experimentando un gran desarrollo.

En la actualidad se están popularizando aplicaciones en forma de agentes personales que corren sobre dispositivos móviles o altavoces autónomos que son capaces de interactuar con sus usuarios a través de la voz y el procesamiento del lenguaje natural, y también otros usos como los que se usan para contratar a distancia mediante sistemas de identificación biométrica basados en la voz.

La tecnología de identificación del texto hablado se utiliza en los servicios de atención al cliente de diferentes firmas, por ejemplo para recoger lecturas de contadores tomadas por los propios clientes.

En banca, administraciones públicas, servicios de suministro (utilities), operadoras, se emplean sistemas de reconocimiento de voz que interpretan lo dicho por el usuario, para reducir los costes de gestión y reforzar el tratamiento de la privacidad.

Actualmente la tecnología permite que a través del reconocimiento del lenguaje natural -por contraste con las respuestas de sí o no o “marque un número”- una centralita automatizada nos acabe pasando con la persona con quien queremos hablar, que antes de aceptar cualquier llamada habrá leído el motivo de la llamada que da la persona que está al otro lado del hilo telefónico.

Las tecnologías basadas en teclas numéricas irán en retroceso conforme se introducen tecnologías que hacen uso de recursos de Inteligencia Artificial.

Y las tecnologías de reconocimiento del locutor o hablante se pueden combinar con las de reconocimiento de la locución. En banca online es mucho más seguro que el sistema reconozca la voz del cliente que pedir a este que teclee un número de usuario y una contraseña.

Y al revés, la síntesis de voz ha llegado a un estado de madurez que permite entonar las frases de forma que es prácticamente imposible distinguir si es un humano o un sistema informático quien las pronuncia.

Cada vez  más, los proyectos que gestionan el habla son multidisciplinares e involucran muchos especialistas.

Entre otros, los auditores de firma vocal, que ayudan a determinar que los sistemas son apropiados para la contratación a distancia en un marco legislativo cambiante.

Tags: ,

Supongamos que dos amigos se ponen de acuerdo para engañar a un sistema de contratación basado en firma biométrica vocal, por ejemplo de un operador de telecomunicaciones, y así conseguir un teléfono móvil de forma gratuita.

Llama el amigo identificándose como la persona que no es y contrata el teléfono.

Luego el verdadero usuario se desdice indicando que él no ha realizado la contratación.

Se realiza la comprobación de voces y, efectivamente, las voces son diferentes, exonerando al contratante de las obligaciones del contrato.

Sin embargo, el amigo ha dejado en el sistema una evidencia de su propia voz, vinculándose a un delito que podrá pasarle factura en el futuro.

Pongamos que el asunto reviste suficiente gravedad para ser investigado y que la policía tiene sospechosos. Con una simple llamada puede salir de dudas.

Las evidencias de voz van a ir siendo relevantes para muchos tipos de fraude. Tanto como los restos de ADN.

 

Cuando el objeto de investigación policial o judicial está relacionado con el sonido o sus elementos afines (grabaciones, equipos, sistemas, aplicaciones, etc.) los procedimientos de estudio se orientan hacia la denominada “Acústica Forense“.

La Acústica forense es uno de los más complejos entornos de investigación de la Policía Científica, debido al carácter multidisciplinar de sus distintas aproximaciones de análisis, y a la necesidad de formación continua y actualización en aspectos técnicos y científicos.

Es un campo en el que el dominio y utilización de tecnología y aplicaciones digitales de análisis, cálculo o procesado resulta imprescindible, y con frecuencia es necesaria la participación de un equipo de expertos especializados en distintas perspectivas de estudio.

Entre los objetivos de análisis cabe destacar los siguientes:

  1. Estudios sobre identificación de locutores.
  2. Estudios sobre manipulación de registros, procesado y edición de la señal de sonido.
  3. Estudios de perfilado de locutor. A partir de un registro de una o más conversaciones indubitadas se intentan determinar rasgos de identidad (edad, sexo, etc.), asociaciones diatópicas (área geográfica del hablante), diastráticas (estrato social), emocionales, conductuales, patológicas o toxicológicas.
  4. Identificación de fuentes de registro. Instrumental utilizado para la captación.
  5. Determinación de un locutor de entre varios posibles (Ruedas de reconocimiento de voz).
  6. Análisis y determinación de falsificaciones y pirateo de soportes magnéticos de audio, en colaboración con otras Unidades. (Documentoscopía, vídeo).
  7. Extracción de sonidos relevantes a partir de fondo de ruido (voz latente).
  8. Limpieza de ruidos para facilitar identificación de voz principal.
  9. Estudios de registros no vocales (sonidos, ruidos de fondo, etc.)
  10. Acústica de disparos. Determinación de tipo de arma utilizada, ambiente acústico de la escena del crimen, etc.

La estructura de la investigación de identificación de fonogramas verbales depende directamente de los métodos utilizados y de su correspondencia con el tipo de estructura de las conclusiones de los peritajes de acústica forense.

La descomposición de los sonidos complejos en sus componentes simples permite cotejar los principales parámetros de sonido. Con la comparación de dos o más audios que contengan emisiones de voz es posible determinar la pertenencia a un mismo locutor, o a locutores diferentes.

A la grabación obtenida de un hablante que se presenta o identifica plenamente se la denomina indubitada; al fonograma en relación al cual se define su similitud o diferencia se le llama grabación controvertida.

En condiciones psicofísicas normales, todo locutor dispondrá sus órganos de la fonación en función del tipo de emisión que desee generar, ejerciendo un absoluto y voluntario control sobre los mismos. Esta posibilidad de modificar la caja de resonancia a voluntad del sujeto emisor provocará el mayor problema con el que el examinador forense deberá enfrentarse: la variabilidad de los actos de habla, especialmente en sujetos no colaborativos.

En casos de hechos delictivos como las amenazas, la extorsión o el secuestro en los que se logra obtener un audio producto de la afectación o agresión hacia un ciudadano a través de un teléfono, grabación de vídeo y audio o registro  presencial, es posible analizar las características de las voces como la tonalidad, frecuencia, intensidad y los formantes mismos, los cuales permiten individualizar la voz hasta el punto de lograr identificar a un individuo.

 

En una gradación de técnicas relacionadas con la gestión de identidad se pueden plantear tres niveles:

  • Identificación. Consiste en establecer elementos que permiten singularizar a un individuo
  • Autenticación. Consiste en confirmar que efectivamente un individuo es quien se ha identificado como tal.
  • Firma: Consiste en garantizar que se lleva a cabo la prestación del consentimiento respecto a la vinculación de un documento con un individuo correctamente autenticado.

La prestación del consentimiento puede establecerse en sentido negativo, en una forma semejante a esta:  “entendido el documento al que se vincula en este instante mi identidad confirmada, y aunque tengo potestad para ratificar o negar su contenido, no estoy de acuerdo con este“. Es decir, la vinculación con el documento no tiene por qué ser siempre en conformidad.

La identificación o autenticación basada en técnicas biométricas asociadas a la voz del interesado, que se vincula de forma criptográfica al contenido de un documento, crea una forma de contrato electrónico cuya firma cumple lo previsto en la Ley 59/2003 para la firma electrónica avanzada, tal como se indica en su artículo 3.

Pero no todas las técnicas son adecuadas para la firma electrónica, y por ello, es conveniente recurrir a especialistas que puedan apoyar en el diseño de la solución, y eventualmente, auditarla, garantizando que el proyecto ha adoptado las mejores prácticas y es incuestiionable en sede judicial.

 

Esta información se ha extraido de la página web de la Comisaría General de Policía Científica

Cuando el objeto de investigación policial o judicial está relacionado con el sonido o sus elementos afines (grabaciones, equipos, sistemas, aplicaciones, etc.) los procedimientos de estudio re realizan en el marco de la denominada Acústica Forense.

Imagen Acústica forense

La Acústica forense es uno de los más complejos entornos de investigación de la Policía Científica, debido fundamentalmente al carácter multidisciplinar de sus distintas aproximaciones de análisis, y a la necesidad de otorgar un alto y continuado nivel de formación a sus expertos. Si bien el dominio y utilización de tecnología y aplicaciones digitales de análisis, cálculo o procesado resulta imprescindible, la participación de un equipo de expertos especializados en distintas perspectivas de estudio es todavía más insoslayable.

La Acústica Forense pretende desarrollar todas aquellas tareas acústicas que puedan aportar indicios de investigación a las Fuerzas de Seguridad o pruebas periciales de cara a la Autoridad Judicial. Para ello realiza las siguientes:

Actividades de los especialistas en acústica forense

  1. Estudios sobre identificación de locutores.
  2. Estudios sobre manipulación de registros, procesado y edición de la señal de sonido.
  3. Estudios de pasaporte vocal. Consistente en:Partiendo de un registro hablado establecer rasgos de identidad (edad, sexo, etc.), asociaciones diatópicas (área geográfica del hablante), diastráticas (estrato social), emocionales, conductuales, patológicas o toxicológicas.
  4. Identificación de fuentes de registro.
  5. Ruedas de reconocimiento de voz.
  6. Análisis y determinación de falsificaciones y pirateo de soportes magnéticos de audio, en colaboración con otras Unidades. (Documentoscopia, vídeo).
  7. Estudios de registros no vocales (sonidos, ruidos de fondo, etc).
  8. Acústica de disparos. Determinación de tipo de arma utilizada, ambiente acústico de la escena del crimen, etc.

Imagen Acústica forense

Sonograma con inicio de estridencias de /s/ en torno a 2 KHz

Imagen Acústica forense

Sonograma con inicio de estridencias de /s/ a 741 Hz

 

Modelos técnicos de identificación de locutores con propósitos forenses

En la identificación de locutores con propósitos forenses, el equipo de expertos que desarrolla estas tareas es, simplemente imprescindible.

Es cierto que existen aplicaciones de reconocimiento automático que ofrecen buenos resultados en tareas de identificación y verificación de locutores. Pero también es cierto que cuando estos sistemas se enfrentan a registros en las denominadas condiciones forenses (señal degradada por la curva de respuesta telefónica, ruidos, distorsiones, pobre SNR, etc.) sus resultados no son considerados satisfactorios y, por tanto, en ningún caso pueden ser utilizados como un método de identificación forense de locutores exclusivo.

Imagen Acústica forense

Pero ¿por qué es tan complicado el análisis del habla con fines identificativos? ¿cuáles son los factores en los que subyace esta dificultad?.

A los tres ejes físicos que dimensionan el sonido -frecuencia, intensidad y tiempo- en el caso del habla, se les une un cuarto factor que aportará elementos decisivos desde un punto de vista identificativo a la producción vocal: la cavidad resonante del tracto.

En condiciones psicofísicas normales, todo locutor dispondrá sus órganos de la fonación en función del tipo de emisión que desee generar, ejerciendo un absoluto y voluntario control sobre los mismos. Esta posibilidad de modificar la caja de resonancia a voluntad del sujeto emisor provocará el mayor problema con el que el examinador forense deberá enfrentarse: la variabilidad intrapersonal de los actos de habla.

Imagen Acústica forense

Extraído del estudio desarrollado por el Doctor D. Carlos Delgado Romero, Jefe de la Sección de Acústica Forense de la C.G. Policía Científica, titulado “TÉCNICAS DIGITALES DE ANÁLISIS AUDIOVISUAL EN ACÚSTICA FORENSE”, presentado en el III Congreso de Investigadores Audiovisuales..

 

Es posible usar la voz para firmar contratos, pero es preciso seguir una serie de recomendaciones para no causar indefensión a los usuarios o firmantes.

La biometría de voz permite establecer parámetros únicos dependientes del locutor que caracterizan a cada persona y que pueden usarse para comprobar (autenticación) si una persona es quien se presume que es (identificación).

Para lograr la firma es necesario añadir un paso más: vincular el documento al firmante de manera única asociando a la autenticación una prueba de la prestación del consentimiento.

Así como las huellas dactilares son únicas en cada persona, también lo es la voz.

Aspectos como el tono, la velocidad y el timbre matizan los “formantes” de la voz, que no dependen de la locución sino del locutor.

Los sistemas actuales permiten determinar que una persona es la identificada incluso en los casos en los que la voz esté afectada por un resfriado. Y también descartar las voces pregrabadas, las de los imitadores, incluso las de esos familiares que aparentan tener “voces iguales”.