Uso de técnicas biométricas en el reconocimiento de locutor

El reconocimiento de orador o locutor, es una modalidad biométrica que parte de la voz de una persona para identificarla o confirmar su identidad. Se diferencia de otra modalidad destinada a reconocer las palabras pronunciadas y transcribirlas a texto escrito (reconocimiento de locución).

El proceso de reconocimiento de locutor depende de las características de la estructura física del tracto vocal de cada persona que afecta a las frecuencias de resonancia que matizan el sonido generado en mayor o menos medida por las cuerdas vocales y a algunos aspectos de vocalización y uso de giros y expresiones conscientes e inconscientes.

El reconocimiento de locutor, entre todas las técnicas biométricas, tiene la ventaja de su utilidad en contextos en los que no es posible la personación y facilita la evaluación de identidad a distancia.

El tipo de interfaz para la captación de la voz es un micrófono, dispositivo de bajo coste y muy ubicuo, presente en teléfonos analógicos convencionales, teléfonos digitales, teléfonos inteligentes, tabletas, ordenadores, equipos de radio,…

La verificación del orador, ha evolucionado a la par que las tecnologías de reconocimiento de voz y de síntesis de voz dado las similares características y desafíos que cada ambos enfoques tecnológicos conllevan.

En 1960, Gunnar Fant, un profesor sueco publicó un modelo que describía los componentes psicológicos de la producción de habla acústica, basado en el análisis de rayos x de individuos produciendo sonidos fónicos específicos. En 1970, Joseph Perkell utilizo rayos x en movimiento e incorporó la lengua y la mandíbula para expandir el modelo de Fant. Los sistemas de reconocimiento de locución originales utilizaban el resultado promedio de varios filtros analógicos para buscar coincidencias, muchas veces con la ayuda de humanos en el proceso.

En 1976, Texas Instruments construyó un  prototipo que ensayó la Fuerza Aérea de los Estados Unidos y la Corporación MITRE. A mediados de los 80s, el Instituto Nacional de Estándares y Tecnología (NIST) de Estados Unidos desarrolló el Grupo de Discurso NIST para estudiar y promover el uso de técnicas de procesamiento de discurso. Desde 1996, bajo la creación de la Agencia Nacional de Seguridad (NSA), el Grupo de Discurso de NIST ha llevado a cabo evaluaciones anuales, el Workshop de Evaluación de Reconocimiento de Voz, para fomentar el continuo avance de la comunidad de reconocimiento de voz.

El componente psicológico del reconocimiento de voz está relacionado con la forma física del tracto vocal de un individuo, que consiste de una vía respiratoria y cavidades de tejido blando de donde se originan los sonidos vocales. Para producir sonidos, estos componentes trabajan en combinación con los movimientos físicos de la mandíbula, la lengua, la laringe y las resonancias de los pasajes nasales, en incluso la cavidad torácica. Las características acústicas del habla provienen de los atributos físicos de las vías respiratorias. El movimiento de la boca y de las pronunciaciones son también componentes de comportamiento cuyo resultado se registra y modela para permitir el reconocimiento de una persona por su voz.

Hay dos formas de reconocimiento por voz: una dependiente del texto (modo limitado) y otro independiente del texto (modo  ilimitado). En un sistema que utiliza discurso dependiente del texto, el individuo presenta una frase fija de unos cuantos segundos (por ejemplo “mi voz es mi contraseña”) o una frase programada dentro del sistema (“Por favor diga los números: 33-54-63”) que mejora el grado de reconocimiento especialmente con usuarios que cooperan. Un sistema independiente del texto no posee ningún conocimiento “a priori” del contenido que expresa la persona que se pretende identificar y es mucho más flexible en situaciones en las que la persona de la que se obtiene la muestra no es consciente de que está siendo grabada porque se supone  que no desea cooperar, lo que presenta un reto de especial relevancia.

Las muestras de voz son ondas donde la variable del tiempo se extiende como coordenada horizontal y la de intensidad de sonido en la vertical. El sistema de reconocimiento de quien habla analiza el contenido de frecuencia del discurso, transformándolo del dominio del tiempo al dominio del espectro, y compara las características de calidad, duración, intensidad, dinámica y tono (componentes espectrales) de la señal.

En los sistemas dependientes del texto, durante la toma o fase de inscripción, el individuo pronuncia una palabra corta o frase (sentencia), capturada típicamente por un micrófono tal como el de un teléfono. La muestra de voz se convierte desde un formato analógico a uno digital, las características de la voz del individuo se extraen, luego se crea un modelo.

La mayoría de los sistemas de verificación de quien habla dependientes del texto utilizan el concepto de Cadenas Ocultas de Markov (HMM), que son modelos estocásticos que proporcionan una representación estadística de los sonidos producidos por el orador. El HMM representa las variaciones subyacentes y los cambios temporales a lo largo del tiempo en los estados del discurso utilizando las características de calidad, duración, intensidad de la dinámica y tono (componentes espectrales), mencionadas anteriormente.

Otro método matemático utilizado es el  Modelo de Mixturas Gausianas, una correspondencia de estados relacionada con HMM, que se utiliza frecuentemente para aplicaciones ilimitadas independientes del texto.  Como el HMM este método utiliza la voz para crear un número de vectores de estado que representan las variaciones de las formas del sonido, que son características de la fisiología y el comportamiento de un individuo.

Todos estos métodos comparan las diferencias y similitudes entre las entradas de voz y los tipos y estados de voz captados en una fase anterior para producir un resultado que señala el grado de coincidencia.

En el ámbito de la biometría de voz, especialmente en el ámbito académico, se registran grabaciones de las personas a las que se quiere identificar junto con las de otras que forman la base de comparación, de forma que la similitud de las comparaciones respecto a la persona a la que corresponde la grabación claramente sea discriminante en relación con la similitud respecto a las personas a las que no corresponde.

Tras el registro sonoro, durante la fase de reconocimiento, los mismos parámetros de calidad, duración, volumen y tono se extraen de la muestra tomada y se comparan con el modelo de la identidad, o de la supuesta identidad, y con otros modelos de otras voces. Los modelos de otras voces (o “antivoces”) contienen los estados de una gran variedad de individuos, excluyendo el modelo de la identidad, o supuesta  identidad, que se está buscando. La muestra de la voz o el registro de sus modelos se comparan para generar una indicación de grado de similitud, indicando en qué proporción la muestra captada se corresponde la referencia de la identidad buscada. Si la voz captada pertenece a la identidad alegada, el porcentaje de similitud reflejará que la muestra presenta mayores similitudes con la identidad alegada que con el modelo correspondiente a otras voces de la base.

Algunos de los retos que presenta esta tecnología son la susceptibilidad al canal de transmisión (ancho de banda, ruido, niveles de cuantificación, algoritmos de codificación, bitrate, eco del canal), y la variaciones de los micrófonos (sensibilidad, directividad, respuesta en frecuencias, ruido intrínseco, captación de ruido ambiental, eco ).

Los sistemas también deben lidiar con que las muestras iniciales se registran en un tipo de contexto y las que requieren autenticación se registran en otro, afectado por diferentes limitaciones.

Los sistemas de verificación de voz, exceptuando a los que utilizan frases instanciadas dinámicamente, también son susceptibles de ataques por spoofing si puede preverse una secuencia de preguntas y repuestas compatible con la utilización de una voz grabada. Algunas medidas anti-spoofing contemplan la repetición de una palabra o frase aleatoria.

Las investigaciones actuales en el área de reconocimiento de voz independiente del texto exploran aspectos como funciones prosódicas (ritmo, la velocidad, la modulación y entonación), tipos de personalidad e influencia parental, semántica, idiolectos, pronunciaciones e idiosincrasias, relaciones con el lugar de nacimiento, estatus socio-económico, nivel de educación.

 

Posted in Biometria, Voz | Comments Off on Uso de técnicas biométricas en el reconocimiento de locutor

Cuidado de la garganta y de la voz

La voz de una persona sirve como su firma vocal, en muchas situaciones sociales, que define nuestras interacciones con las personas que nos rodean.

Cuando tenemos problemas con la voz afrontamos el riesgo de cierto aislamiento social y de un bajo rendimiento. Los estudios han demostrado que los hasta 30% de los habitantes de países avanzados  sufren de un problema de voz en algún momento de sus vidas. En Estados Unidos hasta 28 millones de personas se ven afectados a diario en sus actividades de trabajo.

En caso de sufrir problemas de voz conviene adoptar medidas, especialmente si persisten durante más de 2 semanas.

El primer paso en la gestión de un problema de voz es una evaluación formal por parte de un otorrinolaringólogo. Un otorrinolaringólogo, es un médico que está especialmente capacitado para tratar los problemas de voz y de las vías respiratorias. La evaluación consiste en un examen de rutina de cuello y garganta  y en caso de contar con esta tecnología, un examen especial en video de las cuerdas vocales conocidas como videoestroboscopia. El examen en vídeo capta de cerca las imágenes de las cuerdas vocales y le permite al médico ver su actividad a cámara lenta.  El videostrobe puede ayudar a identificar cambios muy sutiles en las cuerdas vocales que pueden afectar negativamente a la voz de un paciente.

Las causas de los problemas de voz varían ampliamente. A veces, que puede estar relacionado con una conducta compensatoria a los cambios después de un resfriado o el efecto de reflujo laringofaríngeo (LPR o “reflujo silencioso). Estas razones a menudo se pueden tratar con medicamentos o con terapia de voz. En ocasiones otras causas tales como nódulos, pólipos, o incluso algunos tipos de cáncer de la laringe, pueden requerir cirugía. Un otorrinolaringólogo puede tratar  la enfermedad, preservando las cuerdas vocales.

Otros tratamientos pueden incluir irrigaciones o inyecciones, o terapia de la voz, ayudado por un patólogo del habla y lenguaje como un tratamiento adicional después de la cirugía para fomentar los mejores hábitos vocales y evitar la recurrencia del problema subyacente.

Posted in Aspectos médicos | Comments Off on Cuidado de la garganta y de la voz

Forensic and investigatory voice record

La norma ANSI denominada ANSI/NIST-ITL 1-2011 Update:2013Data Format for the Interchange of Fingerprint, Facial & Other Biometric Information” recoge en su apartado 8-11 un nuevo tipo de datos de intercambio: Type-11: A new record type introduced to handle forensic and investigatory voice data. Este tipo de datos está diseñado para manejar la voz con fines de investigación y colaboración judicial.

En el capítulo se contemplan tanto la identificación del discurso como la identificación del hablante. Identifica el concepto de transacción por lo que en una transacción se puede incluir el contenido de varias voces y su contexto.

Posted in Estándares | Comments Off on Forensic and investigatory voice record

Especificaciones W3C y VoiceXML Forum sobre aspectos de gestión de voz

El W3C y el VoiceXML Forum han mantenido una estrecha relación de trabajo desde 1999. El W3C buscó un método para extender la Web visual mediante la introducción de capacidades de voz , y el Foro VoiceXML respondió aportando su especificación de nueva creación VoiceXML 1.0 al W3C para su evolución posterior.

Esta acción permitió establecer un curso de acción para el Grupo de Trabajo del W3C sobre Navegador por Voz, que ha generado la especificación  VoiceXML 2.0 y otras  especificaciones fundamentales relacionadas. Las dos organizaciones han mantenido una relación de enlace permanente, colaborando en el desarrollo de requisitos, conformidad y corrección de erratas, que siguen conformando el desarrollo de la nueva especificación VoiceXML 3.0 y otros esfuerzos en curso. A continuación se muestra una lista de las especificaciones relacionadas con la voz producidas por el W3C:

 

Posted in Estándares | Comments Off on Especificaciones W3C y VoiceXML Forum sobre aspectos de gestión de voz

Contratación de seguros a distancia

La Dirección General de Seguros y Fondos de Pensiones incluye en su página web un resumen repecto a la Contratación de seguros a distancia

Se basa en lo previsto en la Ley 22/2007, sobre comercialización a distancia de servicios financiero destinados a los consumidores, que contempla la contratación de seguros y otros servicios financieros, a distancia, sin la presencia física de las partes contratantes. Por ejemplo, la contratación por vía telefónica, por fax o a través de Internet.

Antes de la celebración a distancia de un contrato de seguro, el asegurador deberá poner a disposición del consumidor, de forma previa y con la suficiente antelación:

  • La identidad de la entidad aseguradora, su domicilio y su dirección a efectos de sus relaciones con los tomadores y asegurados.
  • Si interviene un representante legal de la entidad, se hará constar su identidad.
  • Si interviene un mediador de seguros, se hará constar su identificación.
  • Identificación de los Registros Públicos en que está inscrita la entidad (Registro Mercantil y Registro administrativo de entidades aseguradoras) y número de registro.
  • Autoridad encargada de la supervisión de la entidad.
  • Descripción de las principales características del contrato de seguro.
  • El precio total que debe satisfacer el tomador por el seguro, con inclusión de todas las comisiones, cargas y gastos, así como todos los impuestos pagados a través de la entidad aseguradora.
  • Indicación del periodo para el que es válida la información suministrada.
  • Modalidades de pago y ejecución.
  • Si fuera el caso, indicación del coste suplementario que supone contratar a distancia (por regla general, supone un descuento o menor coste).
  • Si existe o no derecho de desistimiento y, en su caso, el plazo y condiciones para su ejercicio.
  • La duración contractual mínima.
  • Información sobre la existencia o no de derechos, distintos del de desistimiento, que puedan tener las partes para resolver el contrato y las condiciones para su ejercicio.
  • Estado en cuya legislación se basan las relaciones precontractuales, ley aplicable al contrato y jurisdicción a la que acudir en caso de conflicto.
  • Lengua o lenguas en que se presenta la información previa al contrato y la lengua o lenguas en que puede formalizarse el mismo.
  • A qué sistemas de resolución extrajudicial de conflictos, de carácter público o privado, puede el consumidor tener acceso y cómo puede acceder a ellos.
  • La existencia de fondos de garantía u otros mecanismos de indemnización, sean de carácter obligatorio o voluntario.

Además, deberán cumplirse todos los requisitos de información previa al tomador que se exigen en todos los contratos de seguros, sean o no realizados a distancia, en cumplimento del  Real Decreto 2486/1998, de 20 de noviembre, por el que se aprueba el Reglamento de ordenación y supervisión de los Seguros Privados.

En el web de la DGSFP hay un apartado específico sobre “información al tomador”.

En la comercialización a distancia de productos de seguros deberá quedar constancia en soporte duradero de las ofertas y de los contratos celebrados. Se admite como soporte duradero su reflejo en papel o en cualquier otro instrumento que permita al tomador almacenar la información y recuperarla fácilmente cuando así lo requiera.

Una vez celebrado el contrato de seguro a distancia, el tomador dispone, en la mayor parte de los casos, de un plazo de 14 días para desistir del contrato a distancia, sin indicación de los motivos y sin penalización alguna. Si se trata de seguros de vida, el plazo será de 30 días.

En el web de la DGSFP hay un apartado específico sobre el derecho de desistimiento: “resolución unilateral/desistimiento” .

Las entidades aseguradoras no pueden celebrar contratos de seguro a distancia, ni renovarlos (salvo que en el contrato esté expresamente prevista la renovación por esta vía), sin que el consumidor lo solicite. En caso de que se prestase un servicio de seguros a distancia sin que el consumidor lo solicite, el consumidor no estará sometido a ninguna obligación derivada del mismo. Esta circunstancia implica que, por el hecho de no rechazar expresamente un seguro a distancia que no se ha solicitado, la entidad aseguradora no puede entender que el contrato ha sido aceptado.

Posted in Contratación, Contratación a distancia, Seguros, Servicios financieros, Soporte duradero | Comments Off on Contratación de seguros a distancia

Voice Format for Data Interchange (VoiceXML Forum – INCITS)

Desde 2006 , el VoiceXML Forum y el comité de biometría INCITS’ M1  han trabajado juntos para definir un formato de fichero de intercambio de datos biométricos de locutores. El documento generado se denomina

 

Posted in Estándares | Comments Off on Voice Format for Data Interchange (VoiceXML Forum – INCITS)

Firma vocal de mandatos SEPA para adeudos por domiciliaciones

A partir del pasado 1 de febrero de 2014 las empresas que cobran sus servicios a través de recibos domiciliados deben cumplir las obligaciones de obtención y custodia del mandato que establece la normativa SEPA. Los adeudos directos mediante recibo domiciliado correspondientes a clientes nuevos que se practiquen sin autorización, es decir, sin el requerido mandato, podrán ser objeto de devolución y reembolso durante los 13 meses siguientes al cargo no autorizado.

Estas obligaciones harán que el esfuerzo de las empresas se centre en acreditar la obtención del consentimiento del cliente para realizar el adeudo del recibo en su cuenta corriente.

Normativa actual

En la sección 4.1 del Core SDD Rulebook se establece que el mandato es una expresión de consentimiento y autorización del deudor al acreedor y menciona únicamente dos formatos: el mandato en papel con firma manuscrita y el e-mandato con firma electrónica. Esta lista tasada se confirma en las FAQ del portal SEPA del Banco de España  en las que se afirma que el mandato telefónico no es válido y sólo se contempla la firma manuscrita y la firma electrónica que equivalga a firma manuscrita según la ley. De ello se deduce que un e-mandato sólo sería válido si estuviese firmado por el cliente con firma electrónica reconocida.

Sin embargo, el EPC (European Payments Council) emitió una nota aclaratoria en la que explica que los métodos de firma descritos en la sección 4.1 del Core SDD Rulebook no son exhaustivos y que se puede considerar el uso de otros métodos de firma que sean legalmente vinculantes, incluyendo los utilizados en las normas locales vigentes hasta ahora.

En una declaración posterior del SEPA Council se ha valorado positivamente la intención del EPC de dar un mensaje claro a favor de la tesis de que los SDD Rulebooks no son un obstáculo para el uso continuado, después del 1 de febrero de 2014, de métodos válidos de mandatos electrónicos ya existentes , que son utilizados actualmente en algunas comunidades nacionales para iniciar transacciones de adeudo directo.

Métodos de firma

En España, la famosa sentencia del Tribunal Supremo de 3 de noviembre de 1997 establece que el requisito de la firma autógrafa puede ser sustituido, por el lado de la criptografía, por medio de cifras, claves y otros atributos alfanuméricos que permitan asegurar la procedencia y la veracidad de su autoría y la autenticidad de su contenido.

Más recientemente, en un Auto de 21 de marzo de 2013, el Tribunal Supremo ha aceptado como prueba los mensajes de correo electrónico certificados y de los SMS certificados. La validez probatoria de los SMS certificados ha sido reforzada desde la entrada en vigor de la exigencia de identificación en la contratación de una cuenta de telefonía móvil, incluidas las de prepago. El artículo 25 de la Ley de Servicios de la Sociedad de la Información, LSSI establece que las partes de un contrato pueden pactar la intervención de un tercero de confianza para que consigne la fecha y la participación de las partes y archive las declaraciones de voluntad. Se entiende que tiene que ser un tercero de confianza de las dos partes, es decir, aceptado libremente por ellas, ya que la imposición del tercero en una transacción de consumo podría llegar ser considerada como una cláusula abusiva.

La Ley de firma electrónica establece que la firma electrónica reconocida tendrá, respecto de los datos consignados de forma electrónica, el mismo valor que la firma manuscrita en relación con los consignados en papel. Pero también establece que no se negarán efectos jurídicos a una firma electrónica que no reúna los requisitos de firma electrónica reconocida en relación a los datos a los que está asociada por el mero hecho de presentarse de forma electrónica. Y añade que, cuando una firma electrónica se utilice conforme a las condiciones acordadas por las partes para relacionarse entre sí, se tendrá en cuenta lo estipulado entre ellas. Cabe decir en este punto que es altamente improbable que una empresa adopte la estrategia suicida de requerir el DNI electrónico para obtener los mandatos de sus clientes en la contratación de servicios recurrentes.

En el campo de la firma manuscrita en tableta ha habido importantes avances, al capturarse datos biométricos como, por ejemplo, el nivel de presión y la velocidad del trazo durante la ejecución de la firma. Los algoritmos aplicados a la autenticación en este formato de firma explotan el hecho de que el ser humano nunca firma exactamente igual, lo cual permite repudiar un documento que reproduzca la misma firma biométrica que otro anterior. Por otro lado, esta modalidad permite asegurar que el firmante estaba presente en el acto de la firma, algo que no es posible en otros sistemas de firma electrónica.

Otras modalidades de firma biométrica pueden ser, además de la firma dactilar, la firma vocal y la firma mediante vídeo, que algunas empresas están aplicando en ciertas modalidades de contratación, por ejemplo en ferias. Esta alternativa consistiría en aceptar el contrato leyendo el texto de aceptación en el que se reproducen los elementos clave del contrato mientras se graba la voz o la imagen y la voz del firmante y previa manifestación de consentimiento en relación al tratamiento de dichos datos. El fichero de audio o de vídeo quedaría unido al contrato con las correspondientes garantías técnicas de integridad. Hay que tener en cuenta, tanto en este punto como en los anteriores, las garantías adicionales que, en relación al consentimiento, exigirá la nueva Ley general para la defensa de los consumidores y usuarios en el caso de la contratación telefónica y online.

Posibles estrategias

Entre las estrategias que se han adoptado para la transición a SEPA de las domiciliaciones destacan las siguientes:

1. Asumir el riesgo de devolución, tras haber evaluado dicho riesgo y haber asignado una partida presupuestaria a las posibles devoluciones que puedan producirse.

2. Asumir el riesgo de rechazo de medios con los que el cliente no esté familiarizado, con el consiguiente descenso en las ventas al pedir el DNI electrónico o cualquier otro sistema de firma cualificada en la transacción y en la obtención del mandato.

3. Adaptarse a la oferta de las entidades financieras,  mediante la clave de firma de banca electrónica.

4. Utilizar los servicios de terceros de confianza en la obtención del mandato y sistemas de gestión y custodia de los mandatos aceptados, en conexión con el ERP corporativo.

5. Obtener el consentimiento online o por vía telefónica con la posterior verificación del consentimiento mediante alguna de las modalidades de firma comentadas  que ofrezca las garantías exigidas por la ley.

6. Analizar la viabilidad jurídica de diferentes modalidades de firma biométrica en la obtención del mandato. Especial atención merece la firma vocal ya que se puede realizar a distancia.

 

Posted in Contratación, Contratación a distancia, Firma, Firma electrónica avanzada, SEPA | Comments Off on Firma vocal de mandatos SEPA para adeudos por domiciliaciones

UNE 197001:2011 Criterios generales para la elaboración de informes y dictámenes periciales

La norma UNE 197001:2011 describe el índice para la realización de informes periciales.

La norma UNE 197001:2011 publicada en Marzo de 2011 tiene por objeto el establecimiento de las consideraciones generales que permitan precisar los requisitos formales que deben tener los informes y dictámenes periciales, sin determinar los métodos y procesos específicos para la elaboración de los mismos.

La adopción de la norma permite dar una estructura común a los informes periciales informáticas y destacar como profesionales cualificados a quienes la adoptan al mostrar que se preocupan por permanecer actualizados en su profesión. Es un compendio derivado de la experiencia en la realización de informes de profesionales experimentados.

La norma marca que el informe pericial contemple las siguientes generalidades:

  • Título: Identificando al documento de forma clara e inequívoca.
  • Documento:
    • Identificación y código numérico único, es decir, que un mismo perito no pueda repetir ese número para otra pericial.
    • Índice.
    • Cuerpo del informe.
    • Anexo (si se necesita)
  • Todas las páginas del documento deben de estar numeradas.

Respecto de la identificación se define expresamente que:

  • Es el elemento que contiene los datos para identificar el informe o dictamen pericial.
  • Su contenido debe:
    • Incluir el título y código único de referencia.
    • Identificar el destinatario del documento y número de expediente o procedimiento si lo hubiera.
    • Identificación del perito, incluyendo nombre y apellidos, DNI, colegio y/o asociación pericial a la que pertenece, dirección, …
    • Datos de la entidad o personas que han solicitado el informe pericial.
    • Dirección a donde va dirigido.
    • Si procede nombre y apellidos del letrado o procurador.
    • Fecha de emisión.

Respecto de las tachas o imparcialidad, se debe hacer constar la imparcialidad del perito o bien si está aplicando el sistema de tachas.

El siguiente punto habla del clásico juramento promesa reflejando claramente que el perito está procediendo bajo juramento o promesa de decir la verdad, actuando con veracidad y con la mayor objetividad posible, indicando el conocimiento de las sanciones penales de no actuar de forma debida.

Respecto del índice general:

  • Se explica que su objetivo es facilitar la búsqueda y localización de la información.
  • Se incluirán títulos y numeración de los puntos más relevantes del análisis pericial.

Sobre el cuerpo del informe:

  • Incluirá la caracterización de la información utilizada como punto de partida para el análisis.
  • Incluirá los resultados del estudio.
  • Debe de ser claramente comprensible, minimizando o explicando los tecnicismos. El juez, los abogados y otros profanos deben  entenderlo, de forma suficiente.
  • Contenido:
    • Objeto.  Es decir, finalidad del informe.
    • Alcance. Cuestiones que plantea el solicitante y son la base del estudio.
    • Antecedentes. Hechos desarrollados con anterioridad a la realización del informe pericial y que sirven de base para su realización.
    • Consideraciones preliminares. Todo lo que se consider básico para explicar los principios en los que se basa el estudio, bases teóricas de la tecnología utilizada, procedimientos etc. que dan la base para entender como se han extraído las evidencias y  se ha llegado a las conclusiones del informe.
    • Documentos de referencia. Todos los documentos que se citen y que sirvan de base para justificar el informe pericial, normas de obligado cumplimiento, buenas prácticas profesionales, etc.
    • Terminología y abreviaturas. Se incluirán definiciones, términos y abreviaturas que se usen posteriormente en el documento para explicar el estudio.
    • Análisis. Es decir, información que permite llegar a las conclusiones:
      • Legislación, reglamentación y normativa.
      • Investigación realizada.
      • Referencias, documentos y muestras de evidencias.
      • Razonamientos y justificaciones.
      • Conclusiones. Es decir, la finalidad máxima para la que se requiere el informe. Interpretación técnica y experta sobre los puntos incluidos en el apartado Alcance.
      • Anexos. Cualquier documento, nota, fotográfica, etc. que ayude a entender o reforzar el contenido del informe.
Posted in Informes periciales | Comments Off on UNE 197001:2011 Criterios generales para la elaboración de informes y dictámenes periciales

Acústica Forense

Cuando el objeto de investigación policial o judicial está relacionado con el sonido o sus elementos afines (grabaciones, equipos, sistemas, aplicaciones, etc.) los procedimientos de estudio se orientan hacia la denominada “Acústica Forense“.

La Acústica forense es uno de los más complejos entornos de investigación de la Policía Científica, debido al carácter multidisciplinar de sus distintas aproximaciones de análisis, y a la necesidad de formación continua y actualización en aspectos técnicos y científicos.

Es un campo en el que el dominio y utilización de tecnología y aplicaciones digitales de análisis, cálculo o procesado resulta imprescindible, y con frecuencia es necesaria la participación de un equipo de expertos especializados en distintas perspectivas de estudio.

Entre los objetivos de análisis cabe destacar los siguientes:

  1. Estudios sobre identificación de locutores.
  2. Estudios sobre manipulación de registros, procesado y edición de la señal de sonido.
  3. Estudios de perfilado de locutor. A partir de un registro de una o más conversaciones indubitadas se intentan determinar rasgos de identidad (edad, sexo, etc.), asociaciones diatópicas (área geográfica del hablante), diastráticas (estrato social), emocionales, conductuales, patológicas o toxicológicas.
  4. Identificación de fuentes de registro. Instrumental utilizado para la captación.
  5. Determinación de un locutor de entre varios posibles (Ruedas de reconocimiento de voz).
  6. Análisis y determinación de falsificaciones y pirateo de soportes magnéticos de audio, en colaboración con otras Unidades. (Documentoscopía, vídeo).
  7. Extracción de sonidos relevantes a partir de fondo de ruido (voz latente).
  8. Limpieza de ruidos para facilitar identificación de voz principal.
  9. Estudios de registros no vocales (sonidos, ruidos de fondo, etc.)
  10. Acústica de disparos. Determinación de tipo de arma utilizada, ambiente acústico de la escena del crimen, etc.

La estructura de la investigación de identificación de fonogramas verbales depende directamente de los métodos utilizados y de su correspondencia con el tipo de estructura de las conclusiones de los peritajes de acústica forense.

La descomposición de los sonidos complejos en sus componentes simples permite cotejar los principales parámetros de sonido. Con la comparación de dos o más audios que contengan emisiones de voz es posible determinar la pertenencia a un mismo locutor, o a locutores diferentes.

A la grabación obtenida de un hablante que se presenta o identifica plenamente se la denomina indubitada; al fonograma en relación al cual se define su similitud o diferencia se le llama grabación controvertida.

En condiciones psicofísicas normales, todo locutor dispondrá sus órganos de la fonación en función del tipo de emisión que desee generar, ejerciendo un absoluto y voluntario control sobre los mismos. Esta posibilidad de modificar la caja de resonancia a voluntad del sujeto emisor provocará el mayor problema con el que el examinador forense deberá enfrentarse: la variabilidad de los actos de habla, especialmente en sujetos no colaborativos.

En casos de hechos delictivos como las amenazas, la extorsión o el secuestro en los que se logra obtener un audio producto de la afectación o agresión hacia un ciudadano a través de un teléfono, grabación de vídeo y audio o registro  presencial, es posible analizar las características de las voces como la tonalidad, frecuencia, intensidad y los formantes mismos, los cuales permiten individualizar la voz hasta el punto de lograr identificar a un individuo.

 

Posted in Acústica forense, Evidencia de voz, Evidencias electrónicas, Identificación | Comments Off on Acústica Forense

Podría detectarse el autismo mediante la firma vocal del habla de los bebés

Noticia original: Autism Detected In Unique Vocal Signature Of Baby Talk

El uso de un nuevo tipo de tecnología de “firma vocal” que se centra en los patrones de sonido en lugar de la pronunciación de las palabras de un bebé permitiría detectar trastornos del espectro autista en fases tempranas.

El nuevo método mejorará en gran medida el estudio del desarrollo del lenguaje porque puede recopilar grabaciones de todo un día en los ambientes naturales de los niños y analizar automáticamente los patrones de sonido de forma considerablemente más barata y eficiente, respecto a los métodos más tradicionales que requieren la dedicación permanente del personal.

La investigación detrás de estos hallazgos fue dirigida por el Dr. D. Kimbrough Oller, profesor y presidente de la excelencia en audiología y patología del lenguaje y del habla en la Universidad de Memphis (Estados Unidos), y se puede leer un informe en línea publicados en los Proceedings of the National Academy of Sciences (Actas de la Academia Nacional de Ciencias) el 19 de julio de 2010.

Oller y sus colegas dijeron que LENA (Language Environment Analysis, Análisis de entorno del lenguaje) permitió una precisión del 86 por ciento para distinguir el autismo en niños muy jóvenes. Según indicaron, el sistema también es capaz de distinguir entre los niños con un desarrollo normal, los niños con autismo y niños con retraso en el lenguaje.

LENA se basa en la nueva tecnología “análisis acústico automático” para permitir “el análisis estadístico a gran escala de una de parámetros acústicos estratégicamente seleccionados“ en las grabaciones de sonido.

En este estudio, Oller y sus colegas utilizaron LENA analizar grabaciones realizadas por 232 niños a lo largo de 1.486 días (lo que asciende a más de 3.000.000 expresiones identificadas automáticamente).

LENA es esencialmente un procesador de lenguaje complementado con software de análisis. En el corazón del software reside un algoritmo que Oller y sus colegas han desarrollado, que reconoce 12 Parámetros acústicos o patrones de sonido distintos asociados con el desarrollo vocal.

El procesador se inserta en un bolsillo especialmente destinado a ello de la ropa de los niños y registra todo el día lo que el niño dice y los sonidos que hace, y distingue de forma fiable vocalizaciones (es decir, cuando los niños hablan o intentan hablar) de gritos, llantos, otras voces y de ruido de fondo.

Los niños participantes procedían de familias cuyos padres respondieron a un anuncio solicitando voluntarios que participan en el estudio. Cuando se inscribieron, los padres indicaron si sus hijos habían sido diagnosticados con autismo o retraso en el lenguaje. El proyecto también ofreció a los padres de niños con retraso del lenguaje o autismo evaluaciones médicas independientes de habla y lenguaje que no estaban vinculadas a la investigación; los padres enviaron estos informes médicos a los investigadores.

Las grabaciones de la actividad de los niños a lo largo del día se inició en 2006 y se llevó a cabo en ambientes domésticos naturales cuando los padres enciendían los grabadores que ya estaban en los bolsillos hechos para este fin en la ropa de los niños.

Oller y sus colegas encontraron que los más importantes de los 12 parámetros acústicos resultaron ser los que dirigen la capacidad de los niños para producir sílabas bien formadas (silabeo), moviendo la mandíbula y la lengua rápidamente durante la vocalización. Los bebés empiezan a hacer esto cuando tienen pocos meses de edad, y mejoran la habilidad a medida que crecen y aprenden a hablar.

Los investigadores encontraron que las muestras de sonido de los niños autistas mostraron poca evidencia de desarrollo de silabeo, porque los parámetros acústicos relevantes no cambiaron tanto como se espera cuando los niños crecen (de 1 año a 4 años). Esto se compara con el desarrollo estadísticamente significativo con la edad de los 12 parámetros, tanto para niños con un desarrollo normal y aquellos con retrasos en el lenguaje.

Oller y sus colegas concluyeron que se trataba de una prueba de concepto de que un método como LENA que utiliza el análisis automático de gran cantidad de muestras de grabaciones de vocalización pueden hacer una valiosa contribución al campo de la investigación para el desarrollo vocal.

Los científicos han estado estudiando la presencia y ausencia de aberraciones del habla en niños con trastornos del espectro autista durante más de 20 años, pero hasta la fecha, los criterios estándar para su diagnóstico han excluido las características vocales, dijo el co-autor del estudio el Dr. Steven F. Warren, profesor de  Ciencia de Comportamiento Aplicada y vicerrector de investigación de la Universidad de Kansas.

Entre los primeros científicos en ver el potencial de un método como LENA en la detección de autismo, Warren dijo a la prensa que: “Un pequeño número de estudios habían sugerido previamente que los niños con autismo tienen una firma vocal muy diferente, pero hasta ahora, no ha sido posible desarrollar este conocimiento en aplicaciones clínicas por la falta de tecnología de medición“.

En su información complementaria, Warren, Oller y sus colegas describen el procedimiento tradicional y laborioso con que los científicos estudian el desarrollo vocal y su papel en el lenguaje, y lo compararon con el proceso automático, rápido de un sistema como LENA. En el método tradicional, personal de transcripción y analistas miden y codifican pequeñas muestras registradas, mientras que LENA es completamente automatizado “sin requerir intervención humana”, según indican, “permitiendo un muestreo eficiente y un análisis a un nivel de escala sin precedentes”.

Warren dijo que una herramienta como LENA, que recoge y analiza cantidades inimaginables de datos de forma relativamente barata, tendrá un enorme impacto en los campos de la investigación del lenguaje y en las ciencias del comportamiento, y también en áreas como la detección, evaluación y tratamiento del autismo.

También, como consecuencia de que la tecnología se basa en análisis de patrones de sonido y no en palabras, en teoría, podría detectar el autismo en cualquier hablante independientemente del idioma que hable.

“Por lo que sabemos, la física del habla humana es la misma en todas las personas ”, dijo Warren.

Actualmente en los EE.UU., la edad media de diagnóstico de trastorno del espectro autista (TEA) en inglés “autism spectrum disorder (ASD)” en niños, es de 5,7 años y con este tipo de tecnología podría reducirse a 18 meses, sugirió Warren.

“Esta tecnología podría ayudar a los pediatras a detectar de forma temprana un TEA en niños para determinar si se requiere su remisión a un especialista para un diagnóstico completo y conseguir que esos niños puedan recibir tratamientos con más antelación y efectividad“, agregó.

LENA también podría ser utilizado como una forma de ayudar a los padres para complementar la terapia de mejora del lenguaje en el hogar, dijo Warren. Por ejemplo, podrían utilizarlo para evaluar por sí mismos cómo de efectiva era su intervención, explicó.

Título de la contribución científica: “Análisis vocal automático de grabaciones naturalistas de niños con autismo, con retraso en el lenguaje, y con desarrollo típico“.

“Automated vocal analysis of naturalistic recordings from children with autism, language delay, and typical development.”
D. K. Oller, P. Niyogi, S. Gray, J. A. Richards, J. Gilkerson, D. Xu, U. Yapanel, and S. F. Warren.
Proceedings of the National Academy of Sciences, Published online before print 19 July 2010.
DOI: 10.1073/pnas.1003882107

Additional source: Univesrity of Kansas.

Posted in Aspectos médicos | Comments Off on Podría detectarse el autismo mediante la firma vocal del habla de los bebés