Centre d’innovació i Tecnologia BARCELONATECH

TALP UPC

Tecnologías y Aplicaciones del Lenguaje y del Habla

El Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla, está especializado en el procesamiento automático del lenguaje natural, tanto oral como escrito, con el objetivo de vencer las barreras lingüísticas, facilitando la interacción entre personas, entre personas y dispositivos, y la accesibilidad a la información multilingüe.

TALP UPC se constituyó en 1998, está formado por un equipo de 50 personas y es miembro del Clúster Catalán de las Industrias de la Lengua(CLUSTERLINGUA).

El Centro trabaja en las siguientes ámbitos de I+D:

Síntesis de voz

Conversión de un texto en voz, generando una prosodia inteligible y natural, y adecuada a cada aplicación.

Sistemas de diálogo hombre- máquina

Sistemas capaces de conversar con un humano manteniendo estructuras coherentes, con una finalidad determinada (proporcionar la información requerida, efectuar una venta o un pedido…)

Traducción automática

Traducción de texto o voz de una lengua a otra, posibilitando el acceso a la información multilingüe, subtitulación automática de medios audiovisuales...

Reconocimiento automático del habla

Transformar la voz en texto, posibilitando que las máquinas entiendan lo que una persona dice y que pueda interpretar las órdenes orales.

Minería de textos

Explotación del conocimiento contenido en textos, con finalidades diversas: Recuperación de la información; extracción de información (dotar de estructura el conocimiento no estructurado contenido en los textos, extraer hechos, acontecimientos, o características relevantes descritas en el texto); Resumen automático (resumir uno o más documentos para facilitar su comprensión y el acceso); respuesta a preguntas (Question Answering: encontrar la respuesta a una pregunta concreta en una colección de documentos).

Reconocimiento de voz y audio

Identificar una persona a partir de las características de la voz (biometría); identificar la lengua o dialecto que se habla, detectar el estado emocional del hablante; distinguir si el audio corresponde a habla, música, aplausos, ruido ambiental , o un otro tipo de sonido; filtrar señales acústicas relevantes en entornos ruidosos.

Procesadores lingüísticos

Análisis lingüístico de textos, como paso previo para cualquier aplicación que requiera un cierto grado de comprensión de la lengua. Análisis morfológico; desambiguación morfo- sintáctica; detección de grupos y sintagmas; construcción de un árbol sintáctico, análisis semántico (desambiguación de sentidos, de roles, de la correferencia…).

TALP UPC es uno de los principales contribuidores al clúster de computación del departamento de Lenguajes y Sistemas Informáticos (LSI) de la UPC . Desde 2004 cuenta con una sala inteligente que permite estudiar el habla en un contexto más natural. También cuenta con el laboratorio multimedia del departamento de Teoría de la Señal y Comunicaciones (TSC) , con las prestaciones de un estudio de grabación de audio y TV.

La tecnología de TALP ha generado dos spin- off: Verbio Technologies (creada en 1999) y HERTASECURITY en 2009).


Los sectores donde tienen aplicación estas tecnologías son, entre otros:

Medios de comunicación escritos o habladosAglomeración de opiniones online y recomendación de contenidos o productosAnálisis de reputación onlineAsistentes virtuales (aprendizaje de lenguas, compra online, sector automovilístico, médico, turístico…) Asistencia a discapacitados con problemas cognitivos, de habla o de audición Minería de texto en diferentes dominios (médico, financiero… ) Servicios de asistencia a la traducciónAtención al clienteCall - centersSeguridad y monitorización acústicaIndustria del entretenimiento: doblaje de películas, subtitulación...

http://www.talp.upc.edu/ | info.cit@upc.edu | +34 93 405 46 90 | +34 93 405 44 19

  • ASIYA

    Aplicación de código abierto, con diferentes métricas para la evaluación de similitud entre textos. Puede aplicarse para evaluar traducciones automáticas, para la agrupación de documentos, o en cualquier otro caso que requiera medidas de similitud entre documentos.

    Demo

  • Tecnología para la traducción de patentes

    El Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP UPC) ha colaborado en el desarrollo de un conjunto de herramientas para la traducción de textos entre varios idiomas, en tiempo real y de alta calidad. A partir de la hibridación entre gramáticas sintáctico-semánticas y traductores estadísticos, TALP UPC ha creado una herramienta que permite la traducción automática de patentes en tres idiomas (inglés, francés y alemán). Esta tecnología se ha desarrollado en el marco del proyecto europeo MOLTO.

  • Nuevo observatorio digital

    Investigadores del Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP UPC) ha participado en un proyecto piloto con el Centro Nacional de Referencia de Aplicación de las Tecnologías de Información y la Comunicación (CENATIC) y la Secretaría de Estado de Telecomunicaciones y para la Sociedad de la Información (SETSI) del Ministerio de Industria Energía y Turismo, dentro del marco del proyecto "Innovation Support Platform" que estos organismos están desarrollando. El objetivo de la plataforma es permitir a estas instituciones captar el pulso de diferentes sectores industriales, centrándose en el sector TIC en el presente proyecto piloto. Para ello, se monitorizan de forma automática miles de documentos relacionados con el sector (patentes, concursos, convocatorias, contratos...), creando un observatorio digital de la actividad de las empresas, que permita detectar nuevos productos e iniciativas innovadoras. TALP UPC ha adaptado sus herramientas de análisis textual para estructurar la información de los textos a analizar, posibilitando así su proceso mediante motores de clasificación de documentos o de data mining.

  • Sintetizador de voz para pacientes con disartria