Este martes 22 de agosto, Mark Zuckerberg, CEO de Meta, dio a conocer el próximo lanzamiento de un innovador traductor basado en inteligencia artificial, SeamlessM4T. Esta herramienta revolucionaria tiene la capacidad de trabajar con más de 100 idiomas, permitiendo la traducción y la transformación en audio y transcripción.
Meta pronunció que SeamlessM4T estará disponible en código abierto, junto con SeamlessAlign, un nuevo conjunto de datos de traducción. La empresa destaca que este nuevo traductor representa un avance significativo en el campo de la conversión de voz a voz y voz a texto impulsadas por la inteligencia artificial.
Este modelo único de traducción proporciona resultados bajo demanda, lo que permite a personas que hablan diferentes idiomas comunicarse de manera efectiva. Una característica destacada de SeamlessM4T es que reconoce implícitamente los idiomas de origen sin la necesidad de un modelo de identificación de idiomas separado.
La base de SeamlessM4T es Massively Multilingual Speech, un marco desarrollado por Meta que ofrece tecnología de reconocimiento de voz, identificación de idiomas y síntesis de voz en más de 1,100 idiomas. La creación de este traductor involucró la alineación de 443,000 horas de habla con textos, generando 29,000 horas de alineaciones de «voz a voz». Esto permitió al sistema aprender a transcribir voz a texto, traducir texto y generar voz a partir de texto, incluso traduciendo palabras habladas en un idioma a palabras en otro idioma.
El CEO Mark Zuckerberg expresó su entusiasmo por este proyecto y cómo planea integrar esta tecnología en los principales servicios de Meta. «Con el tiempo, integraremos estos avances de traducción y transcripción a través de inteligencia artificial en Facebook, Instagram, WhatsApp, Messenger y Threads«, señaló.
SeamlessM4T no solo facilitará la traducción entre idiomas, sino que también se enfoca en aspectos como el reconocimiento de «code switching» y la detección de palabras tóxicas y de odio. Además, tiene la capacidad de cuantificar el sesgo de género y adaptarse a la variante de pronombres en más de 100 idiomas.
El lanzamiento de SeamlessM4T se enfoca en los desarrolladores, permitiéndoles colaborar con Meta para mejorar el modelo antes de su lanzamiento para el público en general.