C-3PO sigue siendo el mejor traductor de idiomas en pantalla. Apropiadamente,
la tecnología de traducción de idiomas de vanguardia está comenzando a sonar más como ciencia ficción en estos días. Con suerte, la frase “Estamos condenados” no es lo primero que se te viene a la cabeza cuando reflexionas sobre este hecho. Para que te sientas mejor con respecto a la IA, examinamos algo muy bueno. Translatotron de Google es un traductor de idiomas que le permitirá no solo hablar en un idioma diferente, sino que también usará su voz para hacerlo. Siga leyendo para ver cómo vamos más allá de la traducción de Google tal como la conoce.
Google es conocido por muchas cosas. Proporciona al mundo una variedad de productos y servicios. Uno popular es Google Translate, donde traducirá el texto de un idioma a otro. Debido a su precisión y velocidad, domina el mercado. Ahora Google quiere convertir su discurso en vivo a otro idioma pero usando su propia voz.
PRIMERA VUELTA
Los sistemas de traducción de voz a voz se han desarrollado en las últimas décadas para ayudar a las personas que hablan diferentes idiomas a comunicarse entre sí. Tales sistemas generalmente se han dividido en tres componentes separados: reconocimiento automático de voz para copiar la voz de origen como texto, traducción automática para traducir el texto transcrito al idioma de destino y síntesis de texto a voz (TTS) para generar voz en el destino idioma del texto traducido. Dividir la tarea en una cascada de sistemas de este tipo ha sido muy exitoso. Este enfoque en cascada está impulsando muchos productos comerciales de traducción de voz a voz, incluido Google Translate.
En “Traducción directa de voz a voz con un modelo de secuencia a secuencia”, Google propuso un nuevo sistema experimental. Este es el primer “giro” que una persona necesita comprender para considerar los saltos increíbles que Google está haciendo en la traducción de idiomas. Considere que su grupo de inteligencia artificial ha proporcionado la base para pasar de un archivo de audio de voz directamente a un archivo de audio de voz en otro idioma. Este es un modelo de traducción innovador que funciona sin depender de la representación de texto intermedio.
SEGUNDA VUELTA
El Translatotron va un paso más allá. Este sistema de traducción evita dividir la tarea en etapas separadas, proporcionando así algunas ventajas sobre los sistemas en cascada. Estos incluyen una velocidad de inferencia más rápida, evitando naturalmente errores compuestos entre el reconocimiento y la traducción. El desarrollo inesperado hace que sea sencillo retener la voz del hablante original después de la traducción. Además, todas las palabras que no necesitan traducción se manejan más rápido.
INMUTANDO TU VOZ
Al incorporar una red de codificador de altavoz, Translatotron también puede retener las características vocales del hablante original en el discurso traducido. Esta mejora hace que el discurso traducido suene más natural y menos discordante. De hecho, es una función que aprovecha la investigación previa de Google sobre verificación de voz. Mediante el uso de algoritmos de red neuronal de inteligencia artificial, el sistema ofrece voz traducida en el idioma de destino, incluso con la misma voz que el fragmento de sonido original. En otras palabras, el usuario simplemente habla, y el asistente de voz traduce su discurso al idioma deseado mientras mantiene la entonación, el timbre y el tono.
EL EFECTO WOW
Google va más allá de la traducción de idiomas, como lo sabes. Ahora ha ideado el mecanismo para traducir automáticamente y realizar una traducción de voz a voz, con resultados muy precisos. A lo largo del proceso, Google Artificial Intelligence utiliza la multitarea para predecir las tendencias de la fuente al generar espectrogramas de traducción. Si bien aún necesitan pulirse, su objetivo es reproducir la expresión única de una persona. El factor sorpresa ya está ahí, pero solo crecerá cuando puedan lograr de manera consistente la preservación de la voz original en una variedad de canales comerciales
Hable con experto de innovación
Discuta sus ideas, preguntas e inquietudes. Obtenga respuestas específicas a sus necesidades.