fbpx
Get In Touch
1201 3rd Avenue Seattle, WA 98101, US
(HQ) Av. Punto Sur 31, Tlajomulco de Zúñiga, Jal 45050, MX
Carrera 11B # 99 - 25, Btá, 110221, CO
Let's talk
hello@inmediatum.com
Ph: +1 (650) 603 0883
Sales attention M - F 9am - 5pm (CT)
Get support
Careers
Endless inspiration and meaningful work
See open positions
Back

Más allá de la traducción de Google como la conoces

C-3PO sigue siendo el mejor traductor de idiomas en pantalla. Apropiadamente,
la tecnología de traducción de idiomas de vanguardia está comenzando a sonar más como ciencia ficción en estos días. Con suerte, la frase “Estamos condenados” no es lo primero que se te viene a la cabeza cuando reflexionas sobre este hecho. Para que te sientas mejor con respecto a la IA, examinamos algo muy bueno. Translatotron de Google es un traductor de idiomas que le permitirá no solo hablar en un idioma diferente, sino que también usará su voz para hacerlo. Siga leyendo para ver cómo vamos más allá de la traducción de Google tal como la conoce.

Google es conocido por muchas cosas. Proporciona al mundo una variedad de productos y servicios. Uno popular es Google Translate, donde traducirá el texto de un idioma a otro. Debido a su precisión y velocidad, domina el mercado. Ahora Google quiere convertir su discurso en vivo a otro idioma pero usando su propia voz.

PRIMERA VUELTA

Los sistemas de traducción de voz a voz se han desarrollado en las últimas décadas para ayudar a las personas que hablan diferentes idiomas a comunicarse entre sí. Tales sistemas generalmente se han dividido en tres componentes separados: reconocimiento automático de voz para copiar la voz de origen como texto, traducción automática para traducir el texto transcrito al idioma de destino y síntesis de texto a voz (TTS) para generar voz en el destino idioma del texto traducido. Dividir la tarea en una cascada de sistemas de este tipo ha sido muy exitoso. Este enfoque en cascada está impulsando muchos productos comerciales de traducción de voz a voz, incluido Google Translate.

En “Traducción directa de voz a voz con un modelo de secuencia a secuencia”, Google propuso un nuevo sistema experimental. Este es el primer “giro” que una persona necesita comprender para considerar los saltos increíbles que Google está haciendo en la traducción de idiomas. Considere que su grupo de inteligencia artificial ha proporcionado la base para pasar de un archivo de audio de voz directamente a un archivo de audio de voz en otro idioma. Este es un modelo de traducción innovador que funciona sin depender de la representación de texto intermedio.

SEGUNDA VUELTA

El Translatotron va un paso más allá. Este sistema de traducción evita dividir la tarea en etapas separadas, proporcionando así algunas ventajas sobre los sistemas en cascada. Estos incluyen una velocidad de inferencia más rápida, evitando naturalmente errores compuestos entre el reconocimiento y la traducción. El desarrollo inesperado hace que sea sencillo retener la voz del hablante original después de la traducción. Además, todas las palabras que no necesitan traducción se manejan más rápido.

INMUTANDO TU VOZ

Al incorporar una red de codificador de altavoz, Translatotron también puede retener las características vocales del hablante original en el discurso traducido. Esta mejora hace que el discurso traducido suene más natural y menos discordante. De hecho, es una función que aprovecha la investigación previa de Google sobre verificación de voz. Mediante el uso de algoritmos de red neuronal de inteligencia artificial, el sistema ofrece voz traducida en el idioma de destino, incluso con la misma voz que el fragmento de sonido original. En otras palabras, el usuario simplemente habla, y el asistente de voz traduce su discurso al idioma deseado mientras mantiene la entonación, el timbre y el tono.

EL EFECTO WOW

Google va más allá de la traducción de idiomas, como lo sabes. Ahora ha ideado el mecanismo para traducir automáticamente y realizar una traducción de voz a voz, con resultados muy precisos. A lo largo del proceso, Google Artificial Intelligence utiliza la multitarea para predecir las tendencias de la fuente al generar espectrogramas de traducción. Si bien aún necesitan pulirse, su objetivo es reproducir la expresión única de una persona. El factor sorpresa ya está ahí, pero solo crecerá cuando puedan lograr de manera consistente la preservación de la voz original en una variedad de canales comerciales

Hable con experto de innovación

Discuta sus ideas, preguntas e inquietudes. Obtenga respuestas específicas a sus necesidades.

[pofo_popup pofo_popup_type=”popup-form-1″ pofo_popup_preview_image=”popup-form-1″ pofo_contact_forms_shortcode=”22152″ pofo_popup_form_id=”1551116660″ pofo_popup_button_title=”Agenda una llamada” pofo_button_bg_color=”#eeee22″ pofo_button_text_color=”#000000″ pofo_button_hover_text_color=”#000000″ pofo_button_hover_bg_color=”#ffffff”][/pofo_popup]
Carla Serrato
Carla Serrato
Especialista en ciencias sociales y de comportamiento. Carla no solo asesora a nuestro departamento de UX en INMEDIATUM sino que su investigación permite optimizar nuestros algoritmos de inteligencia artificial como para la prevención de riesgo crediticio, genera mejor adherencia a tratamientos médicos, reconocimiento facial para identificar rasgos de la personalidad entre otros.

We use cookies to give you the best experience. Cookie Policy