Hace tiempo que Microsoft, desde su división de Investigación Microsoft Research, ya nos enseñó avances en el mundo de la traducción, con Cortana (el Siri de Microsoft) y con mejoras en el aspecto más peculiar de la traducción: la gramática.
En la pasada Code Conference, y a través del CEO de Microsoft, Satya Nadella, se presentó el siguiente gran avance de este campo: un sistema de traducción inteligente que procesa y traduce las conversaciones al idioma de cada participante en una conversación en directo.
Para poder realizarlo, se apoya en un sistema integrado por tres herramientas principales:
- Un sistema de reconocimiento de voz. Se encarga de captar la conversación de uno de los participantes y convertirla en texto.
- Un traductor. Traduce el texto convertido por el reconocimiento de voz.
- Un sintetizador de voz, o Text-To-Speech. Que convierte de nuevo el texto traducido en voz sintética.
El resultado es que los participantes escuchan la voz del otro participante a un volumen más bajo y, después, la traducción a un volumen mayor. Como podéis apreciar no es el Traductor Universal de Star Trek, pero es un paso muy grande en esa dirección.
Es más, según el propio Nadella, con este movimiento, se pretende conseguir una tecnología más humana, que sea capaz de entendernos.
Aunque en el evento se pudo ver una conferencia en tiempo real y al sistema de traducción realizando una magnífica labor, el producto se encuentra en su etapa inicial de desarrollo, por lo que todavía nos queda un tiempo antes de poder disfrutarla. Según algunas fuentes no oficiales, se espera tener el producto listo a finales de este año, pero habrá que ver si lo integran en la versión gratuita o, por el contrario, lo incluyen sólo en las versiones profesionales.
Aquí podéis ver cómo funciona en un vídeo de Microsoft Research:
Y aquí la noticia en el blog de Microsoft, junto con el video de la presentación.