NEKTIU

La Magia de la inteligencia artificial

Las experiencias de voz están cambiando radicalmente la forma en que interactuamos con la tecnología, como es la innovación , que hace dos años Google lanzo al mercado. El un nuevo sistema Google Duplex, , basado en Inteligencia Artificial, creando nuevas experiencias de voz al ayudar a realizar tareas por teléfono (por ejemplo, programar una cita, hacer una reserva, etc.). 

Con este nuevo avance nos hace la vida más fácil y permite eliminar muchas de las tareas que pueden requerir de una tediosa llamada telefónica a una empresa o enviar un  mensaje de  texto. Aquí es donde entra Duplex, nos ayuda a gestionar muchas de estas tareas de forma sencilla. 

¿Qué hay detrás de esta idea? ¿Cómo lo hace Duplex?. Este servicio está integrado con el Asistente de Google, solamente tenemos que pedirle mediante la voz, por ejemplo, que haga una reserva en un determinado restaurante e introducir algunos parámetros como el número de personas, la fecha y la hora, y un nombre para poner la reserva. Una vez hecho esto, el Asistente de Google utilizará automáticamente Duplex para hacer una llamada telefónica a ese restaurante y reservar por ti, enviando una confirmación una vez hecho esto. Duplex intentará hacer esto imitando a un humano para que la conversación telefónica sea natural (y no alarmar a la persona al otro lado).

Este es el gran éxito de Duplex, su conversación que realiza en las llamadas telefónicas puede imitar a un humano, sus voces son como personas reales, inclusive añade interjecciones como “um” para que parezca más humano. Duplex también reproduce muy fielmente las cadencias de las conversaciones , como puede ser la latencia en las respuestas. Por ejemplo, si la persona dice “¿hola?”, tiene que responder rápidamente, pero si dice una frase muy larga, tiene que tomarse un tiempo antes de responder para imitar el tiempo de reflexión.  Google ha conseguido con Duplex un sistema muy avanzado, aunque en algunos momentos realiza alguna inflexión poco natural y robótica, pero son lo suficientemente pequeños como para que nadie al otro lado del teléfono piense mucho en ello, si es que lo notan.

Aunque Duplex en las tareas básicas es muy preciso, también necesita de algunas mejoras, como gestionar fácilmente algunas declaraciones complejas o problemas con el ruido de fondo o la calidad del sonido. Para estas situaciones que no pueda completar su tarea, Google Duplex ha incorporado un mecanismo de seguridad para que un operador humano complete la tarea.

La tecnología que usa Duplex está basada en el Procesamiento del Lenguaje Natural. Para ello, se necesita un traductor de voz a texto preciso para poder entender lo que dice la persona al teléfono. A continuación, otro modelo tiene que interprete en el contexto del objetivo de la llamada telefónica. Y luego hay que crear una respuesta adecuada. Finalmente, un modelo de conversión de texto a voz tiene que traducir esta respuesta en una voz similar a la humana que la diga por teléfono. Estos pasos deben repetirse constantemente a lo largo de la llamada telefónica en tiempo real, por lo que los modelos deben ser precisos y rápidos.

Google Duplex utiliza una red neuronal recurrente combinada con la tecnología de reconocimiento automático del habla (ASR) de Google, los parámetros de la conversación (por ejemplo, la hora deseada, los nombres) y un sistema de conversión de texto a voz (TTS).

Podemos decir que esta innovación de Google es un avance que sin duda de una forma mecánica cambiará la interacción entre las empresas y sus clientes.

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on whatsapp
WhatsApp