Published by Jorge Herrero Vicario
Posted on 13 de enero de 2017
Fue en el año 1993. En aquel momento estaba estudiando Ingeniería Informática y fui a un congreso nacional de la Sociedad Brasileña de Informática en Rio Grande do Sul. Pero antes pasé por Porto Alegre, ya que mi orientador de iniciación científica quería que visitara al grupo de investigación de redes neuronales en la UFRGS porque íbamos a cooperar con ellos. El día que quedamos, uno de los alumnos del Máster hizo la primera demo que había visto en mi vida de un sistema de reconocimiento de voz, desarrollado utilizando redes neuronales y transformadas de Fourier. Era un prototipo muy sencillo que reconocía los números del 0 al 9. Aun así, me impresionó: salí de allí convencido que en el futuro todo el planeta hablaría con ordenadores.
24 años después, parece que ya estamos preparados para actualizar la relación entre humanos y máquinas. En YouTube cientos de vídeos muestran a niños y niñas interactuando con Amazon Echo, la casa de la simpática Alexa, no siempre con resultados precisos, pero sí graciosos. El ProductHunt ha cambiado su nombre, tal vez temporalmente, por AlexaHunt, y los Google Home hablando en loop es ya un clásico. Aún sin voz, aunque sospecho que será por poco tiempo, los Bots de Facebook hablan con miles de personas todos los días. Incluso nosotros en E.life ya hemos desarrollado más de 20 Bots para marcas como Dotz o Cacau Show.
El tema está tan de actualidad que fue portada de la influyente revista británica The Economist, que afirma entre otras cosas, que la tecnología de voz y sus productos van a ser aún más revolucionarios que las pantallas sensibles popularizadas por iPhone.
Bots como Plataforma
Tal y como hizo Apple con el iPhone, empresas como Google, Amazon y Microsoft han desarrollado en los últimos años componentes que conforman una plataforma completa para que cualquier empresa pueda lanzar sus propios productos utilizando la tecnología de voz. Estas plataformas poseen recursos para entender y reaccionar a comandos de voz y permiten a cualquier desarrollador crear “apps” que utilicen estos recursos. Por ejemplo, Deutsche Bahn (compañía ferroviaria alemana) desarrolló en noviembre para Alexa un servicio que informa de todos los horarios de trenes (por ahora solamente está disponible en alemán). Solo tienes que decir “Alexa, pregunta a Deutsche Bahn los horarios de tren para mañana por la mañana de Frankfurt a París”, y Alexa proporciona la información solicitada.
En principio estas plataformas están disponibles a nivel global (aunque Amazon Echo y Google Home todavía no se han lanzado oficialmente en Brasil), y cualquier empresa puede empezar a desarrollar sus Bots de voz usando una o más plataformas. Imagino que en un futuro próximo cualquier diálogo entre consumidores y máquinas será posible:
OK Google, haz la compra en el supermercado.
Alexa, transfiere 100€ a la cuenta de mi hijo.
Alexa, ¿hay alguna promoción de vaqueros en mi tienda favorita?
Alexa y Google Home van a tener mucha repercusión este año. En E.life ya estamos estudiando combinar opciones de varias plataformas: por ejemplo, usar el recurso de reconocimiento de voz de Google en un Bot para Facebook. ¡Las posibilidades serán increíbles!
¿Quieres embarcarte en esta revolución? Estamos aquí para ayudarte.