Tabla de contenido:
- ¿Qué es Google Duplex?
- ¿No es esto simplemente como voz a texto?
- ¿Cómo funciona Duplex?
- ¿Qué pasa con la seguridad y la privacidad?
- ¿Cuándo tendré Duplex en mi teléfono?
- ¿Dónde puedo aprender más?
En Google I / O 2018 vimos una demostración de la última novedad de Google, Duplex. La pantalla de 60 pies en el escenario mostró lo que se parece a su aplicación Google Assistant con una reproducción línea por línea de Assistant haciendo una llamada telefónica a un peluquero y programando una cita, completa con las pausas, los ummms y ahhhs, y el resto de las idiosincrasias que acompañan al habla humana. La persona que asistió a la cita no parecía saber que estaba hablando con una computadora porque no sonaba como una computadora. Ni siquiera un poquito.
Ese tipo de demostración se ve increíble (y tal vez un poco espeluznante), pero ¿qué pasa con los detalles? ¿Qué es exactamente Duplex? ¿Cómo funciona? Todos tenemos preguntas cuando vemos algo tan diferente y encontrar respuestas repartidas por Internet es un dolor. Repasemos lo que sabemos hasta ahora sobre Google Duplex.
¿Qué es Google Duplex?
Es una nueva herramienta de Google que tiene como objetivo utilizar la inteligencia artificial (IA) para "realizar tareas del mundo real por teléfono", según los investigadores y desarrolladores de IA de Google. Por ahora, eso significa tareas muy específicas, como concertar citas, pero la tecnología se está desarrollando teniendo en cuenta la expansión a otras áreas. Gastar miles de millones para crear una forma genial de hacer reservas para cenar suena como algo que Google haría, pero no es un gran uso de tiempo o dinero.
Duplex también es más de lo que vimos en una demostración y si alguna vez sale del laboratorio será mucho más de lo que vemos o escuchamos de nuestro lado. Hay enormes bancos de datos y las computadoras para procesarlos involucrados que no son tan geniales como el resultado final. Pero son esenciales porque hacer que una computadora hable y piense, en tiempo real, como si una persona fuera difícil.
¿No es esto simplemente como voz a texto?
No Ni siquiera cerca. Y es por eso que es un gran problema.
Duplex está diseñado para cambiar la forma en que una computadora "habla" por teléfono.
El objetivo de Duplex es hacer que las cosas suenen naturales y que el Asistente piense sobre la marcha para encontrar una hora de cita que funcione. Si Joe dice: "Sí, sobre eso, no tengo nada abierto hasta las 10, ¿está bien?" El asistente debe comprender lo que Joe está diciendo, descubrir qué significa eso y pensar si lo que está ofreciendo Joe funcionará para usted. Si está ocupado al otro lado de la ciudad a las 10 y tomará 40 minutos conducir hasta el garaje de Joe, el Asistente debe ser capaz de resolver eso y decir que las 11:15 sería bueno.
Igualmente importante para Google es que Duplex responde y suena como una persona. Google ha dicho que quería que la persona en el teléfono no supiera que estaban hablando con una computadora, aunque finalmente decidió que sería mejor informarles. Cuando hablamos con la gente, hablamos más rápido y menos formal (léase: balbuceo incoherente desde el punto de vista de una computadora) que cuando estamos hablando con el Asistente en nuestro teléfono o la computadora en el DMV cuando llamamos. Duplex necesita entender esto y recrearlo al responder.
Finalmente, y lo más impresionante, es que Duplex tiene que entender el contexto. Viernes, próximo viernes y viernes después de la próxima semana son términos que usted y yo entendemos. Duplex también necesita entenderlos. Si hablamos de la misma manera que escribimos esto no sería un problema, pero umm, ya sabes, no suena porque suena tan sofocante, sí, no es tan confuso, aunque lo hemos escuchado toda nuestra vida y estamos acostumbrados. no, no tenemos problemas, sabes entenderlo o nada de eso.
Administraré primeros auxilios a mi editor después de escribir eso mientras lo dices en voz alta, para que veas lo que esto significa.
¿Cómo funciona Duplex?
Desde el punto de vista del usuario, es tan simple como decirle al Asistente que haga algo. Por ahora, como se mencionó, ese algo se limita a hacer citas, por lo que diríamos: "Oye, Google, hazme una cita para un cambio de aceite en Joe's Garage para el martes por la mañana" y (después de que nos recordara que dijéramos por favor) llamaría instale Joe's Garage y configure las cosas, luego agréguelas a su calendario.
Las conversaciones continuas utilizan gran parte de la misma tecnología subyacente que Duplex.Bastante ingenioso Pero lo que sucede fuera de cámara es aún más nift.
Duplex está utilizando lo que se llama una red neuronal recurrente. Está construido con la tecnología TensorFlow Extended de Google. Google capacitó a la red en todos esos correos de voz anónimos y conversaciones de Google Voice que acordó dejar que escuchara si optaba por una combinación de software de reconocimiento de voz y la capacidad de considerar el historial de la conversación y detalles como la hora del día y la ubicación de ambas partes.
Esencialmente, una red completa de computadoras de alta potencia está procesando datos en la nube y hablando a través de Assistant en su teléfono u otro producto que tiene Assistant a bordo.
¿Qué pasa con la seguridad y la privacidad?
Todo se reduce a una cosa simple: ¿confías en Google? La inteligencia de la máquina en el dispositivo es algo real, aunque es limitada y relativamente nueva. Google ha desarrollado ML Kit para ayudar a los desarrolladores a hacer más de este tipo de cosas en el dispositivo en sí, pero todo es cuestión de potencia informática. Se necesita una cantidad increíble de cálculos para hacer una cita capilar de esta manera, y no hay forma de que se pueda hacer en su teléfono o Google Home.
Tienes que confiar en Google con tus datos para usar sus productos inteligentes y Duplex no será diferente.
Google necesita aprovechar gran parte de sus datos personales para hacer las cosas especiales que Assistant puede hacer en este momento, y Duplex no cambia eso. Lo nuevo aquí es que ahora hay otra parte involucrada que no le dio permiso explícito a Google para escuchar su conversación.
Si / cuando Duplex se convierte en un producto de consumo real para que cualquiera lo use, espere que sea criticado y desafiado en los tribunales. Y debería ser; Dejar que Google decida qué es lo mejor para nuestra privacidad es como el viejo adagio de dos zorros y un pollo que decide qué hay para cenar.
¿Cuándo tendré Duplex en mi teléfono?
Espere algunos grandes cambios en Asistente a finales de este año.Nadie lo sabe ahora. Puede que nunca suceda. Google se emociona cuando puede hacer este tipo de cosas fantásticas y quiere compartirlo con el mundo. Eso no significa que tendrá éxito o que nunca se convertirá en un producto real.
Por ahora, Duplex se está probando en un entorno cerrado y supervisado. Si todo va bien, un lanzamiento experimental inicial para los consumidores para hacer reservaciones en restaurantes, programar citas en peluquerías y obtener horas de vacaciones por teléfono llegará más adelante este año usando el Asistente solo en teléfonos.
¿Dónde puedo aprender más?
Google es sorprendentemente abierto sobre la tecnología que está utilizando para crear Duplex. Encontrará información relevante en los siguientes sitios web:
- Blog de Google AI (Google)
- Mente profunda
- Tensorflow.org
- La biblioteca de la universidad de Cornell
- Google Research (Google)
- La palabra clave (Google)
- Kit ML (Google)
Por supuesto, también estamos siguiendo de cerca a Duplex, y escuchará los últimos desarrollos aquí tan pronto como estén disponibles.