Alexa está instalada en más de 100 millones de dispositivos en todo el mundo, adquiriendo miles de millones de consultas de usuarios en el proceso. Al igual que todos los asistentes digitales, Alexa confía en modelos de datos para ofrecer mejores respuestas, pero parece que Amazon también le brindó una ayuda al asistente digital en forma de revisiones humanas. Una investigación realizada por Bloomberg ha revelado que Amazon tiene un equipo global que transcribe y graba grabaciones de Alexa de todo el mundo para "eliminar las brechas en la comprensión de Alexa del habla humana" y permitir que el asistente responda mejor a sus consultas.
La publicación descubrió que Amazon emplea a miles de personas en todo el mundo, tanto contratistas como empleados a tiempo completo, para revisar las grabaciones de Alexa, con equipos repartidos por Boston, Costa Rica, India y Rumania. Según una fuente no identificada, cada revisor analiza más de 1, 000 clips de audio en un turno de nueve horas, anotándolos y enviándolos al sistema para mejorar las respuestas de Alexa. De Bloomberg:
Un trabajador en Boston dijo que extraía datos de voz acumulados para expresiones específicas como "Taylor Swift" y los anotó para indicar que el buscador se refería al artista musical.
Ocasionalmente, los oyentes recogen cosas que los propietarios de Echo probablemente preferirían mantener en privado: una mujer cantando mal en la ducha, por ejemplo, o un niño que grita pidiendo ayuda. Los equipos usan salas de chat internas para compartir archivos cuando necesitan ayuda para analizar una palabra confusa o encontrar una grabación divertida.
La publicación también encontró que los empleados encuentran grabaciones que son de naturaleza inquietante:
A veces escuchan grabaciones que les molestan, o posiblemente criminales. Dos de los trabajadores dijeron que recogieron lo que creen que fue una agresión sexual. Cuando sucede algo así, pueden compartir la experiencia en la sala de chat interna como una forma de aliviar el estrés.
Amazon dice que tiene procedimientos para que los trabajadores sigan cuando escuchan algo angustiante, pero dos empleados con sede en Rumania dijeron que, después de solicitar orientación para tales casos, les dijeron que no era el trabajo de Amazon interferir.
Las grabaciones no tienen el nombre completo o la dirección de un usuario, pero sí incluyen el nombre del usuario, un número de cuenta y el número de serie del dispositivo. Amazon mencionó anteriormente que se basa en el procesamiento del lenguaje natural para entrenar a Alexa, pero ha admitido ante Bloomberg que utiliza un elemento humano para anotar una "pequeña muestra de grabaciones de voz de Alexa:"
Nos tomamos en serio la seguridad y la privacidad de la información personal de nuestros clientes. Solo anotamos una muestra extremadamente pequeña de grabaciones de voz de Alexa para mejorar la experiencia del cliente. Por ejemplo, esta información nos ayuda a capacitar nuestros sistemas de reconocimiento de voz y comprensión del lenguaje natural, para que Alexa pueda comprender mejor sus solicitudes y garantizar que el servicio funcione bien para todos.
Tenemos estrictas garantías técnicas y operativas, y tenemos una política de tolerancia cero para el abuso de nuestro sistema. Los empleados no tienen acceso directo a información que pueda identificar a la persona o cuenta como parte de este flujo de trabajo. Toda la información se trata con alta confidencialidad y utilizamos la autenticación multifactor para restringir el acceso, el cifrado del servicio y las auditorías de nuestro entorno de control para protegerlo.
No solo Amazon está recurriendo a los ayudantes humanos para desarrollar su asistente digital. Bloomberg descubrió que Apple también tiene un equipo humano que verifica si la interpretación de las solicitudes de Siri coincide con lo que pidieron los usuarios. Google tiene revisores que entrenan al Asistente, pero los clips no tienen ninguna información de identificación personal y el audio en sí está distorsionado para evitar cualquier identificación.