Google ha publicado algunos detalles del equipo de Seguridad y Privacidad sobre cómo se está curando Google Play, y el aprendizaje automático juega un papel importante.
Google tiene dos objetivos básicos para las aplicaciones en Play Store: seguridad y exposición. El equipo de Seguridad y Privacidad quiere eliminar las aplicaciones con malware, pero también están preocupados por las aplicaciones que solicitan permisos amplios que podrían no ser necesarios. A su vez, cuando se encuentran buenas aplicaciones que siguen buenas prácticas, el equipo quiere que aparezcan en Play Store.
Las máquinas crean grupos de pares para estudiar qué pueden hacer las aplicaciones y si deberían hacerlo.
Una de las formas en que lo hacen es mediante el uso de lo que se denomina "grupos de pares". Las aplicaciones con capacidades similares se agrupan juntas. Las aplicaciones como Spotify y Pandora (por ejemplo) son diferentes entre sí, pero tienen las mismas funciones básicas y están diseñadas para transmitir música a su Android utilizando los detalles de su cuenta en cada servicio. Lo mismo ocurre con Twitter y Facebook o aplicaciones como libros para colorear. Cuando hacen las mismas cosas básicas, se agrupan. Esto facilita el estudio de lo que hacen las aplicaciones, cómo lo hacen y si deberían hacerlo.
Luego se analizan para ver qué solicitan de su dispositivo cuando se trata de datos personales. Idealmente, cada aplicación en un grupo de pares solicitará el mismo tipo de información y tendrá una buena razón para hacerlo. Pero a veces, uno será un caso atípico. Google da el ejemplo de una aplicación de libro para colorear que solicita detalles de ubicación precisos a través del GPS. Otras aplicaciones de libros para colorear no hacen esto, por lo que una que sí esté sujeta a una revisión adicional por parte del equipo de Seguridad y Privacidad.
Hay demasiadas aplicaciones en Google Play para hacer esto a mano.
Hay demasiadas aplicaciones en Google Play para que los humanos hagan esto de manera efectiva, por lo que Google ha empleado algunas técnicas de aprendizaje automático para automatizar gran parte del proceso. Los algoritmos de aprendizaje profundo estudian el lenguaje en la aplicación, los datos sobre lo que hace la aplicación y cómo lo hace se analizan por computadora, y los grupos de pares mismos son construidos por estas máquinas en función de metadatos de la aplicación y descripciones de texto, así como métricas como el usuario instala.
Google hace todo lo posible para evitar que el malware ingrese a su teléfono a través de Google Play, pero esto también es para educar a los desarrolladores sobre el complejo (muy) modelo de permiso que usa Android. esta es una forma bastante buena de usar computadoras que ayudan a los usuarios y desarrolladores, y es genial que Google esté dispuesto a compartir información sobre cómo se está haciendo.



