El sistema conocido en la industria como “privacidad diferencial” permite a las empresas manejar cada vez más datos de las personas conociendo cada vez menos de ellas.
Cynthia Dwork, investigadora de Microsoft, es la propulsora de la privacidad diferencial, por medio de su obra The algorithmic foundations of differential privacy (Los fundamentos algorítmicos de la privacidad diferencial) publicada en el año 2014, y que Microsoft, Google, Apple, Uber y otras grandes compañías globales están implementando en sus procesos.
La privacidad diferencial permite conocer estadísticas agregadas sobre una población y al mismo tiempo previene de una forma muy sistemática que un observador pueda obtener información sobre un usuario específico.
Lo hace, básicamente, añadiendo más ruido estadístico a la respuesta cuanto más específica es la pregunta que le estamos haciendo a la base de datos, explica Miguel Guevara, jefe de Producto en la división de Privacidad y Protección de datos de Google.
Si queremos conseguir datos muy concretos -continúa Guevara- sobre un subconjunto muy reducido de sujetos en la muestra, el ruido será mayor cuanto menor sea el tamaño de ésta, y por tanto los resultados tenderán progresivamente a ser más y más inservibles a nivel práctico.
En ese momento, el ruido que estás introduciendo es tanto, que los resultados se convierten en basura. De esta forma, manejar grandes bases de datos bajo los esquemas de la privacidad diferencial disminuye el riesgo de divulgación.
Apple en su informe técnico sobre privacidad diferencial explica que, para mejorar la experiencia de usuario, reciben constantes reportes sobre los usos: cuáles palabras son más utilizadas para optimizar las sugerencias; cuáles sitios web tienen problemas que afectan la batería; cuál emoji es el más elegido; todo eso podría afectar la privacidad si no se utilizara el método de privacidad diferencial, que como primer paso privatiza la información en el dispositivo del usuario, asegurando que los servidores de Apple no reciban datos claros.
Los identificadores de dispositivos se eliminan de los datos y se transmiten a Apple a través de un canal cifrado, que ingiere las contribuciones privadas diferencialmente, eliminando direcciones IP y otros metadatos.
La etapa final es la agregación, donde los registros privatizados se procesan para calcular las estadísticas relevantes, y las estadísticas agregadas luego se comparten con los equipos relevantes de Apple.
Tanto las etapas de ingestión como de agregación se realizan en un entorno de acceso restringido, por lo que incluso los datos privatizados no son ampliamente accesibles para los empleados de Apple.
Por voluntad, por negocio o por exigencia de las autoridades de contralor, finalmente la privacidad está logrando ser respetada.
* Abogado, especialista en derecho informático