¿Delató Netflix a un Cliente? Sus Datos Privados Pueden Ser Convertidos En Carnaza Por Un Concurso.


Una mujer alegó recientemente que Netflix la "delató" cuando la compañía divulgó información de los usuarios para un concurso (foto AP) (Fotografía y texto de ABCNews.com)

Incluso la Información Anónima Puede Divulgar a Veces la Identidad de Una Persona

Por John Allen Paulos, 7 de febrero de 2010.

Mi universidad, que está en Filadelfia, envió recientemente un e-mail a los profesores y al personal informando sobre su política de protección de datos.

En concreto decía que la Ley de Protección de Datos Personales de Pensilvania dispone que debemos notificar a una persona si divulgamos información personal suya.

La información personal se define como “el nombre propio, o inicial del mismo, y el apellido en combinación con una o más de las siguientes informaciones sin cifrar: un número de la Seguridad Social, un número de permiso de conducción o número de identificación estatal,  número de cuenta corriente y número de tarjeta de crédito o débito, acompañados de las contraseñas o códigos de seguridad aplicables”.

El Concurso de Netflix y la Demanda

Es de alabar esta política, pero justo después de leer ese e-mail me encontré con un concurso que la empresa de alquiler de DVD Netflix ha estado llevando a cabo durante estos últimos años.

El concurso fue ideado para inferir del público en general algoritmos que permitieran a la empresa mejorar las sugerencias a sus clientes para futuras elecciones de películas. Para hacerlo, Netflix lanzó una enorme cantidad de datos acerca de las anteriores elecciones de sus usuarios y de las calificaciones que éstos les dieron.

Como la compañía buscaba una manera mejor de determinar más películas que gustaran o no a estos usuarios, anunció un premio de un millón de dólares. El premio lo ganaría aquel grupo de investigadores cuyas predicciones acerca de otra valiosa cantidad de datos sobre calificaciones de películas, relacionadas con estos mismos usuarios, fueran más precisas.

Los usuarios eran anónimos, identificados sólo por un número. Ningún nombre, ni números de la Seguridad Social, ni del permiso de conducir ni de ninguna cuenta corriente se divulgó, por lo que el concurso cumplía con la política de protección de datos de Pensilvania, sin duda muy común en todo el país.

Netflix también tomó otras medidas para garantizar el anonimato de los usuarios, pero esto no evitó que la empresa fuera demandada recientemente por un suscriptor, como parte de una demanda colectiva, por violación de su privacidad. Una madre anónima, lesbiana en el armario, alegó que Netflix la delató al no proteger adecuadamente sus datos causándole daños económicos y psicológicos.

La explicación: se descubrió que se podían identificar usuarios concretos comparando sus evaluaciones y comentarios anónimos en Netflix con otros que sí estaban firmados en The Internet Movie Database.

En cualquier caso la demanda mantiene que al publicar esta enorme colección de datos Netflix ha violado la muy estricta Ley de Protección de Datos en Video, que se aprobó cuando salieron a la luz las selecciones de películas de Robert Bork, candidato al Tribunal Supremo, obtenidas de un vídeo-club.

¿Otro Concurso de Netflix Aún Más Revelador?

Se eligió al ganador del millón de dólares en el primer concurso, y ahora se dice que Netflix está planeando un segundo concurso para mejorar aún más sus algoritmos de predicción.

En este concurso, se proporcionarán las evaluaciones personales de las películas, pero manteniendo el anonimato de los usuarios proporcionando “únicamente” sus fechas de nacimiento, códigos postales y sexos. “Únicamente” está entrecomillado porque esta información es aún más reveladora que la divulgada en el concurso anterior.

Un vistazo a los números nos sugiere el por qué. Si, en una primera aproximación, suponemos que las personas viven hasta los 75 años, entonces tenemos sobre 27.375 (75 x 365) fechas de nacimiento posibles. Como hay aproximadamente 43.000 códigos postales de 5 dígitos, y 2 sexos, la conocida regla del producto nos dice que hay unas 27.000 x 43.000 x 2 posibles conjuntos de fechas de nacimiento, códigos postales, y sexos.

Este producto es aproximadamente 2.300 millones, un número bastante mayor de la población de 300 millones de personas de los Estados Unidos. Como este número es mucho mayor que la población, no es sorprendente que muchos norteamericanos queden definidos unívocamente por su fecha de nacimiento, código postal y sexo.

Piense en 2.300 millones de cestas, cada una etiquetada con un conjunto diferente de estos tres números. Imagine ahora que cada uno de los 300 millones de norteamericanos se colocan en la cesta adecuada. Seguramente, muchos norteamericanos se encontrarán sólos en su propia cesta, y así quedarán unívocamente identificados.

Por supuesto, esta es una gran simplificación. Las fechas de nacimiento no están unifirmemente distribuidas a lo largo de los últimos 75 años, algunos códigos postales comprenden a mucha gente y otros no tanto. Algunos contienen una cantidad desproporcionada de gente joven, otros de gente mayor, etc. Incluso si la edad es divulgada en lugar de la fecha de nacimiento, muchos americanos continuarán estando unívocamente identificados.

Así, uno puede comprobar empíricamente utilizando censos o mediante argumentaciones probabilísticas a priori que una mayoría substancial de norteamericanos estarían unívocamente identificados por el concurso propuesto.

Predicción y Privacidad

La clave está qen que es muy difícil divulgar información acerca de una persona o un grupo que, ante un investigador o un publicista suficientemente curioso o diligente, no revele en ocasiones información privada de esta persona. Los bits de información raramente son huérfanos, y van interconectándose cada vez más de formas impredecibles.

Considere las intrincadas interconexiones entre el Mundo de Twitter y la Casa de los Espejos que es Facebook. Incluso un par de nombres inusuales (como Waldo y Gertrudis) pueden ser suficientes para que un detective experto descubra todo tipo de información sobre ellos.

Recomendar Libros y Películas es un Negocio Arriesgado

Por supuesto, la dificultad de preservar nuestra privacidad no es un argumento para no tomar precauciones adecuadas al respecto. Al contrario de lo que ocurrió con el primer concurso, el segundo, si Netflix lo lleva a cabo con la estructura que se está rumoreando, parecería una violación intencionada de la privacidad.

En cualquier caso, la cuestión de dar con mejores predicciones de las que los clientes quisieran es general. Como Amazon no tiene externalizados sus algoritmos, por ejemplo, es natural que quiera sugerir libros en los que un lector particular pudiera estar interesado basándose en sus eleciones anteriores.

Esto me recuerda una anécdota que me ocurrió en una lebrería que visité hace unos años. Le pregunté a la encargada si sabía dónde podía encontrar el Tratado de Wittgenstein, y me indicó que buscara en la sección de motor, donde seguramente lo encontraría. El problema es que el libro de Wittgenstein es una publicación fundamental de la filosofía del siglo XX.

En conclusión: recomendar libros y películas es un negocio arriesgado, conocer qué libros o películas prefiere una persona es a menudo muy revelador, y salvaguardar la privacidad de las personas se convertirá en algo cada vez más difícil, incluso con la mejor de las intenciones.

John Allen Paulos, profesor de matemáticas en la Universidad de Temple, es el autor de los best sellers “El Hombre Anumérico” y “Un Matemático Lee el Periódico”, así como el recién editado en edición de bolsillo “Elogio de la Irreligión“. Su columna “¿Quién Lleva la Cuenta?”en ABCNews.com se publica el primer fin de semana de cada mes.

Copyright © 2010 ABC News Internet Ventures

Lo tradujo, así así, Javier Oribe Moreno en  El Máquina de Turing.

Esta es una traducción libre, se puede consultar el artículo original aquí.


2 comentarios

  1. […] ¿Delató Netflix a un Cliente? Sus Datos Privados Pueden Ser Convertidos En Carnaza Por Un Concurso elmaquinadeturing.wordpress.com/2010/02/23/%C2%BFdelato-netf…  por Nawalrus hace 2 segundos […]

Si tiene algo que decir, éste es el momento

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Matemáticas 2º de ESO

Blog de matemáticas para los alumnos de 2º de ESO del Colegio Marcelo Spínola

Historias de la Historia

La historia contada de otra forma

Cuentos Cuánticos

Un sitio donde los cuentos de ciencia están contados y no contados al mismo tiempo

El escéptico de Jalisco

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Los Matemáticos no son gente seria

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Francis (th)E mule Science's News

La Ciencia de la Mula Francis. Relatos breves sobre Ciencia, Tecnología y sobre la Vida Misma

El mundo de Rafalillo

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Mati, una profesora muy particular

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Hablando de Ciencia

La Ciencia al Alcance de tu mano

Tito Eliatron Dixit

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Gaussianos

Porque todo tiende a infinito...

La Ciencia y sus Demonios

La primera gran virtud del hombre fue la duda y el primer gran defecto la fe (Carl Sagan)

A %d blogueros les gusta esto: