Los académicos que extraen datos de Facebook

En julio de 2014, un equipo de cuatro investigadores suecos y polacos comenzaron a utilizar un programa automatizado para comprender mejor las publicaciones de la gente en Facebook.

El programa, conocido como un “raspador”, permitió que los investigadores registraran cada comentario e interacción de 160 páginas públicas de Facebook a lo largo de casi dos años. Para mayo de 2016, habían recabado suficiente información para monitorear el modo en que se comportaban 368 millones de miembros de Facebook en la red social; uno de los conjuntos más grandes de datos de usuarios que se haya reunido.

“Nos preocupa la facilidad con que se puede reunir esta información”, aseguró Fredrik Erlandsson, uno de los investigadores y un académico del Instituto Tecnológico Blekinge en Suecia. En diciembre, Erlandsson y sus colegas publicaron un trabajo de investigación en la revista Entropy, en el cual detallaron cómo se podían reproducir sus métodos para rastrear sitios de redes sociales.

Durante más de una década, profesores, candidatos doctorales e investigadores de instituciones académicas de todo el mundo han recabado información de Facebook por medio de técnicas similares a las que usaron Erlandsson y su equipo. Han reunido cientos de conjuntos de datos de Facebook que capturaron el comportamiento de individuos, desde unos miles hasta unos cientos de millones de ellos, de acuerdo con entrevistas realizadas a más de una decena de especialistas.

Sus prácticas salieron a la luz en marzo cuando The New York Times y The Observer de Londres informaron que Aleksandr Kogan, un profesor de Psicología de la Universidad de Cambridge, había obtenido los datos de hasta 87 millones de usuarios de Facebook por medio de una aplicación que hacía un cuestionario. Kogan vendió la información a Cambridge Analytica, una consultora política vinculada a la campaña de Trump, para que esta pudiera crear perfiles psicográficos de los votantes estadounidenses.

La semana pasada, Cambridge Analytica anunció que cesaría sus operaciones después del alboroto que provocó el uso que dio a la información personal de los usuarios de la red social.

También puedes leer: Redes sociales les darían cinco puntos extra a los presidenciables

Sin embargo, aunque ahora se sabe qué sucedió con esos datos que estaban en poder de Kogan, el destino de otras reservas de información es más oscuro. En muchos casos, los datos se usaron para investigaciones y artículos académicos. En algunos casos, la información no quedó protegida y se almacenó en servidores abiertos a los cuales podía tener acceso cualquiera. Algunos académicos afirmaron que los datos se podrían haber copiado con facilidad y vendido a comerciantes o consultoras políticas.

El resultado potencial es que haya más filtraciones de la información de los usuarios de Facebook por medio de círculos académicos, señaló Rasmus Kleis Nielsen, un profesor de Comunicación Política de la Universidad de Oxford que ha estudiado la recolección de datos de Facebook.

“El mundo académico está muy descentralizado y cada individuo, cada institución, tiene un mecanismo diferente para resguardar sus datos”, agregó Nielsen. “Aunque casi toda la comunidad académica fuera cuidadosa y protegiera los datos, todavía cabría la posibilidad de que alguien fuera descuidado o actuara de mala fe con el objetivo de vender el acceso a la información. Es difícil imaginar cómo Facebook podría evitar que eso sucediera”.

The New York Times revisó media decena de conjuntos de datos de Facebook que reunieron académicos desde 2006 hasta 2017. En uno que recabaron investigadores de Dinamarca y Nueva Zelanda de 2015 a 2017, se examinaron 1.3 millones de personas en Dinamarca —cerca de una cuarta parte de la población del país— para determinar qué tanto se podía predecir el voto de alguien por medio de un me gusta a una página política en Facebook. En otro conjunto, de 2013, que reunió un grupo de académicos noruegos, el objetivo fue definir la participación cívica de 21 millones de miembros de Facebook en cuatro continentes.

El equipo de investigadores daneses no respondió a nuestra solicitud para dar comentarios. Petter Bae Brandtzaeg, uno de los investigadores noruegos, mencionó que entendía la preocupación que generaba la recolección de datos.

“Como investigador, tienes acceso inmediato al comportamiento, las actitudes, los sentimientos y las relaciones de las personas, lo cual evidentemente es tentador para cualquiera”, escribió en un correo electrónico. Brandtzaeg señaló que muchos investigadores carecían de la pericia técnica para resguardar la información de manera adecuada.

Lo más común es que los datos de Facebook se acumulen por medio de programas raspadores que recorren la red social para documentar qué se publicó, o por medio de aplicaciones de cuestionarios que solicitan acceso a los perfiles de la gente. Entre los resultados se encuentran las ubicaciones, los intereses, las afiliaciones políticas, las interacciones en Facebook e incluso las preferencias musicales de las personas.

En la mayoría de los casos, para mantener el anonimato, los investigadores asignaron números a la gente de la cual habían obtenido información de Facebook. Sin embargo, mientras más datos haya, más fácil es superponer un conjunto de información con otro con el fin de identificar a alguien. En un artículo académico publicado en 2015 en la revista Science, se investigaron los datos de gastos con tarjetas de crédito y se reveló que los científicos de datos podían precisar el 90% de los nombres de los compradores con tan solo cuatro elementos de información al azar de sitios como Facebook, Instagram y Twitter.

Una vez que la gente es identificada y se conocen sus intereses e interacciones, puede ser blanco de la publicidad y se le puede movilizar para campañas políticas u otras causas.

En 2006, profesores de la Universidad de Harvard recolectaron uno de los primeros conjuntos de datos de Facebook de los que se tiene conocimiento. Cubría a mil 700 personas que accedieron de forma anónima a que analizaran su información de Facebook. Posteriormente, desde académicos hasta estudiantes de primer año tuvieron fácil acceso a los datos.

En el Reino Unido, los investigadores hacían un trabajo similar con mecanismos distintos. En 2007, Michal Kosinski, entonces subdirector del Centro de Psicometría de la Universidad de Cambridge, trabajó con un colega, David Stillwell, para crear My Personality, un cuestionario que ofrecía evaluar las personalidades de los individuos a cambio de información sobre ellas. Fue una de las primeras aplicaciones de este tipo en ser utilizada para obtener datos de los usuarios de Facebook.

Hasta la fecha, My Personality ha recolectado información de más de seis millones de usuarios de Facebook, según los académicos que reunieron los datos. Desde entonces, muchos investigadores han copiado el método de la aplicación de cuestionario, entre ellos Kogan.

En entrevistas que sostuvieron con The New York Times, Kosinski y Stillwell mencionaron que tuvieron mucho cuidado de mantener en el anonimato los datos que obtuvieron. Stillwell añadió que la información ya se había compartido ampliamente con otros académicos, pero que fue investigado cualquiera que hubiera querido utilizarla.

Kosinski reconoció que los datos no son objetos físicos que se puedan controlar con facilidad. Una vez que se crea un conjunto de datos, se puede copiar y compartir hasta que su fuente original sea desconocida. Kosinski mencionó que recolectar datos de Facebook se popularizó con los años, no solo entre los académicos, sino entre los desarrolladores, los mercadólogos, las empresas de análisis de datos y más.

“Kogan hizo algo indebido. Pero eso mismo lo hacen muchos otros a una escala bastante mayor”, aseguró Kosinski. “Solo que no los atrapan”.

Durante años, Facebook no tuvo políticas específicas sobre el acceso que podían tener los académicos a los datos de sus usuarios, aunque tenía lineamientos con relación al trabajo con terceros. Aunque la empresa tiene una regla que prohíbe el uso de raspadores, no ha ejercido esa política en contra de la academia. Además, hay ocasiones en las que la red social ha ayudado a los investigadores con sus estudios.

No obstante, en 2014, Facebook comenzó a limitar que las aplicaciones de terceros, como los cuestionarios, obtuvieran la información de los usuarios.

Desde que se revelaron las acciones de Kogan, las cuales desataron un clamor respecto de la privacidad de los datos, Facebook ha realizado más cambios. La empresa ha dado más control a la gente sobre sus configuraciones de privacidad. Afirmó que auditaría todas las aplicaciones que recolectan grandes cantidades de datos de Facebook y que había evitado de manera temporal que nuevas aplicaciones reunieran información de sus miembros.

El mes pasado, Facebook también redujo el número de académicos con los que iba a trabajar, con el argumento de que colaboraría con aquellos que quisieran investigar el efecto de la red social en las elecciones por medio de una “comisión de investigación independiente de las elecciones”. Los académicos que estén trabajando en proyectos relacionados con las elecciones son los únicos que pueden solicitar el acceso a la información.

Sin embargo, algunos investigadores aseguraron que los cambios recientes de privacidad podrían haber ido demasiado lejos, si también alejan a los académicos que se comportaron de forma responsable.

“Los académicos van a argumentar que necesitamos acceso a datos primordiales”, comentó Nielsen de Oxford, quien añadió que los cambios podrían producir una asimetría entre los investigadores internos de Facebook que acumulan montones de información y los académicos exteriores que no lo hacen.

“Si eso sucede, solo Facebook conocerá la manera en que realmente opera la empresa y cómo se comporta la gente en la red social”, mencionó Nielsen.

TAMBIÉN TE PUEDE INTERESAR:

Los académicos que extraen datos de Facebook

La empresa creada por Mark Zuckerberg tardó años en implementar políticas sobre el acceso que podían tener los académicos a datos de los usuarios

Tags

Lo Último