Miércoles, 14 Agosto 2019 05:23

La cocina del Big Data

Walter Sosa Escudero es economista (UBA) e Investigador del Conicet.  Imagen: Sandra Cartasso

¿Se puede predecir una elección presidencial o el podio de un mundial de fútbol? Este investigador matiza el énfasis revolucionario del fenómeno y afirma que la verdadera transformación vendrá cuando las personas generen nuevas preguntas.

 

Tenemos, como nunca, un montón de información disponible y ello nos entusiasma pero también nos obnubila. Por un lado, el futuro se aproxima como un auténtico paraíso; lo que antes valía horas de bibliotecas, hoy se resuelve en cuestión de segundos. Sin embargo, tanta potencia tecnológica tiene su reverso: accedemos a muchos datos pero a cambio dejamos los nuestros. Cuando colocamos una dirección en el GPS, enviamos un correo o cenamos con amigos en algún bar, imprimimos nuestras huellas en el ciberespacio. Nos tornamos geolocalizables aunque nadie nos busque y nos volvemos predecibles aunque poca gente aprecie nuestra intimidad. La era global es así, nos bambolea entre el confort y el pánico, en cualquier tiempo y sin importar el lugar. En los intersticios, se teje una gran transformación cultural que sabemos que existe pero todavía no somos capaces de poner en palabras. Lo bueno es que no estamos solos, tenemos jinetes que custodian el terreno, utilizan sus largavistas y nos ayudan a comprender las cosas en su justa medida y por anticipado. Walter Sosa Escudero es economista (UBA), profesor de la Universidad de San Andrés e Investigador del Conicet. Acaba de publicar “Big Data” por la editorial Siglo XXI y coloca paños fríos a una situación que aparenta volar de fiebre.

--¿Qué es el Big Data?

--Lo primero, lo rápido, lo Wikipedia, sería definirlo como un fenómeno de profusión de datos masivos e instantáneos; producidos de manera espontánea y de expresión anárquica a través de sistemas que están interconectados entre sí. En la actualidad, a menudo, pensamos que cuánto más datos relacionamos es mejor y no siempre es así. No se pueden comparar los datos que arrojan 1000 encuestas bien equilibradas, o bien, los 60 que se manipulan en un experimento de laboratorio elaborado de manera concienzuda, con los 300 mil que surgen de responder a un multiplechoice en twitter. Para no celebrar el Big Data como si de una revolución se tratara, me gusta decir que lo importante no es trabajar con muchos datos sino que estén bien curados. Seguramente, serán mucho más informativos que aquellos extraídos sin ningún criterio.

--¿Cómo utilizar tanta información a favor?

--Hablar de Big Data se parece mucho a hablar de cerveza artesanal. El reverso de los datos, históricamente, fueron los métodos que se emplean para estudiarlos. Cuando al triángulo de datos-métodos-ideas se le quita una pata, éste se desploma. Tener más información es una buena noticia siempre y cuando existan preguntas que reclamen la necesidad de ser respondidas. En el futuro, la condición de posibilidad para una revolución de los datos tendrá que ver, sobre todo, con la capacidad de las personas para generar preguntas y discutir ideas.

--¿No hay preguntas que reclamen ser respondidas?

--Hay pero no en la proporción en que hubiésemos querido. En los últimos 15 años hubo una explosión de datos y métodos, pero no de ideas. Predecir quién ganará un mundial o quién triunfará en las próximas elecciones sigue siendo igual de difícil que siempre. En las épocas de los algoritmos y del Big Data, no estamos realizando mejores predicciones deportivas ni políticas. Basta con ver lo que ocurrió con la emergencia de Donald Trump, el derrotero del Brexit y, sin ir tan lejos, la aparición de la fórmula Fernández-Fernández. Con machine learning de por medio, nadie vio la jugada. Nadie. Lo que no advertimos es que fenómenos tan complejos como la economía o la política poseen una dificultad intrínseca que no tiene nada que ver con la falta o el exceso de datos.

--Si bien los datos no pueden predecir grandes fenómenos, son útiles para inducir decisiones. De hecho, el mercado publicitario se estructura de ese modo.

--Absolutamente. Si me preguntaras cuál es el mayor rédito de todo esto, te diría que reside en la capacidad inductiva, descriptiva, ordenadora y clasificatoria del Big Data. En el pasado uno hablaba de “el votante” y hoy se puede trabajar con una granularidad muchísimo más grande: “el votante que tiene entre tantos y tantos años, que vive en el barrio x con su pareja y asiste a la universidad x”. En la publicidad ocurre lo mismo, hubo algo por lo que McDonald’s se diversificó y existen McCafés; evidentemente, alguien con buen ojo se dio cuenta de que los chicos eran llevados por padres que preferían tomarse un café después del cine y no comer un combo.

--Ahora que sabemos sus potencialidades, ¿para qué no sirve el Big Data?

--No sirve para explicar, porque eso es mucho más difícil. Mucha gente piensa que como se puede clasificar mejor, estamos en mejores condiciones de explicar. Un ejemplo burdo: si puedo conseguir los datos de ventas de paraguas en diferentes regiones, podría llegar a estimar cuáles son los puntos geográficos en los que más llueve. Si se venden más en Rosario que en Antofagasta (Chile) debe ser que hay más precipitaciones en la primera que en la segunda. Ahora bien, esto no ayuda a entender por qué llueve ni tampoco contribuye a resolver una sequía o una inundación. No podría asesorar a los que comercian paraguas ni tampoco a los que quieren cultivar la tierra. Como no me permiten entender las razones, entonces no puedo cambiar la realidad. Hay un trecho enorme entre medir la pobreza y entenderla, diseñar una política y evaluar su impacto favorable. Los datos podrían funcionar como una herramienta para ganar una elección pero no son definitivos porque requieren de un trabajo interpretativo y creativo de los analistas.

--Con la exposición de nuestros datos en redes sociales vivimos cada vez más controlados. ¿Perdimos libertad, existen nuevas formas de libertad, o bien, la libertad nunca existió?

--A los efectos de no sembrar rastros, cada vez que salgo al trabajo debería dejar el celular en mi casa. Pero eso me complica la vida; no puedo chequear el tránsito, no sé si me conviene moverme en medios de transporte públicos, usar la bici o ir caminando. Tampoco tengo datos del tiempo atmosférico y no puedo saber cómo vestirme. Al acceder a los servicios que brinda internet, me beneficio de un montón de cosas y alguien cobra por ello. Como pasa con cualquier tecnología, el asunto es hacer la cuenta entre las ventajas y las desventajas. El obstáculo con el Big Data y la capacidad predictiva de los algoritmos es que hoy ese balance no arroja un resultado certero. El límite con la privacidad individual se sostiene en un terreno fangoso. No me gustaría enterarme por un robot cosas del tipo: “hoy estuviste tomando un café con un amigo y muy probablemente tiene cáncer”. El sistema puede saber mucho de nosotros, incluso, podría saber cosas que ni siquiera sabemos nosotros mismos de nosotros.

--El asunto requiere de un abordaje matemático y estadístico, pero también posee ribetes filosóficos...

--Sí, porque nos lleva a pensar cuestiones que creíamos olvidadas. El Big Data está a mitad de camino entre la revolución y convertirse en más de lo mismo. Con las redes sociales sucede parecido: nos plantean un nuevo modo de interacción, pero ello no quiere decir que antes no nos relacionábamos. La chica del barrio que te guiñaba un ojo cuando salía a andar en bici hoy es el “Me gusta”. Siempre hubo mecanismos de validación social; prefiero creer que los vínculos se tejen de otra manera. Hoy se habla de las burbujas informativas como una novedad, es decir, le pongo likes a los que piensan como yo y borro a los que lo hacen distinto. El diario de Irigoyen era un poco eso. La moraleja: seamos cautos con comunicar revoluciones, especialmente, cuando todavía no suceden.

//Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.">Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Publicado enCultura
El teléfono en Europa y la política del cambio que no es real

Es famosa la anécdota de que el superdiplomático estadunidense Henry Kissinger preguntó alguna vez, "¿a quién llamo cuando llamo a Europa?" La pregunta se cita en repetidas ocasiones como un modo inteligente de sugerir pesimismo acerca de Europa como realidad. La respuesta, por supuesto, depende de lo que quiera uno saber de Europa. Hay por lo menos una docena de instituciones europeas de variados tipos de membresías e intereses. Puede uno telefonear a cualquiera de ellas. Europa es tanto una realidad, que hay aun una institución europea instituida por quienes quieren abolir las instituciones europeas.

 

Haremos dos cosas en este comentario. Una es discutir la diferencia entre lo que llamo un cambio real y un cambio que no es real. Para ello, la discusión del teléfono de Europa es muy útil para dejarnos ver qué está ocurriendo.

 

La segunda cosa que intento hacer es discutir la epistemología del análisis y las formas en que hemos venido a hablar de algo que llamamos análisis espacio tiempo (AET).

 

Déjenme explicar lo que pienso ocurre cuando intento hacer un comentario. Comienzo por fecharlo y ponerle título. Luego comienzo a dictar lo que es necesario. Así que déjenme comenzar a dictar éste.

 

Desde octubre de 1998 he estado escribiendo comentarios que aparecen cada quincena del mes. No he faltado ninguno. Tienen un patrón estándar de lo que digo.

 

Por más de 500 años del moderno sistema-mundo los análisis tienen un vaivén de ida y vuelta entre situaciones donde el punto de vista conservador estaba en la cima y situaciones donde la visión no conservadora estaba arriba.

 

¿Qué ha ocurrido? Bueno, esto puede explicarse si volteamos a examinar la visión axiomática de que podemos predecir el resultado de algo que queremos saber si miramos cómo nos iba hace 25 años.

 

Hoy, el problema al que casi todo el mundo en todo el sistema-mundo está dedicado es a responder "si Donald Trump va a reelegirse en 2020", y el axioma nos dice que el modo de saberlo es mirar 25 años atrás a ver cómo estaba la gente en ese momento. Y que si estaba bien hace 25 años, será reelecto, y si a la gente no le iba bien entonces, no será reelecto.

 

¿Por qué debe ser esto así? Tiene que ver con cómo las ocurrencias sucesivas afectan las previas. Supongamos que tomamos el más reciente de estos virajes grandes, uno que comenzó más o menos cerca de 1945 y que sigue hasta ahora.

 

¿Qué es lo que ocurre? Se dice que cada vez que hago la pregunta, "¿qué es lo que ocurre?" uno afecta de un modo diminuto, pero verdaderamente, una mezcla de números que tiene 25 años. Veamos por qué.

 

Así, se supone que podemos intentar tomar el promedio de todas las veces previas en que la gente ha supuesto mantener algo de hace 25 años.

 

Descubrimos que el promedio sería un ejercicio matemático imposiblemente complejo, que nadie es capaz de hacer. Así, realmente no podemos saber cuál sería la lectura del promedio de lo que son esos 25 años atrás. Podemos adivinar, por supuesto, y podemos acercarnos, pero no hay modo en que sepamos con absoluta certeza lo que la gente sentía hace 25 años. Ergo, no somos capaces de predecir.

 

Tomemos tres problemas cuyo contenido le importa a la gente. Uno es la condición de las mujeres. Otro es el grado al cual las cuestiones internas las dirime la gente que está a cargo. Y otro es el grado al cual nuestro país y la gente en nuestro país son hegemónicos en los sistemas-mundos.

 

En 1945, el la visión del establishment era que las mujeres no tuvieran ningún derecho. Esta visión cambiará durante los próximos años a una donde las mujeres tienen muchos derechos.

 

Otro problema es el estado del poder de aquellos que están a cargo. El tercero es el grado al cual un país es hegemónico en el sistema-mundo.

 

En el lapso de 25 años, las tres cuestiones llegan a un punto de inflexión donde parecen haber cambiado por completo. Esto es una ilusión. De hecho lo único que ha cambiado son los nombres de la gente, o los de los grupos que son dominantes en el sistema. Sigue siendo éste un sistema que es bilateral y donde no puede ocurrir cambio alguno. Acerca de la gente a cargo del sistema, su poder era absoluto circa 1949. Y en términos de Estados Unidos y el poder hegemónico, era incuestionable circa 1945.

 

Cada uno de estos tres análisis se mueve a un punto presumiblemente cambiante donde todo ha quedado de cabeza tras 25 años. De hecho, el punto es que lo que ha cambiado es quién estaba en la cima y quién en la base. El sistema se mantiene igual. Es por eso que hablo de un "cambio que no es real".

 

A diferencia de virajes previos en la historia del moderno sistema-mundo, el viraje que comenzó a ocurrir circa 1945 fue mucho más raudo a resultas del cambio estructural del moderno sistema-mundo. Este cambio estructural significó que cuando arribamos al cambio virtual de 1968, más o menos, podíamos haber hecho un cambio real. De hecho, no lo hicimos. Hubo una reversión al viejo modo de calcular las cosas, pero con un lenguaje nuevo.

 

¿Cuál es la diferencia entre los cambios que se hicieron regularmente por más de 500 años y el último cambio que se hizo desde 1949? La diferencia tiene que ver con un número de categorías con las cuales etiquetamos nuestros cálculos. Si las etiquetas dicen que son cambios normales durante el periodo de 500 años, entonces todas estas etiquetas serán bilaterales. Los cambios que no son reales parecen ser cambio, pero de hecho no lo son. La única manera de tener un cambio que no parezca un cambio, sino que sea un cambio real, es apoderarse del momento de la crisis estructural del moderno sistema-mundo y, de hecho, en vez de hacer cálculos bilaterales, calcular totalmente de otro modo. Algo que yo le llamaría, "cambio cuadrilátero".

 

Hay otro cambio, en realidad de gran importancia. Es si debemos comenzar en forma normal con un análisis completamente autónomo para el tiempo histórico y el espacio global.

 

Utilizando el análisis de espacio tiempo, podemos encontrar entonces si ha ocurrido un cambio real o un cambio que no es real. Donde estamos ahora, podemos entrar en este debate con algo que podemos aprender del AET, algo que no podríamos haber aprendido si lidiáramos por separado con el tiempo histórico y el espacio global.

 

Hemos intentado explicar lo que es un cambio que no es real y hemos intentado explicar lo que significa un análisis de espacio tiempo. Si no lo logramos, es porque es difícil explicar esto.

 

Traducción: Ramón Vera-Herrera.

Publicado enInternacional