Daniel Gómez (ALN).- “El big data lo cambia todo”, asegura el científico argentino Gustavo Ariel Swartz. Tal es así que en unos pocos años ha logrado hazañas únicas. Google, por ejemplo, reunió prácticamente todos los libros del mundo entre 2005 y 2010. Pero hay cosas que no cambian. Los análisis matemáticos actuales siguen definiendo como brillantes los clásicos de Julio Cortázar, Víctor Hugo y Marcel Proust.
La obra del argentino Julio Cortázar no sólo es brillante desde un punto de vista estético, lo es también desde una perspectiva matemática. Lo afirmó un estudio de 2016 publicado por un equipo de físicos nucleares de la Academia de Ciencias de Polonia. Estudiando sus textos observaron cómo los algoritmos de las oraciones son casi iguales a los de otros grandes de la literatura universal.
La conclusión la extrajeron gracias al big data, explicó el científico titular del Consejo Superior de Investigaciones Científicas, el argentino Gustavo Ariel Swartz, en una conferencia de T+ en la Casa de América de Madrid.
Dijo que a través de esta tecnología los físicos polacos hicieron un análisis multifractal en el que se veía cómo, por ejemplo, la prosa de Cortázar en Rayuela, guardaba una estructura similar que la de Víctor Hugo en Los Miserables o a la de otros grandes de la literatura universal como Marcel Proust, James Joyce y William Shakespeare.
La magia para determinar la brillantez de Cortázar, detalló Swartz, fue la de convertir las oraciones en algoritmos. ¿Qué determinan los algoritmos? El ritmo. ¿Y cómo se consigue el ritmo? Pues en prosa una de las formas más clásicas de lograrlo es intercalar oraciones largas con frases cortas.
Este análisis lo puede lograr cualquiera revisando línea a línea las obras de los escritores. No obstante, sería una tarea ardua y costosa. No así con el big data, un método que, a pesar de lo costoso, “es más rápido y sencillo que el estudio tradicional”.
Un sueño milenario se hizo realidad
Aseguró Swartz que “el big data lo cambia todo”. No cambió la brillantez de los grandes de la literatura, pero sí el análisis para determinar su maestría. También cambió las dinámicas del mundo empresarial. Tecnológicas como Amazon y Netflix se han hecho grandes gracias a los datos. También gracias a los datos la española Telefónica gana puestos en el ranking global elaborando protocolos que permiten salvar vidas.
La estantería digital de Google Books contabiliza 130 millones de libros únicos
De acuerdo con el académico argentino, el big data ha logrado cumplir sueños milenarios como reunir todo el saber universal en una estantería. Así lo logró Google con su aplicación Google Books.
En el siglo III antes de Cristo, Ptolomeo I y su hijo Ptolomeo II consiguieron reunir hasta 900.000 obras diferentes en la Biblioteca de Alejandría. Toda una hazaña para la época, pero incomparable con lo que ha logrado Google en apenas un lustro. Desde que se propuso digitalizar todos los libros del mundo en 2005 hasta el último año del que vertió datos, 2010, contabilizó 130 millones de títulos únicos.
“Si se suman los caracteres de todos esos libros en un tipo de letra normal se podría ir y venir a la Luna hasta 10 veces”, dimensionó el científico. Una cantidad enorme de datos con la que el análisis literario tradicional avanza hacia una nueva dimensión. Porque, como sentenció Swartz: “No se trata de que el big data sustituya al análisis tradicional. Se trata de combinar metodologías para avanzar hasta donde no se había llegado antes”.
Los datos de la pintura y el lenguaje
Al igual que ocurrió en la literatura, esta tecnología es útil en materias como la pintura y el lenguaje. Indicó el científico en T+ que, por ejemplo, el estudio de la historia del arte ha obtenido nuevos matices. Ya se sabía que los lienzos, a medida que se avanzó hacia la modernidad, prescindían del ideal de belleza neoclásico para detenerse en figuras más abstractas.
Ahora esta evolución se ha precisado de forma matemática -y a una mayor velocidad que con los métodos tradicionales- al comparar los puntos de simetría con los sistemas de big data, sostuvo Swartz.
La evolución del lenguaje también ha adquirido nuevas dimensiones. Véase el caso de las cuestiones de género: “Hacia el año 1800 la palabra men aparecía con una frecuencia ocho veces superior a women. Hacia el 1900 se reduce a seis. Ya por los 80 tanto men como women aparecen la misma cantidad de veces. Por último, en el 2000 la palabra women adelanta a men”.
Por tanto, Gustavo Ariel Swartz concluye que: “Este análisis es obviamente impracticable si no se dispone de un corpus literario actualizado con grandes bases de datos y al mismo tiempo de las herramientas informáticas actualizadas”. Una afirmación que es válida para cualquiera de los anteriores ejemplos.