- Los científicos han creado a Storywrangler, herramienta en línea que recopila frases en 150 idiomas diferentes, escanea 150-mil millones de twitters y publicaciones en redes.
- Creado por ocho científicos, se adelanta al futuro y ofrece una vista minuto a minuto sin precedentes de movimientos políticos y enfermedades emergentes, hasta el K-pop.
Burlington, EE.UU.– Los científicos han inventado un instrumento para mirar en profundidad miles de millones de publicaciones de Twitter, proporcionando una vista minuto a minuto sin precedentes de la popularidad, desde los movimientos políticos emergentes hasta el K-pop y las enfermedades emergentes. La herramienta, llamada Storywrangler, recopila frases en 150 idiomas diferentes, analizando el auge y la caída de ideas e historias, cada día, entre personas de todo el mundo. Storywrangler cuantifica la atención colectiva.
Durante miles de años, las personas miraron el cielo nocturno a simple vista y contaron historias sobre las pocas estrellas visibles. Luego inventamos los telescopios. En 1840, el filósofo Thomas Carlyle afirmó que «la historia del mundo no es más que la biografía de grandes hombres». Luego comenzamos a publicar en Twitter.
Ahora los científicos han inventado un instrumento para mirar en profundidad los miles de millones de publicaciones realizadas en Twitter desde 2008, y han comenzado a descubrir la vasta galaxia de historias que contienen.
«Lo llamamos Storywrangler», dice Thayer Alshaabi, un estudiante de doctorado en la Universidad de Vermont que codirigió la nueva investigación. «Es como un telescopio para mirar, en tiempo real, todos estos datos que la gente comparte en las redes sociales. Esperamos que la gente los use ellos mismos, de la misma manera que usted puede mirar las estrellas y hacer sus propias preguntas.»
La nueva herramienta puede brindar una visión sin precedentes, minuto a minuto, de la popularidad, desde los movimientos políticos en ascenso hasta los fracasos de taquilla; desde el asombroso éxito del K-pop hasta las señales de nuevas enfermedades emergentes.
La historia de Storywrangler, una selección y análisis de más de 150 mil millones de tweets, y algunos de sus hallazgos clave se publicaron el 16 de julio en la revista Science Advances.
Expresiones de las muchas
El equipo de ocho científicos que inventó Storywrangler, de la Universidad de Vermont, Charles River Analytics y MassMutual Data Science, reúne alrededor del diez por ciento de todos los tweets realizados todos los días en todo el mundo. Para cada día, dividen estos tweets en bits individuales, así como en pares y tríos, generando frecuencias de más de un billón de palabras, hashtags, identificadores, símbolos y emoji, como «Super Bowl», «Black Lives Matter», «gravitacional», olas «» #metoo “coronavirus» y «dieta cetogénica».
«Esta es la primera herramienta de visualización que le permite ver frases de una, dos y tres palabras, en 150 idiomas diferentes, desde el inicio de Twitter hasta el presente», dice Jane Adams, coautora de la nuevo estudio que recientemente terminó un puesto de tres años como artista residente de visualización de datos en el Centro de Sistemas Complejos de UVM.
La herramienta en línea, impulsada por la supercomputadora de UVM en Vermont Advanced Computing Core, proporciona una lente poderosa para ver y analizar el aumento y la disminución de palabras, ideas e historias cada día entre personas de todo el mundo. «Es importante porque muestra los principales discursos a medida que ocurren», dice Adams.
«Es cuantificar la atención colectiva». Aunque Twitter no representa a toda la humanidad, es utilizado por un grupo muy grande y diverso de personas, lo que significa que «codifica la popularidad y la difusión», escriben los científicos, dando una visión novedosa del discurso no solo de las personas famosas como figuras políticas y celebridades, pero también las «expresiones de la mayoría» diarias, señala el equipo.
En una prueba sorprendente del vasto conjunto de datos en Storywrangler, el equipo demostró que podría usarse para predecir potencialmente turbulencias políticas y financieras. Examinaron el cambio porcentual en el uso de las palabras «rebelión» y «represión» en varias regiones del mundo. Descubrieron que el aumento y la caída de estos términos se asociaron significativamente con el cambio en un índice bien establecido de riesgo geopolítico para esos mismos lugares.
¿Lo que está sucediendo?
La historia global que ahora se escribe en las redes sociales trae miles de millones de voces – comentando y compartiendo, quejándose y atacando – y, en todos los casos, grabando – sobre guerras mundiales, gatos raros, movimientos políticos, música nueva, qué hay para cenar, enfermedades mortales, estrellas favoritas del fútbol, esperanzas religiosas y chistes sucios.
«El Storywrangler nos brinda una forma basada en datos de indexar lo que la gente común está hablando en las conversaciones cotidianas, no solo lo que los reporteros o autores han elegido; no se trata solo de las élites educadas, ricas o culturales», dice el matemático aplicado Chris Danforth, profesor de la Universidad de Vermont que codirigió la creación del StoryWrangler con su colega Peter Dodds. Juntos, dirigen el Laboratorio de historias computacionales de UVM.
«Esto es parte de la evolución de la ciencia», dice Dodds, experto en sistemas complejos y profesor del Departamento de Ciencias de la Computación de la UVM. «Esta herramienta puede permitir nuevos enfoques en el periodismo, formas poderosas de ver el procesamiento del lenguaje natural y el desarrollo de la historia computacional».
Durante siglos se ha debatido cuánto influyen unas pocas personas poderosas en el curso de los acontecimientos. Pero, ciertamente, si supiéramos lo que todos los campesinos, soldados, comerciantes, enfermeras y adolescentes dijeron durante la Revolución Francesa, tendríamos un conjunto de historias muy diferentes sobre el ascenso y el reinado de Napoleón. «Aquí está la pregunta profunda», dice Dodds, «¿qué pasó? ¿Qué pasó realmente?»
Sensor global
El equipo de UVM, con el apoyo de la National Science Foundation, está utilizando Twitter para demostrar cómo la charla en las redes sociales distribuidas puede actuar como una especie de sistema de sensores global: de lo que sucedió, cómo reaccionó la gente y lo que podría suceder después.
Pero otros flujos de redes sociales, desde Reddit hasta 4chan y Weibo, en teoría, también podrían usarse para alimentar Storywrangler o dispositivos similares: rastreando la reacción a los principales eventos noticiosos y desastres naturales; seguir la fama y el destino de los líderes políticos y las estrellas del deporte; y abrir una visión de la conversación informal que puede proporcionar información sobre las dinámicas que van desde el racismo hasta el empleo, las amenazas emergentes para la salud y los nuevos memes.
En el nuevo estudio Science Advances , el equipo presenta una muestra del visor en línea de Storywrangler, con tres eventos globales destacados: la muerte del general iraní Qasem Soleimani; el comienzo de la pandemia COVID-19; y las protestas de Black Lives Matter tras el asesinato de George Floyd por la policía de Minneapolis. El conjunto de datos de Storywrangler registra un aumento repentino de tweets y retweets usando el término «Soleimani» el 3 de enero de 2020, cuando Estados Unidos asesinó al general.
Además, el fuerte aumento del «coronavirus» y el emoji del virus durante la primavera de 2020 a medida que se propaga la enfermedad; y una explosión de uso del hashtag «#BlackLivesMatter» el 25 de mayo de 2020, el día en que George Floyd fue asesinado. «Hay un hashtag que se está inventando mientras hablo en este momento», dice Chris Danforth de UVM. «No sabíamos buscar eso ayer, pero aparecerá en los datos y se convertirá en parte de la historia».