Analizando la actividad fallera con Buscafallas

buscafallas análisis actividad twitter zona influencia fallasLas redes sociales se están convirtiendo en una herramienta válida para medir el pulso de las ciudades. En este caso, para poner en práctica los resultados de nuestra investigación en el GTI-IA, hemos elaborado una herramienta que permite mostrar la actividad en la zona de influencia de cada una de las más de 300 fallas que se han plantado en Valencia en el 2015 desde buscafallas.com.

Los datos que usa son los tuits y las fotos geoetiquetadas que se publican en la ciudad. El problema es que apenas el 1% de los usuarios de las redes sociales activan esta característica, especialmente por cuestiones de privacidad (yo mismo no suelo tenerlo activo). El acceso a la información se realiza mediante el API público para los desarrolladores de Twitter y los desarrolladores de Instagram, junto con los datos públicos que el Ayuntamiento de Valencia proporciona a través de su iniciativa Valencia datos abiertos.

Una vez que conocemos las coordenadas de cada falla, podemos calcular su área de influencia. De mbuscafallas_etiquetasomento, no estamos teniendo en cuenta la sección a la que pertenece la falla y las consideramos iguales a la hora de calcular este área. Una vez calculada, podemos determinar cuántos  usuarios activos hay en la zona de influencia de la falla. El mapa se colorea atendiendo a la densidad y marca la cantidad de mensajes de cada zona. Se permiten dos formas de interpretar los datos: por número de usuarios o por actividad total. Si usamos los autores únicos, es decir, considerando solo un tuit/foto por usuario, puede estimarse cuánta gente hay cerca de la falla. Si tenemos en cuenta la actividad general, se puede determinar en qué parte de la ciudad está ocurriendo una actividad relevante (por ejemplo, la mascletà en la Plaza del Ayuntamiento). El usuario puede elegir qué información ver con los botones de la parte superior, a la izquierda. Además, pinchando sobre la falla, pueden verse las etiquetas que la gente está usando en la zona de influencia de la falla, para que sepas de qué se está hablando alrededor de cada una de ellas. Los botones de la parte inferior muestran un ranking de las fallas que están teniendo en este momento más actividad (las últimas 2 horas) y las etiquetas más utilizadas en general en toda la ciudad.

buscafallas_pasacallesLa web tiene una segunda utilidad: los pasacalles falleros. Hemos creado una aplicación (gratuita, buscafallas está disponible en Google Play) con el que las fallas pueden dar a conocer su posición en tiempo real. Esta información se envía a Buscafallas y desde la web de buscafallas cualquier persona puede ver el recorrido que están haciendo. Puedes usarla para pasacalles, la Ofrenda, la despertà, cabalgatas… Para activarla, necesitas el nombre de usuario y la contraseña de tu falla. Si no la tienes, puedes contactar con nosotros enviando un correo electrónico a gtiia@dsic.upv.es  Ten en cuenta que la precisión del GPS puede no ser buena en calles estrechas y no funciona en el interior de los edificios.

Cuando acaben las Fallas, completaremos la información cuando estudiemos los datos con técnicas de análisis de redes sociales. Quien sabe, a lo mejor somos capaces de predecir qué falla va a ganar el primer premio, como ocurrió con la predicción de Ben Zauzmer sobre los Óscar 2015 ;-)

Algunos detalles técnicos: toda la información que recopilamos, está almacenada en una base de datos creada con MongoDB y para la visualización de los mapas estamos usando Leaflet. La primera opción fue intentarlo con CartoDB, pero tuvimos muchos problemas para configurarlo en nuestro propio servidor, así que al final lo descartamos.

El mérito de todo esto es de Javier Palanca y Elena del Val, que han sido los que han hecho que este proyecto pase del papel a una aplicación real.

Probando RDFaCE

Buscando herramientas para la asignatura Diseño de Ontologías, hemos dado con RDFaCE. Se trata de un editor que permite anotar semánticamente los contenidos de una web. En concreto, lo que estoy probando es un plugin de WordPress que añade al editor un par de botones para marcar y etiquetar palabras o frases de lo que estás escribiendo en el blog, que quedan integradas en el código HTML que se genera.

¿Que para qué sirve esto? Bueno, básicamente, consigues que una máquina pueda extraer mejor información sobre lo que estás escribiendo. Las etiquetas que se incluyen permiten identificar personas, organizaciones y lugares, con el mismo formato que emplea, por ejemplo, el New York Times.

De esta manera, si yo digo que me llamo Miguel Rebollo, que vivo en Valencia y que soy profesor de la Universidad Politécnica de Valencia, puedo usar este editor para marcar las palabras que corresponden a una persona, a un lugar o a una organización, y rellenar información adicional a través de un formulario.

Y si luego le paso el enlace del post al Google Structured Data Testing Tool, verás cómo detecta la información que contiene la página. Es decir, estoy convirtiendo el bla, bla, bla que para un ordenador es el contenido de una página web, en algo que tiene significado y del que puede extraer información estructurada. Por ejemplo, este es un fragmento del resultado de lo que ve Google de este post

Si quieres, puedes consultar el resultado completo del análisis semántico de este post, o también el resultado de una noticia del NY Times (hoy, referencia obligada a la tormenta).

Otra cosa es que sea capaz de marcar automáticamente el contenido. Es decir, que si yo vuelvo a escribir Valencia, me lo marque como lugar sin que yo tenga que repetir todo el proceso cada vez. Pero bueno, démosle tiempo, que esto acaba de empezar.