Proyecto VIBIDA: Visualización multimedia de big data

La presente herramienta para la visualización de datos de Administraciones locales ha sido desarrollada en el marco del proyecto Visualización multimedia de big data (VIBIDA), perteneciente a la convocatoria del año 2013 de Proyectos de investigación en el ámbito de las tecnologías de la información y las comunicaciones, del Gobierno de Aragón. El proyecto ha sido desarrollado por el Laboratorio Avanzado de Aplicaciones Jurídicas y Empresarial en la Sociedad de la Información de la Universidad de Zaragoza, situado en el Parque Tecnológico Walqa, de Huesca (labje.unizar.es). El equipo ha estado formado por José Félix Muñoz Soro, Carlos Serrano Cinca, Francisco Serón Arbeloa, Isabel Brusca Alijarde, José Luis Bermejo Latre, David Gracia Larrode y Guillermo Esteban Perez.

La herramienta, que se considera desarrollada a nivel de prototipo, permite la visualización de datos de las Administraciones locales españolas, a partir de ficheros en formato XBRL proporcionados por el Ministerio de Economía y Hacienda. Se pueden visualizar los datos disponibles hasta la fecha, que corresponden a 2010, 2011, 2012 y 2013 pero como se utiliza un formato estándar es posible incorporar nueva información de forma sencilla. El software es de uso libre y está licenciado bajo licencia Creative Commons reconocimiento v.3. Puede accederse al mismo y a la correspondiente documentación técnica en https://github.com/labje/vibida. Para ponerse en contacto con los desarrolladores del proyecto puede enviar un correo electrónico a jfm@unizar.es.

Formas de utilizar la página VIBIDA:

  1. Enlazar con vibida.unizar.es, pasando como parámetro el código de la entidad local en la propia URL de la web (ej. http://vibida.unizar.es/?50000DD00). En este caso en el selector de la cabecera aparece ya seleccionada la entidad.
  2. Reutilizar la aplicación. En este caso la entidad tiene una instancia de la aplicación que puede utilizar y modificar libremente. En particular, puede:
    1. Personalizar la página poniendo su escudo, colores institucionales, etc. Únicamente deben conservarse (aunque puede reducirse su tamaño) los logotipos del Ministerio y del Gobierno de Aragón, ya que son quienes han subvencionado el desarrollo.
    2. Incorporar los datos de la entidad mediante los ficheros LENLOC y PENLOC. Los datos del conjunto de las entidades de España podrán descargarse ya en formato adecuado, del sitio VIBIDA.
    3. Seleccionar que secciones y que indicadores quiere que se visualicen.

Un explicación más detallada de la reutilización de la aplicación viene detallada en el siguiente documento: Formas de utilizar la aplicación VIBIDA

En la herramienta se reflejan los tres ejes en torno a los cuales se ha articulado el proyecto VIBIDA y que son los siguientes:

Utilización de estándares basados en XBRL

El primer objetivo del proyecto es facilitar a las entidades locales los medios para que puedan crear con un coste mínimo una sección en su sede electrónica dedicada a la información financiera y contable. Para ello los datos se aportan utilizando ficheros en formato estándar generados por el programa de contabilidad.

Los estándares utilizados son dos taxonomías del XBRL (eXtensible Business Reporting Language), que es aceptado internacionalmente para el intercambio de información financiera. Las taxonomías utilizadas han sido definidas por la Secretaría General de Coordinación Autonómica y Local (SGCAL), de acuerdo con lo dispuesto en la Orden EHA 468/2007, y son PENLOC, que contiene los datos sobre los presupuestos, y LENLOC que contiene los correspondientes a las liquidaciones de los mismos. La información proporcionada de este modo a la ciudadanía podría ampliarse en su contenido y mejorarse en su frecuencia utilizando la taxonomía TRIMLOC, recientemente definida para los datos de las ejecuciones trimestrales.

Visualización de los datos

Un segundo objetivo del proyecto es conseguir una forma de visualización que resulte gráfica, fácil de interpretar y sinóptica. Para ello la herramienta se ha desarrollado siguiendo un formato de "cuadro de mando", mediante una única página web en la que se sintetiza toda la información. El usuario accede a la misma desplegando distintas partes de la página, y sin necesidad de navegar utilizando enlaces. Por otra parte, dentro de las acciones del proyecto se realizó un análisis exhaustivo de diferentes presentaciones gráficas para los datos, pero en las pruebas realizadas se llegó a la conclusión de que era mejor utilizar gráficos sencillos, como los que puede verse en la página, ya que resultaron los más eficaces para comunicar la información a la ciudadanía. Finalmente, algunos gráficos han sido enriquecidos con elementos adicionales. Por ejemplo, al profundizar en los gráficos "tree map" se muestran los pasos anteriores, para que el usuario pueda en todo momento visualizar el peso relativo de las distintas partidas.

Utilización de herramientas para datos masivos (big data)

El tercer objetivo del proyecto VIBIDA es explorar el uso de herramientas desarrolladas para el tratamiento masivo de datos en la visualización en tiempo real de estadísticas sobre datos financieros y contables de las entidades locales. Tras el análisis de diferentes posibilidades se decidió utilizar Google BigQuery. Entre los motivos para ello cabe destacar el que al tratarse de un servicio se encuentra disponible de forma inmediata, sin necesidad de realizar un costoso desarrollo previo. Este desarrollo, exigido por otras opciones, era inasumible con los recursos y plazos del proyecto y probablemente también lo sea para muchas entidades locales.

El prototipo permite comprobar la utilidad de las herramientas "big data" a la hora de permitir que los ciudadanos actúen de forma interactiva con grandes volúmenes de datos, sin que la información a la que acceden quede restringida a un conjunto de cálculos estadísticas y graficas previamente elaborados. La implementación realizada en el prototipo permite realizar el cálculo de la correlación de los distintos indicadores entre sí y con otros tres factores: la población, los ingresos y los gastos. Los datos de las más de 8000 entidades locales se almacenan en una única tabla, cuyo tamaño es de 4,30 GB y que contiene 20.920.102 filas. Con estas cifras, alguna de las combinaciones de criterios incluidas en el prototipo da lugar a tiempos de respuesta excesivos y la consulta puede arrojar como resultado un "time out". Por ello es preciso seguir avanzando, tanto en la utilización de herramientas más potentes como en la mejora de los algoritmos utilizados en los cálculos.