Archivo de la etiqueta: datos abiertos

Explotando la información disponible

Después de casi 6 años de trabajo con la apertura de datos públicos en la Junta de Castilla y León, hemos conseguido pasar de los 83 conjuntos de datos iniciales en 2012 a los más de 300 que tenemos actualmente.

Se trata de un proyecto vivo que aún tiene margen de mejora. Para acometer dichas mejoras, después de un profundo análisis interno, se identificaron cuestiones que deben y pueden ser abordadas a corto-medio plazo. Algunas de ellas son:

  1. Seguir incorporando nuevas fuentes de información al portal.
  2. Ofrecer herramientas de explotación de la información que se ofrece en formatos abiertos.
  3. Dar la posibilidad de consultar los conjuntos de datos mediante un API, de manera que se puedan recuperar datos concretos sin necesidad de la descargar la información completa.

Portal de análisis de datos de la junta de Castilla y LeónPara cubrir estos puntos hemos puesto en marcha un portal de análisis de datos basado en la tecnología Socrata, que ya utilizan grandes capitales de Estados Unidos (como Chicago, Nueva York o San Francisco, por citar sólo algunas).

Poder filtrar la información, hacer vistas, gráficos o cuadros de mando son funcionalidades que, junto con el API de consulta o la posibilidad de descargar los datos en diferentes formatos, aumentan las alternativas de uso de la información publicada.

Esta herramienta puede ser utilizada no sólo por ciudadanos y empresas sino también por el personal de la propia administración. Los propios gestores de los datos son, de hecho, los que mejor saben qué explotaciones de datos pueden aportar ideas o nuevas conclusiones al trabajo que ya se viene realizando.

En estas fechas estamos impartiendo formación sobre dicha herramienta a personal de nuestra propia organización: responsables de datos y personal informático. A partir de esta experiencia esperamos publicar nuevas visualizaciones en dicho portal y convocar nuevas sesiones formativas tanto para personal interno como externo a nuestra administración.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Datos Abiertos, ¿cuestión de volumen?

El valor de los datos publicados en una iniciativa de datos abiertos viene determinado por la siguiente ecuación:

Valor = (Cantidad x Calidad x Utilidad)

Estos tres factores determinan, en mi opinión (puede haber otros muchos criterios), el valor de la iniciativa. Son factores que multiplican el valor, no expresados como una suma. Esto es así porque es necesario que todos ellos sean tenidos en cuenta, y no que prestemos atención sólo a uno o dos de ellos.

La ecuación debe completarse con un último parámetro: El uso que se da a los datos puestos a disposición de los reutilizadores:

Valor= (Cantidad*Calidad*Utilidad)*Uso

Abrir los datos cuesta esfuerzo, y tener una iniciativa en la que no se reutilice su información supone desaprovecharlo.

Ejemplos de descarga de ficheros En este post me centraré en la cantidad. Al respecto, cualquier iniciativa de datos abiertos uno de los indicadores que se utilizan es el número de conjuntos de datos publicados. Sin lugar a dudas, es un dato interesante, pero no concluyente.

Creo importante destacar que, al hablar de cantidad, no debemos referirnos únicamente al número de datasets, ya que una misma información puede representarse en uno o múltiples datasets, y la variedad de la información también es importante.

Por ello, a la hora de hablar de cantidad de datos abiertos debemos valorar, al menos los que citaré a continuación. Y lo intentaré acompañar de un ejemplo ilustrativo:

  1. Tipos de información diferentes: Describen realidades distintas con estructuras de datos diferentes. Explotaciones ganaderas, superficies de cultivo o grupos de acción local son diferentes tipos de información. Permisos de pesca en 2007 y permisos de pesca en 2008 son el mismo tipo de información, aun cuando se presenten en diferentes datasets.
  2. Número de registros: Cuántos elementos describe el dataset (serían las filas si lo vemos como un Excel). No es lo mismo que publiquemos datos de calidad del aire desde el año 2017 que lo hagamos desde el año 1997. O que se publique la información de tráfico sólo de las autovías en lugar de ofrecer datos de todo tipo de carreteras.
  3. Detalle de la información: Con qué detalle está descrito cada registro (serían las columnas del Excel). Impacta también en la calidad del dataset. Si hablamos de calidad del aire podemos hablar de cinco tipos de contaminantes para cada muestra, o de veinte tipos.

Según el documento The National Information Infrastructure (NII): Why, What and How, “Datasets should always be made available for bulk download, even in cases where APIs are developed.”, es decir, siempre debe permitirse la descarga de toda la Información en bloque, aun cuando haya un API disponible.

Bajo nuestro punto de vista, siempre que los ficheros sean manejables (no excedan cientos de MBytes) optamos por ofrecer la descarga de toda la información en un único fichero. Por ejemplo, las Superficies de cultivos municipales es un fichero en CSV que actualmente ocupa 16,2 MB, y ofrece 188.748 registros de información sobre cuántas hectáreas de cultivo secano y regadío hay en cada municipio de Castilla y León desde el año 2010.

Podríamos ofrecer un dataset por cada provincia (9 en Castilla y León) y por cada año (actualmente hasta 2015) y así tendríamos 54 datasets en lugar de uno solo. No podemos afirmar que sea una mala decisión (los reutilizadores podrán juzgarlo mejor) pero sí puede servir como ejemplo para demostrar que no siempre mayor número de datasets es sinónimo de más información.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Ganadores del II Concurso de Datos Abiertos

Entrada_Blog_Premiados_vIAyer martes 25 de marzo tuvo lugar el evento de entrega de los premios correspondientes al II Concurso de Datos Abiertos.

Los ganadores correspondientes a las tres categorías escogidos entre las 17 Candidaturas presentadas han sido:

  • Mejor proyecto realizado por estudiantes matriculados en el curso 2013-2014 o 2014-2015 al proyecto Empleo JCYL. Pablo Mario García Pérez, Roberto Vélez Gamboa son los dos estudiantes del IES Virgen del Espino de Soria que han desarrollado esta web que presenta un buscador de ofertas de empleo y la geolocalización de las oficinas de empleo de Castilla y León, utilizando sendos conjuntos de datos. Se ha premiado por la utilidad que tiene, la cantidad de público destinatario así como el valor añadido que aporta.
  • Mejor aplicación para dispositivos móviles al proyecto Vehículo eléctrico CyL. Realizada por Néstor Mohíno García, del Centro de Enseñanza Gregorio Fernández, se trata de una aplicación móvil para dispositivos Windows Phone que facilita a los usuarios de coches y motos eléctricas encontrar puntos de recarga aptos para sus vehículos en toda la comunidad autónoma. Con el uso de los conjuntos de datos de puntos de recarga se premió por la facilidad de uso y claridad en el diseño, junto con su rapidez.
  • Mejor aplicación web, desarrollo tecnológico, trabajo de periodismo de datos, informe o estudio al proyecto Conquista Castilla y León. Se trata de una web con diseño adaptativo realizada por Juan Carlos Ballesteros Hermida y Alberto Sacristán de Francisco que consiste en un juego multijugador en el que el objetivo es conquistar el mayor número de municipios de Castilla y León. Destaca su originalidad, creatividad y carácter innovador, además de la calidad del proyecto, buscando aunar el entretenimiento y el conocimiento de Castilla y León gracias al uso del conjunto de datos de municipios de Castilla y León

Además, la candidatura “cyljob – Portal de datos de empleo de Castilla y León” ha recibido una Mención Especial. Se trata de una web realizada por Javier Gamara Olmedo, Mario de Frutos Dieguez, Jorge Maroto García, Alvaro García Loaisa y Rodrigo Maroto Merino. Destaca por haber sabido combinar en su proyecto trabajos de búsqueda de información, representación gráfica y análisis de resultados relacionados con el empleo.

En definitiva, proyectos realizados por grupos de trabajo de diferentes perfiles, utilizando múltiples tecnologías y con objetivos diversos que dan idea de las posibilidades de los Datos Abiertos.

Podéis ver en diferido el acto de entrega de premios en el canal de Youtube de la Junta de Castilla y León.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Entrega de premios del II Concurso de Datos Abiertos

cartel_datosAbiertos_2014_medioEl martes 24 de marzo se celebrará el evento de entrega de premios correspondientes al II Concurso de Datos Abiertos de la Comunidad de Castilla y León. El evento se celebrará en la sala Fray Pío del Monasterio del Prado, sede de las Consejerías de Cultura y Turismo y la de Educación, y dará comienzo a las 18:00.

La dirección es: Avda. Monasterio de Nuestra Señora de Prado, s/n. – C.P.: 47014 – Valladolid (Valladolid).

El acceso al evento es libre (se ruega confirmación de asistencia a la dirección concursodatosabiertos@jcyl.es) y se emitirá en streaming a través del portal de Datos Abiertos de la Junta de Castilla y León.

Entre las candidaturas presentadas, se darán a conocer a los ganadores en el propio evento, que contará con la presencia de los miembros del jurado.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Colaboración en líneas de trabajo de datos abiertos

logo_ea_2015El pasado 26 de febrero se celebró en Madrid el Encuentro Aporta 2015. Aprovechando la asistencia de bastantes representantes de administraciones públicas, por la tarde se celebró reunión informal, a propuesta de la Junta de Castilla y León.

A la misma asistieron representantes de una docena de organismos, teniendo en cuenta que otras tantas habían mostrado su interés en las conclusiones del encuentro.

Todas las administraciones presentes mostraron su interés en colaborar en avanzar de forma conjunta en los proyectos Open Data de manera que, a partir de la reunión, se han planteado las siguientes líneas de trabajo:

  1. Cómo establecer un Plan de Datos Abiertos y realizar la Gestión del cambio
  2. Alternativas de modelos tecnológicos
  3. Conjuntos de datos a exportar de manera homogénea
  4. Uso de vocabularios comunes entre todas las administraciones
  5. Reutilizadores: Identificación, dinamización y medición de impacto
  6. Iniciativas internacionales

Cualquier administración pública podrá ser incluida en las listas de distribución (generadas por Red.es) que se crearán para cada línea de trabajo, pudiendo además ser dinamizadores de las mismas.

Desde la Junta de Castilla y León hemos mostrado ya nuestro interés en participar en todas ellas, y esperamos que sean muchas las administraciones que se sumen.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Semanas de gran actividad en Datos Abiertos

Esta semana viene cargada de noticias relacionadas con Datos Abiertos.

En primer lugar, la Junta de Castilla y León ha recibido el premio de la Open Knowledge Foundation (OKFN) como Mejor iniciativa pública de Open data con implicación de la ciudadanía, gracias a su Concurso de Datos Abiertos. Estos premios, en su segunda edición, se entregarán en las próximas fechas.

Logo del OKFN AWARD

Por otro lado, recientemente se han incorporado al catálogo de datos nuevos conjuntos de datos en materia de bioenergía y se han aplicado mejoras a conjuntos de datos de turismo, atendiendo peticiones de reutilizadores. Junto a ellos, es importante destacar que los resultados electorales desde 1983 están disponibles en datos abiertos.

Finalmente, mañana jueves se celebra en Madrid el Encuentro Aporta 2015 que, al igual que en años anteriores, congregará a gran parte de la comunidad Open Data española y en la que esperamos aprender y aumentar la colaboración entre las administraciones.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Modelo tecnológico de Datos Abiertos

Portal de Datos Abierto de la Junta de Castilla y LeónCasi tres años después de la puesta en marcha del portal de datos abiertos de la Junta de Castilla y León pensamos que es un buen momento para analizar el modelo de trabajo que estamos llevando a cabo.

Nuestro portal está alojado en la plataforma corporativa de gestión de contenidos, junto a otros 60 portales. Nos permite una cómoda gestión de los datasets disponibles, con URLs persistentes, y la publicación del propio catálogo en datos abiertos, que se encuentra federado con el portal datos.gob.es.

Ahora bien, los conjuntos de datos provienen de múltiples fuentes de información como son la propia plataforma de gestión de contenidos, ficheros subidos al servidor y base de datos de información geográfica.

Ahora bien, existe mucha información alojada en diversas bases de datos de información sectorial de cada una de las consejerías. Cada uno de los servicios de informática exportan la información a ficheros (generalmente CSV) que se actualizan periódicamente, todo de forma automática.

¿Cómo podemos ofrecer un mejor servicio a los reutilizadores aumentando la eficiencia de nuestra propia administración?

El primer paso que vamos a dar es preguntar a otras administraciones cómo están trabajando, a qué problemas se han enfrentado y cómo los han abordado, para poder aprender de ellos y tomar la mejor decisión en nuestro proyecto.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Candidaturas presentadas al II Concurso de Datos Abiertos

candidaturasUna vez finalizado el plazo de presentación de candidaturas para el II Concurso de Datos Abiertos de la Comunidad de Castilla y León, se han presentado 17 proyectos.

En esta segunda edición las candidaturas presentadas por estudiantes han sido mayoría con un total de 11. Podrán optar tanto a la categoría de estudiantes como a las otras dos. 5 han sido las aplicaciones creadas para dispositivos móviles mientras que 12 corresponden a portales web.

Algunos de ellos han utilizado conjuntos de datos que han sido publicados desde la anterior convocatoria del concurso, como son la agenda cultural, los equipamientos en los espacios naturales o conjuntos de datos en materia de empleo.

El jurado se reunirá en las próximas fechas para determinar los ganadores del concurso.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Comunicación y apertura de datos sobre incendios forestales

La lucha contra los incendios forestales es, sin duda, uno de los principales temas de gestión e información de una Administración autonómica. Este año, la Junta de Castilla y León ha desarrollado varias iniciativas sobre esta materia con el objetivo de ampliar la apertura de datos, la transparencia y la información de servicio público. Es un trabajo importante que se sustenta en el verdaderamente determinante y esencial: el que a diario realiza el operativo contra lucha de incendios en Castilla y León, que conforman más de 4.100 profesionales.

Desde el pasado 1 de julio, el Portal de Comunicación del Gobierno autonómico publica dos veces al día sendos partes informativos con datos actualizados sobre la localización, el estado, la evolución de los incendios forestales y el detalle de medios de cada uno de los operativos puestos en marcha, dentro del epígrafe ‘Incendios forestales’. Además, este nuevo apartado informativo del Portal de Comunicación incorpora un glosario de términos que facilita la interpretación de los datos aportados, que la Junta de Castilla y León comparte con medios de comunicación y ciudadanos.

Incendios

La implicación del Gobierno de la Comunidad con la apertura de datos referentes a incendios forestales no es nueva. De hecho, la Junta de Castilla y León viene colaborando y respondiendo a peticiones de acceso a la información, como ha sido el caso de tuderechoasaber.es o de la iniciativa España en llamas

Continuando la línea de trabajo de Gobierno Abierto y el acceso a la información ya mencionado, merece la pena incidir en el propósito de esta Administración de que los reutilizadores de datos puedan desarrollar diversos proyectos a partir de un conjunto de datos con la información actualizada sobre incendios forestales

El dataset ofrecido inicialmente puede ampliarse, perfeccionarse, y por ello estamos abiertos a recibir sugerencias para alinearlo lo mejor posible con sus necesidades.

¿Alguien se anima a reutilizarlo?

Alejandro Salgado Losada
Director general de la Oficina del Portavoz y Relaciones con los Medios

Nueva versión del portal de Datos Abiertos

El portal de datos abiertos www.datosabiertos.jcyl.es es, al igual que ocurre con iniciativas en otras Administraciones Públicas nacionales e internacionales, el escaparate que nos sirve para ofrecer conjuntos de datos a todo aquel que pueda estar interesado.

En estos dos años que han transcurrido desde de la puesta en marcha del portal hemos participado u organizado diferentes eventos presenciales de difusión de datos abiertos en general y de nuestra iniciativa en particular:

La Revolución de los Datos, ediciones 2012 y 2013 en la Universidad de Valladolid; I         Vallahackathon; la Jornada “Generando riqueza con «Datos Abiertos»; el Congreso Internacional de Gobierno Abierto en Valencia; Encuentro APORTA 2014 o la charla         “Open Data: Retos y oportunidades” en la Facultad de informática de la Universidad de Valladolid.

Estos eventos, junto con el I Concurso de Datos Abiertos de Castilla y León , nos han permitido identificar y ponernos en contacto con reutilizadores o potenciales usuarios de nuestros datasets.

Ahora bien, lo cierto es que las peticiones de apertura de datos o el envío de dudas y sugerencias a través del portal han sido más bien escasas. Teniendo en cuenta que el portal no debe ser un canal unidireccional sino también un punto de contacto con los reutilizadores hemos lanzado una nueva versión de www.datosabiertos.jcyl.es.

Datos_Slider_Micro_VFREB

 

En la misma hemos simplificado sus apartados y potenciado, además del catálogo de datos y las aplicaciones, los puntos de contacto para solicitar nuevos datasets y de difusión de aplicaciones.

¿Qué te parece el nuevo portal? ¿Qué cambiaríais?

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia