Archivo de la categoría: Datos Abiertos

Explotando la información disponible

Después de casi 6 años de trabajo con la apertura de datos públicos en la Junta de Castilla y León, hemos conseguido pasar de los 83 conjuntos de datos iniciales en 2012 a los más de 300 que tenemos actualmente.

Se trata de un proyecto vivo que aún tiene margen de mejora. Para acometer dichas mejoras, después de un profundo análisis interno, se identificaron cuestiones que deben y pueden ser abordadas a corto-medio plazo. Algunas de ellas son:

  1. Seguir incorporando nuevas fuentes de información al portal.
  2. Ofrecer herramientas de explotación de la información que se ofrece en formatos abiertos.
  3. Dar la posibilidad de consultar los conjuntos de datos mediante un API, de manera que se puedan recuperar datos concretos sin necesidad de la descargar la información completa.

Portal de análisis de datos de la junta de Castilla y LeónPara cubrir estos puntos hemos puesto en marcha un portal de análisis de datos basado en la tecnología Socrata, que ya utilizan grandes capitales de Estados Unidos (como Chicago, Nueva York o San Francisco, por citar sólo algunas).

Poder filtrar la información, hacer vistas, gráficos o cuadros de mando son funcionalidades que, junto con el API de consulta o la posibilidad de descargar los datos en diferentes formatos, aumentan las alternativas de uso de la información publicada.

Esta herramienta puede ser utilizada no sólo por ciudadanos y empresas sino también por el personal de la propia administración. Los propios gestores de los datos son, de hecho, los que mejor saben qué explotaciones de datos pueden aportar ideas o nuevas conclusiones al trabajo que ya se viene realizando.

En estas fechas estamos impartiendo formación sobre dicha herramienta a personal de nuestra propia organización: responsables de datos y personal informático. A partir de esta experiencia esperamos publicar nuevas visualizaciones en dicho portal y convocar nuevas sesiones formativas tanto para personal interno como externo a nuestra administración.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Datos Abiertos, ¿cuestión de volumen?

El valor de los datos publicados en una iniciativa de datos abiertos viene determinado por la siguiente ecuación:

Valor = (Cantidad x Calidad x Utilidad)

Estos tres factores determinan, en mi opinión (puede haber otros muchos criterios), el valor de la iniciativa. Son factores que multiplican el valor, no expresados como una suma. Esto es así porque es necesario que todos ellos sean tenidos en cuenta, y no que prestemos atención sólo a uno o dos de ellos.

La ecuación debe completarse con un último parámetro: El uso que se da a los datos puestos a disposición de los reutilizadores:

Valor= (Cantidad*Calidad*Utilidad)*Uso

Abrir los datos cuesta esfuerzo, y tener una iniciativa en la que no se reutilice su información supone desaprovecharlo.

Ejemplos de descarga de ficheros En este post me centraré en la cantidad. Al respecto, cualquier iniciativa de datos abiertos uno de los indicadores que se utilizan es el número de conjuntos de datos publicados. Sin lugar a dudas, es un dato interesante, pero no concluyente.

Creo importante destacar que, al hablar de cantidad, no debemos referirnos únicamente al número de datasets, ya que una misma información puede representarse en uno o múltiples datasets, y la variedad de la información también es importante.

Por ello, a la hora de hablar de cantidad de datos abiertos debemos valorar, al menos los que citaré a continuación. Y lo intentaré acompañar de un ejemplo ilustrativo:

  1. Tipos de información diferentes: Describen realidades distintas con estructuras de datos diferentes. Explotaciones ganaderas, superficies de cultivo o grupos de acción local son diferentes tipos de información. Permisos de pesca en 2007 y permisos de pesca en 2008 son el mismo tipo de información, aun cuando se presenten en diferentes datasets.
  2. Número de registros: Cuántos elementos describe el dataset (serían las filas si lo vemos como un Excel). No es lo mismo que publiquemos datos de calidad del aire desde el año 2017 que lo hagamos desde el año 1997. O que se publique la información de tráfico sólo de las autovías en lugar de ofrecer datos de todo tipo de carreteras.
  3. Detalle de la información: Con qué detalle está descrito cada registro (serían las columnas del Excel). Impacta también en la calidad del dataset. Si hablamos de calidad del aire podemos hablar de cinco tipos de contaminantes para cada muestra, o de veinte tipos.

Según el documento The National Information Infrastructure (NII): Why, What and How, “Datasets should always be made available for bulk download, even in cases where APIs are developed.”, es decir, siempre debe permitirse la descarga de toda la Información en bloque, aun cuando haya un API disponible.

Bajo nuestro punto de vista, siempre que los ficheros sean manejables (no excedan cientos de MBytes) optamos por ofrecer la descarga de toda la información en un único fichero. Por ejemplo, las Superficies de cultivos municipales es un fichero en CSV que actualmente ocupa 16,2 MB, y ofrece 188.748 registros de información sobre cuántas hectáreas de cultivo secano y regadío hay en cada municipio de Castilla y León desde el año 2010.

Podríamos ofrecer un dataset por cada provincia (9 en Castilla y León) y por cada año (actualmente hasta 2015) y así tendríamos 54 datasets en lugar de uno solo. No podemos afirmar que sea una mala decisión (los reutilizadores podrán juzgarlo mejor) pero sí puede servir como ejemplo para demostrar que no siempre mayor número de datasets es sinónimo de más información.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Desafío APORTA

infografia_i-desafio-aporta2La iniciativa estatal de impulso de datos abiertos, datos.gob.es, ha lanzado el Desafío Aporta 2017: El valor del dato para la Administración.

Se trata de una gran oportunidad para demostrar el potencial que los datos abiertos tienen para la mejora de las administraciones públicas.

El Desafío se desarrolla en dos fases. La primera, destinada a recoger ideas originales, con el único condicionante de tener que utilizar datos públicos en portales de datos abiertos nacionales o internacionales.

Las diez mejores ideas pasarán a la fase final que consistirá en realizar un prototipo junto con una exposición presencial.

El plazo para presentación de ideas concluye el día 9 de Junio de 2017.

Os animamos a participar, pudiendo hacer uso de los datos publicados en el portal de datos abiertos de la Junta de Castilla y León.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Participación en Congreso CNIS

Cartel CNIS 2017Los días 22 y 23 de febrero se ha celebrado el VII Congreso Nacional de Innovación y Servicios Públicos, CNIS 2017. Dentro de un amplio programa de conferencias, la Junta de Castilla y León ha tenido la oportunidad de exponer los mayores avances en materia de reutilización en nuestro ámbito, además de los mayores retos/problemas a los que tenemos que hacer frente las Administraciones para favorecer la reutilización.

La Junta de Castilla y León puso en marcha su portal de datos abiertos hace 5 años. A la hora de poner en marcha una iniciativa de este tipo, hay una serie de puntos que deben ser tenidos en cuenta:

  1. Debe haber un compromiso político en la institución. En su momento, se aprobó el Acuerdo 17/2012, de 8 de marzo, de la Junta de Castilla y León, por el que se pone en marcha el Modelo de Gobierno Abierto de la Junta de Castilla y León Esto supuso que el proyecto se considerara como estratégico.
  2. Por otro lado, no tiene sentido hablar de un proyecto de reutilización en el que se implique sólo a parte de la organización. Por ello, la apertura de información supuso la implicación de todas las Consejerías, siendo transversal a toda la organización.
  3. Pero no basta con el impulso desde arriba, sino que los empleados públicos encargados tanto de gestionar la información como de los sistemas informáticos que la soportan deben conocer el porqué y el para qué. De esta forma, la realización de sesiones formativas para gestores de información y personal informático es la base sobre la que se asienta el trabajo.
  4. La plataforma informática escogida debe poder cumplir los requisitos de un portal open data. Nosotros utilizamos nuestra herramienta de gestión de portales, pero somos conscientes de que en cada situación la solución puede cambiar, por ejemplo con soluciones tipo CKAN. En todo caso, es preciso hacer un análisis previo de qué plataforma se adecúa mejor a nuestra situación.

Una vez puesto en marcha, debemos ser conscientes de que debe tratarse de una iniciativa que debe ser sostenible en el tiempo. Los mecanismos de exportación de conjuntos de datos y la gestión de un portal con cada vez más datasets debe ser resistente a cambios de estructura o de recursos. Es preciso indicar claramente qué conjuntos de datos, por su naturaleza y frecuencia de actualización, requieren de procesos automáticos para su exportación. Sólo en aquellos casos de actualización poco frecuente, y debidamente controlados, la actualización debería ser manual.

La dinamización y difusión de la iniciativa es fundamental. De otra forma, podremos tener un gran portal con muy poco uso. En nuestro caso, las dos ediciones del Concurso de Datos Abiertos, con 50 proyectos entre ambas, nos han servido para difundir nuestra iniciativa, poder ver ejemplos útiles e innovadores de uso de nuestros datos, recibir feedback de los reutilizadores además de ir generando una mayor cultura de reutilización en nuestra comunidad.

Desde la puesta en producción con 83 datasets hemos mantenido vivo el proyecto llegando a los más de 300 (317) actuales.

Entre los principales retos y problemas a los que nos enfrentamos están:

  1. Buena parte de las fuentes de información se crearon hace años, antes de que estuviera sobre la mesa los conceptos de reutilización y open data. Por ello, debemos ser conscientes de que abordar su apertura de datos implica un esfuerzo del personal de la organización. Esfuerzo tanto de los gestores de la información como del personal informático, que no está sobrado de recursos y con mucha demanda de proyectos.
    1. Aunque buena parte del personal de la organización ya conoce los datos abiertos, compensa hacer una labor de sensibilización, reforzando las ventajas de abrir datos. De esta forma, la colaboración será mucho más fluida.
    2. Al personal informático, intentar dar los requisitos lo más claros posibles, para que el esfuerzo se minimice.
    3. Por último, y no menos importante, buscar fórmulas para que el personal interno vea en ellos mismos los beneficios de la apertura de datos. Por eso estamos trabajando en poner en breve en marcha una herramienta de explotación y visualización de los datos que hay en nuestro portal.
  2. Otro de los problemas es poder identificar claramente quién está utilizando nuestros datos. Podemos tener estadísticas, contactos más o menos puntuales para pedir más información, pero las estadísticas de Google Analytics no son suficientes (no sabemos si un dataset se descarga 100 veces por una persona o 1 vez por 100 personas).
  3. También es necesaria una mayor colaboración con los reutilizadores. Iniciativas como el concurso de datos abiertos permiten aumentar dicha colaboración, pero no es menos cierto que la demanda de nuevos conjuntos de datos aún es escasa. En esta línea, que debemos potenciar, el trabajo qué sí que podemos hacer y estamos haciendo, es sacar a la luz todas las posibles fuentes de información que existen. Tened en cuenta que en la Junta de Castilla y León, como administración regional, hay más de 1000 sistemas de información. Identificar cuáles de ellos tienen información útil, y el coste de su apertura es un trabajo fundamental para contar con un mapa de información. La utilidad y el coste de apertura también nos ayudarán a saber priorizar mejor los esfuerzos.
  4. Finalmente, acerca de la estandarización entre administraciones (prioridad de qué conjuntos de datos abrir, vocabularios a utilizar) se han hecho importantes esfuerzos (Norma AENOR, Ojo al Data 100, iniciativa ahora de entidades locales…) pero aún hay que recoger los frutos. Además hay bastantes administraciones que aún no cuentan con iniciativas open data.

Como firmes creyentes en el Gobierno Abierto, creemos que la colaboración entre administraciones debe servir para poder aprender unos de otros y avanzar intentando evitar errores ya cometidos. Por ello participamos de forma activa en grupos de trabajo, como la iniciativa Ojo al Data 100 (identificar 100 datasets que cualquier entidad local debiera publicar), norma UNE_178301 de Ciudades Inteligentes – Datos abiertos, o en diferentes eventos como este.  Desde aquí ofrecemos nuestra colaboración (parece que nos cuesta levantar el teléfono…) a aquellas administraciones que lo deseen.

Asimismo, para mejorar la colaboración y buscar fuentes de financiación optamos igualmente a proyectos de financiación europea (pendientes de resolver). De esta forma, intentamos matar dos pájaros de un tiro.

Finalmente, no hay que dejar de olvidar que en un proyecto que requiere gestión del cambio, e innovación, es necesario contar con un equipo que coordine la apertura de información que reúna una serie de habilidades:

  • Liderazgo, para permitir realizar ese cambio en la organización.
  • Empatizar con todos los interlocutores internos y externos, para lograr su implicación por voluntad propia y no como obligación.

Ser persistente en el trabajo del día a día. La apertura de datos es una carrera de fondo.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Datos abiertos cartográficos de núcleos urbanos de Castilla y León

CartoOrtoUrbanaLa Comunidad Autónoma de Castilla y León cuenta con una extensa red de núcleos urbanos de población, de casi 6.000 entidades. Esta red de núcleos juega un papel esencial en la organización del territorio de la Comunidad como pieza clave en la articulación del espacio. En estos núcleos es donde mayoritariamente los Castellanos y Leoneses residen y habitan y donde se centran principalmente las actividades cotidianas y económicas que se desarrollan. Resulta por ello especialmente relevante prestar especial atención a estos dada su trascendencia.

La Junta de Castilla y León, a través de su Centro de Información Territorial, y en colaboración con las Diputaciones provinciales, ha elaborado para estos núcleos la cartografía topográfica de detalle. Una aproximación objetiva que contribuye al conocimiento de estos espacios de cara a facilitar cualquier intervención en los mismos. Por otra parte se ha elaborado además la ortofotografía aérea de precisión de buena parte de ellos permitiendo una visión detallada de la realidad de cada localidad.

Toda esta información referida está puesta a disposición de los ciudadanos para su uso y consulta en el portal de datos abiertos de la Junta de Castilla y León: cartografía topográfica urbana (a escala 1:1.000 principalmente) y ortofoto urbana de alta precisión (mayoritariamente a 10 cm/pixel de resolución). De igual forma, puede ser visualizada en el Geoportal de información geográfica de la Junta: IDECyL.

Alberto González Monsalve
Centro de Información Territorial

Ganadores del II Concurso de Datos Abiertos

Entrada_Blog_Premiados_vIAyer martes 25 de marzo tuvo lugar el evento de entrega de los premios correspondientes al II Concurso de Datos Abiertos.

Los ganadores correspondientes a las tres categorías escogidos entre las 17 Candidaturas presentadas han sido:

  • Mejor proyecto realizado por estudiantes matriculados en el curso 2013-2014 o 2014-2015 al proyecto Empleo JCYL. Pablo Mario García Pérez, Roberto Vélez Gamboa son los dos estudiantes del IES Virgen del Espino de Soria que han desarrollado esta web que presenta un buscador de ofertas de empleo y la geolocalización de las oficinas de empleo de Castilla y León, utilizando sendos conjuntos de datos. Se ha premiado por la utilidad que tiene, la cantidad de público destinatario así como el valor añadido que aporta.
  • Mejor aplicación para dispositivos móviles al proyecto Vehículo eléctrico CyL. Realizada por Néstor Mohíno García, del Centro de Enseñanza Gregorio Fernández, se trata de una aplicación móvil para dispositivos Windows Phone que facilita a los usuarios de coches y motos eléctricas encontrar puntos de recarga aptos para sus vehículos en toda la comunidad autónoma. Con el uso de los conjuntos de datos de puntos de recarga se premió por la facilidad de uso y claridad en el diseño, junto con su rapidez.
  • Mejor aplicación web, desarrollo tecnológico, trabajo de periodismo de datos, informe o estudio al proyecto Conquista Castilla y León. Se trata de una web con diseño adaptativo realizada por Juan Carlos Ballesteros Hermida y Alberto Sacristán de Francisco que consiste en un juego multijugador en el que el objetivo es conquistar el mayor número de municipios de Castilla y León. Destaca su originalidad, creatividad y carácter innovador, además de la calidad del proyecto, buscando aunar el entretenimiento y el conocimiento de Castilla y León gracias al uso del conjunto de datos de municipios de Castilla y León

Además, la candidatura “cyljob – Portal de datos de empleo de Castilla y León” ha recibido una Mención Especial. Se trata de una web realizada por Javier Gamara Olmedo, Mario de Frutos Dieguez, Jorge Maroto García, Alvaro García Loaisa y Rodrigo Maroto Merino. Destaca por haber sabido combinar en su proyecto trabajos de búsqueda de información, representación gráfica y análisis de resultados relacionados con el empleo.

En definitiva, proyectos realizados por grupos de trabajo de diferentes perfiles, utilizando múltiples tecnologías y con objetivos diversos que dan idea de las posibilidades de los Datos Abiertos.

Podéis ver en diferido el acto de entrega de premios en el canal de Youtube de la Junta de Castilla y León.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Entrega de premios del II Concurso de Datos Abiertos

cartel_datosAbiertos_2014_medioEl martes 24 de marzo se celebrará el evento de entrega de premios correspondientes al II Concurso de Datos Abiertos de la Comunidad de Castilla y León. El evento se celebrará en la sala Fray Pío del Monasterio del Prado, sede de las Consejerías de Cultura y Turismo y la de Educación, y dará comienzo a las 18:00.

La dirección es: Avda. Monasterio de Nuestra Señora de Prado, s/n. – C.P.: 47014 – Valladolid (Valladolid).

El acceso al evento es libre (se ruega confirmación de asistencia a la dirección concursodatosabiertos@jcyl.es) y se emitirá en streaming a través del portal de Datos Abiertos de la Junta de Castilla y León.

Entre las candidaturas presentadas, se darán a conocer a los ganadores en el propio evento, que contará con la presencia de los miembros del jurado.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Colaboración en líneas de trabajo de datos abiertos

logo_ea_2015El pasado 26 de febrero se celebró en Madrid el Encuentro Aporta 2015. Aprovechando la asistencia de bastantes representantes de administraciones públicas, por la tarde se celebró reunión informal, a propuesta de la Junta de Castilla y León.

A la misma asistieron representantes de una docena de organismos, teniendo en cuenta que otras tantas habían mostrado su interés en las conclusiones del encuentro.

Todas las administraciones presentes mostraron su interés en colaborar en avanzar de forma conjunta en los proyectos Open Data de manera que, a partir de la reunión, se han planteado las siguientes líneas de trabajo:

  1. Cómo establecer un Plan de Datos Abiertos y realizar la Gestión del cambio
  2. Alternativas de modelos tecnológicos
  3. Conjuntos de datos a exportar de manera homogénea
  4. Uso de vocabularios comunes entre todas las administraciones
  5. Reutilizadores: Identificación, dinamización y medición de impacto
  6. Iniciativas internacionales

Cualquier administración pública podrá ser incluida en las listas de distribución (generadas por Red.es) que se crearán para cada línea de trabajo, pudiendo además ser dinamizadores de las mismas.

Desde la Junta de Castilla y León hemos mostrado ya nuestro interés en participar en todas ellas, y esperamos que sean muchas las administraciones que se sumen.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Semanas de gran actividad en Datos Abiertos

Esta semana viene cargada de noticias relacionadas con Datos Abiertos.

En primer lugar, la Junta de Castilla y León ha recibido el premio de la Open Knowledge Foundation (OKFN) como Mejor iniciativa pública de Open data con implicación de la ciudadanía, gracias a su Concurso de Datos Abiertos. Estos premios, en su segunda edición, se entregarán en las próximas fechas.

Logo del OKFN AWARD

Por otro lado, recientemente se han incorporado al catálogo de datos nuevos conjuntos de datos en materia de bioenergía y se han aplicado mejoras a conjuntos de datos de turismo, atendiendo peticiones de reutilizadores. Junto a ellos, es importante destacar que los resultados electorales desde 1983 están disponibles en datos abiertos.

Finalmente, mañana jueves se celebra en Madrid el Encuentro Aporta 2015 que, al igual que en años anteriores, congregará a gran parte de la comunidad Open Data española y en la que esperamos aprender y aumentar la colaboración entre las administraciones.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Modelo tecnológico de Datos Abiertos

Portal de Datos Abierto de la Junta de Castilla y LeónCasi tres años después de la puesta en marcha del portal de datos abiertos de la Junta de Castilla y León pensamos que es un buen momento para analizar el modelo de trabajo que estamos llevando a cabo.

Nuestro portal está alojado en la plataforma corporativa de gestión de contenidos, junto a otros 60 portales. Nos permite una cómoda gestión de los datasets disponibles, con URLs persistentes, y la publicación del propio catálogo en datos abiertos, que se encuentra federado con el portal datos.gob.es.

Ahora bien, los conjuntos de datos provienen de múltiples fuentes de información como son la propia plataforma de gestión de contenidos, ficheros subidos al servidor y base de datos de información geográfica.

Ahora bien, existe mucha información alojada en diversas bases de datos de información sectorial de cada una de las consejerías. Cada uno de los servicios de informática exportan la información a ficheros (generalmente CSV) que se actualizan periódicamente, todo de forma automática.

¿Cómo podemos ofrecer un mejor servicio a los reutilizadores aumentando la eficiencia de nuestra propia administración?

El primer paso que vamos a dar es preguntar a otras administraciones cómo están trabajando, a qué problemas se han enfrentado y cómo los han abordado, para poder aprender de ellos y tomar la mejor decisión en nuestro proyecto.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia