Archivo por meses: febrero 2019

Dato abierto, dato geolocalizado

Hace ya meses hablábamos de la importancia de dotar de calidad y utilidad a los datos publicados, sin centrarnos sólo en la cantidad.

Uno de los parámetros que más enriquecen a los conjuntos de datos es conocer la ubicación geográfica. Y no nos referimos únicamente a la dirección postal, sino a la necesidad de conocer las coordenadas geográficas.

Contar con la geoposición indicando las coordenadas nos permitirá explotar mucho mejor los datos. Podremos hacer fácilmente visualizaciones con mapas: de calor, coroplético, con puntos… También será posible calcular distancias entre puntos, por ejemplo ofreciendo aquellas ubicaciones más cercanas a donde nos encontramos.

Pero lo cierto es que en la práctica muchas veces no contamos con esos datos. En el mejor de los casos (que no son pocos) sí que contaremos con la dirección postal. ¿Y qué podemos hacer en ese caso? Os contaremos el procedimiento seguido en nuestra iniciativa de datos abiertos.

Uno de los casos que más nos encontramos es el de exportar a datos abiertos diferentes directorios y registros que se encuentran en la plataforma web corporativa. El directorio corporativo es quizá el mejor ejemplo de esto.  En este caso, cada vez que se edita una dirección en el gestor de contenidos, al meter la dirección tiene dos opciones:

  • Localizar manualmente el directorio en un mapa.
  • Dejar que el sistema geolocalice el punto. Para ello, al guardar el directorio se hace una llamada al API de Google Maps que nos devuelve las coordenadas. El usuario puede revisar posteriormente si el punto está ubicado correctamente.

Aunque visualmente usemos los mapas gratuitos de OpenStreetMaps, utilizamos la API de Google Maps para buscar las coordenadas geográficas porque ofrece un nivel de fiabilidad alto y permite geolocalizar gratuitamente unas 40000 ubicaciones al mes.

Otro caso habitual es que los registros se exporten desde una base de datos para su publicación en datos abiertos. Por ejemplo, actualmente estamos trabajado con dos ficheros, uno de 31000 registros y otro de 1500 puntos. Para estos casos hemos desarrollado una macro en Excel que llama al API de Google Maps en cada uno de los registros, y en pocos minutos tenemos todos geolocalizados.

Una vez obtenidos los datos, desde el Centro de Información Territorial pueden analizar si el punto ha sido ubicado fuera del municipio al que corresponde la dirección postal. De esta forma podemos localizar parte de los errores y corregirlos manualmente.

¿Os parece eficiente este procedimiento? ¿Cómo lo mejoraríais? ¿Qué procedimiento utilizáis para geolocalizar los datos?

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Borrado de metadatos

Siempre que esta no sea relevante para el receptor, cada vez es más importante garantizar la confidencialidad de las fuentes y orígenes de la informaciónEsto incluye datos personales del autor/editor del fichero o el programa y versión utilizada.

En ese sentido, en el Anexo II del Esquema Nacional de Seguridad (ENS) se detallan las medidas de seguridad a llevar a cabo. En concreto como medida de protección de la información se cita: “En el proceso de limpieza de documentos, se retirará de estos toda la información adicional contenida en campos ocultos, meta-datos, comentarios o revisiones anteriores, salvo cuando dicha información sea pertinente para el receptor del  documento. Esta medida es especialmente relevante cuando el documento se difunde ampliamente, como ocurre cuando se ofrece al público en un servidor web u otro tipo de repositorio de información”.

En la Junta de Castilla y León existe una política de seguridad de la información que dispone de diferentes recursos y documentación relacionada con el borrado de metadatos. Recientemente se ha completado con cursos de formación.

Sin embargo, no siempre se presta suficiente atención a la información que se difunde por los diferentes canales.

Es preciso tener en cuenta que en la plataforma corporativa de gestión de contenidos hay almacenados más de medio millón de ficheros binarios. No es de extrañar por lo tanto que exista un buen número de ficheros a los que no se les haya aplicado la revisión de metadatos antes de su publicación.

Aunque cada gestor de los portales web es responsable de los contenidos que sube, creemos necesario implementar políticas complementarias respecto al borrado de metadatos.

Por ello como primera medida se ha implementado, mediante la herramienta de libre uso EXIFTOOL, un proceso que elimina los metadatos (de múltiples tipos de extensiones) de los ficheros binarios antes de ser almacenados en el gestor de contenidos.

Ya está en funcionamiento para todos los nuevos ficheros que se publiquen en los portales web de la Junta de Castilla y León. Como procedimiento complementario, se ha realizado un proceso de limpieza de todos los documentos ya publicados

De esta forma, complementando el trabajo de editores con nuevos mecanismos, incrementaremos la seguridad de la información publicada y por ende a sus fuentes y receptores.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Difusión del Concurso de Datos Abiertos

El éxito de cualquier campaña o concurso viene determinado por tres factores:

  1. Facilidad de participación
  2. Premio / recompensa atractiva.
  3. Conocimiento de la iniciativa

En el momento de comunicar la III edición del concurso de datos abiertos hemos tratado de cubrir los tres puntos.

  1. Asegurando la facilidad de participación, pusimos como único requisito el de utilizar, al menos, una fuente de datos publicada en el portal de Datos Abiertos de la Junta de Castilla y León.
  2. Por otro lado, ofrecemos 12.000 euros en premios además de una asesoría en materia de desarrollo empresarial.
  3. Pero todo esto sirve de poco si los potenciales candidatos no conocen la existencia del concurso. Por ello hemos hecho un gran esfuerzo de difusión que constó de las siguientes etapas:

Difusión interna

Antes de nada, el personal que está implicado en proporcionar datos a la iniciativa open data de la comunidad debe ser consciente del esfuerzo que hacemos en dinamizar el uso de sus datos.

De esta forma se ha comunicado la actuación a:

  • Los propios responsables funcionales de la información publicada
  • Los jefes de servicio de informática

Medios de difusión propios

Al tratarse de una convocatoria de Premio, se realiza una publicación en el Boletín Oficial de Castilla y León. Junto con la misma se emitió una nota de prensa.

Además se ha realizado una amplia difusión a través de los canales online de la Junta de Castilla y León: portales web, como el propio de datos abiertos, el de gobierno abierto o el de educación. Asimismo, implicación de las redes sociales corporativas: comunicación, educación, 012, juventud, etc.

Ámbito educativo

Como el concurso tiene premios especiales para estudiantes, además de contar con una categoría de Recurso Educativo, debemos hacer un esfuerzo especial en que la comunidad educativa conozca el concurso.

Para cumplir con este objetivo, se ha realizado comunicación por correo electrónico a:

  • Todos los centros de Secundaria, Bachillerato y Formación Profesional de la comunidad
  • Otro envío a todos los centros de Formación Profesional que imparten estudios de Desarrollo de Aplicaciones Multiplataforma y de Desarrollo Aplicaciones Web
  • Los nueve Centros de Formación del Profesorado e Innovación Educativa de las capitales de provincia de Castilla y León
  • Más de una docena de facultades y escuelas universitarias de toda la comunidad

Asociaciones y grupos

También nos hemos puesto en contacto y hemos utilizado otros canales que agrupan a colectivos de personas que pueden interesarse por el concurso:

Comunidad Open Data en España

Por un lado, colaboración con la iniciativa estatal datos.gob.es.

Además, nos hemos puesto en contacto con decenas de expertos, tanto del sector público como del sector privado. Para ello se ha combinado el envío de correo electrónico como el
uso de Twitter (mensajes directos, menciones, etc.).

Comunidad Open Data en Castilla y León

Además de la difusión a través del Instituto de Competitividad Empresarial, gracias a los casi 7 años de iniciativa de datos abiertos en nuestra comunidad, hemos desarrollado una amplia red de contactos: usuarios que nos presentan sus aplicaciones, que nos plantean dudas, otros que nos preguntan sobre próximas ediciones del concurso, etc.

Hemos comunicado a todos ellos la existencia del concurso, invitando tanto a participar como a ayudar en la difusión del mismo.

Debido a la cantidad de información que recibimos constantemente desde tantas fuentes, es importante establecer también una serie de recordatorios periódicos en el plazo de inscripciones para asegurarnos la máxima visibilidad de la convocatoria.

Somos conscientes de que “toda difusión es poca”, pero esperamos que esta presentación pueda ayudar a otras administraciones a coger ideas para las iniciativas que tengan previsto realizar.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia