Archivo de la etiqueta: datos

Implementación de datos estructurados

Qué son los datos estructurados

Los datos estructurados son bloques de información estandarizados (conceptos y significados) que describen el contenido de sitios web y correos electrónicos para facilitar a las máquinas (buscadores web, por ejemplo), su indexación e interpretación de lo que contienen.

En una página de recetas, la información que se podría ofrecer como datos estructurados serían: los ingredientes, el tiempo y la temperatura de cocción, las calorías, etc.

Ahora bien, para que las máquinas comprendan dichos datos estructurados es necesario contar con un vocabulario que sea lo más universal posible.

Para mejorar la información disponible en Google de nuestros portales web, desde el servicio de la web corporativa, hemos incorporado en el código fuente, varios tipos de contenido con datos estructurados en formato JSON-LD, tal y como propone https://schema.org[1]

En resumen, se trata de estructurar internamente los datos de las páginas web de tal forma que, siendo transparente para los editores y el ciudadano, el resultado de las búsquedas realizadas por los motores de búsqueda (Google, Bing, Yahoo!) sean más eficaces y se muestren  de forma más usable y visual. 

Qué formato elige la Junta de Castilla y León

Entre los diversos vocabularios y formatos, la Junta de Castilla y León ha optado por seguir el formato JSON-LD que es un sistema de anotación de JavaScript incorporado en una etiqueta <script>.

A continuación se muestra un ejemplo de datos estructurados en formato JSON-LD:

Ejemplo de datos estructurados en formato JSON-LD

Dos de las razones por lo que se ha optado por este lenguaje de marcado son:

  • Los bloques <script> se pueden poner tanto en el encabezado como en el cuerpo de la página y no interfieren ni el texto visible para el usuario ni con el código HTML por lo que es una solución óptima tanto para los desarrolladores de la web como para los editores de los contenidos.
  • Es el recomendado por Google para usar en su buscador. Entre otras cosas, porque usa los datos estructurados para habilitar funciones especiales y mejoras de los resultados de la búsqueda.

Vocabularios implementados

De todos los vocabularios disponibles en Schema.org se ha optado por implementar en primer lugar aquellos que son más relevantes para una web de una Administración Pública. En concreto, a día de hoy, la información en formato JSON-LD que se muestra es:

Ejemplos de utilización

A continuación se muestran ejemplos de la utilización de los datos de los eventos en formato JSON-LD para enriquecer sus búsquedas:

En forma de tarjetas destacadas (1)

La información aparecerá agrupada bajo un recuadro, como una tarjeta.

Como información adicional de los resultados (2)

La información muestra un resumen con los datos en una lista. 

Tarjeta destacada e información adicional en resultados de búsqueda de Google gracias a datos estructurados

Detalle de un evento con localización geográfica (3)

La información muestra una localización geográfica

Localización geográfica en resultados de búsqueda de Google gracias a datos estructurados

NOTA: Es preciso tener en cuenta que los resultados que ofrece Google pueden variar según el usuario.

Más información:

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

La Junta de Castilla y León participa en el encuentro «Aporta 2018»

Bajo el lema “Emprendiendo con datos públicos” se celebró el 28 de noviembre la 8ª edición del encuentro APORTA organizado, de manera conjunta, por el Ministerio de Economía y Empresa, el Ministerio de Política Territorial y Función Pública, y la entidad pública empresarial Red.es.

La Junta de Castilla y León tuvo la oportunidad de participar en la primera de las mesas, con el objetivo de demostrar “El valor para las Administraciones Públicas de la reutilización de sus datos”.

Desde nuestra administración planteamos una serie de ideas que deben apoyar este objetivo:

Tener una iniciativa viva es necesario, pero no es suficiente.

La iniciativa de la Junta de Castilla y León lleva 6 años y medio en marcha, cada vez con más datos abiertos y un proceso de apertura de datos en constante evolución.

Podemos seguir dinamizando el proceso de apertura por el valor económico que genera o por una labor de transparencia igual de importante. Si bien esto es cierto, los centros directivos necesitan casos tangibles que, en muchos casos, no llegamos a tener.

Por ello hemos adaptado nuestro discurso para explicar las ventajas del uso de los datos:

  • Una buena gestión permitirá consumir mejor nuestros datos
  • Compartir la información entre departamentos facilitará la toma de decisione

Dejemos por un momento de lado el concepto “Open”. Pensemos en identificar y publicar datos (si es posible, con APIs de consulta), para su consumo interno.

Hacerlos abiertos será un paso adicional, muy poco costoso y fácil de explicar internamente. Después, integrar dentro de la organización la posibilidad de compartir información, de explotarla… permitirá también ofrecerla a ciudadanos y empresas.

Pasemos de un plan de datos abiertos a un plan de gestión de la información corporativa

Gestionar bien los datos es trabajar mejor, de forma más inteligente. El Open Data debe ir ligado a esta gestión.

Abrir los datos no es el final del camino… y tampoco el principio.

Posteriormente se habló del uso de los datos para la toma de decisiones. Todos los días utilizamos datos para tomar decisiones. Por ejemplo, el uso de estadísticas de los portales web deben servirnos, junto con otros datos, para determinar qué contenidos debemos destacar más, cuáles no se están visitando, o cómo redactar mejor los contenidos porque no se están encontrando en las búsquedas que hacen los ciudadanos. Podemos poner muchos ejemplos en los que los centros directivos manejan sus propios datos que utilizan para tomar decisiones.

El valor que tienen políticas de apertura es que deben servir para facilitar el acceso por cualquier departamento ajeno al gestor de los datos

El gobierno británico, en su estrategia de transformación digital, habla precisamente de esto:
“garantizar que los datos se utilicen en su máximo potencial dentro del gobierno para proporcionar servicios públicos más eficientes y receptivos”.

Tenemos diversos ejemplos de reutilización interna de datos dentro de la propia administración.

Es fundamental inventariar los casos de éxito, porque nos ayudarán a poner en valor nuestra iniciativa

Para poder cumplir con esos objetivos, es necesario hacerse dos preguntas: ¿contamos con herramientas para el análisis de los datos? ¿Estamos formando a los empleados públicos para hacer uso de las mismas?

En el caso de la Junta de Castilla y León cuenta con una plataforma de análisis de datos que permite el uso de APIs de consulta y la realización de gráficas y cuadros de mando.

La formación en el análisis de datos debe combinar la sensibilización y la especialización

Si mostramos a los funcionales (responsables de la información) las posibilidades de análisis de datos podrán conocer y descubrir el potencial de realizar una buena gestión de los mismos. 

Por otro lado, es preciso formar a personal informático sobre el uso de la plataforma. En el caso de la Junta de Castilla y León además, se ha completado con un Curso de “Visualización y análisis de datos” para personal informático. De esta forma, tenemos especialistas técnicos que puedan implementar los análisis y visualizaciones que requieran los funcionales.

El análisis de datos debe permitirnos no sólo explotar los datos ya disponibles, sino fomentar la publicación de nuevos datos

La adaptación a estas nuevas tecnologías que estamos haciendo desde las administraciones y la publicación de datos abiertos que llevamos haciendo años debe combinarse, por lo tanto, con la oportunidad de explotar internamente los datos.

Los términos Big Data, la Inteligencia Artificial, Machine Learning… cada vez son más comunes y son tecnologías que permitirán proporcionar servicios públicos más eficientes y receptivos por lo que dentro de nuestros objetivos está el comprenderlas primero y el saber aplicarlas al bien común.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia

Explotando la información disponible

Después de casi 6 años de trabajo con la apertura de datos públicos en la Junta de Castilla y León, hemos conseguido pasar de los 83 conjuntos de datos iniciales en 2012 a los más de 300 que tenemos actualmente.

Se trata de un proyecto vivo que aún tiene margen de mejora. Para acometer dichas mejoras, después de un profundo análisis interno, se identificaron cuestiones que deben y pueden ser abordadas a corto-medio plazo. Algunas de ellas son:

  1. Seguir incorporando nuevas fuentes de información al portal.
  2. Ofrecer herramientas de explotación de la información que se ofrece en formatos abiertos.
  3. Dar la posibilidad de consultar los conjuntos de datos mediante un API, de manera que se puedan recuperar datos concretos sin necesidad de la descargar la información completa.

Portal de análisis de datos de la junta de Castilla y LeónPara cubrir estos puntos hemos puesto en marcha un portal de análisis de datos basado en la tecnología Socrata, que ya utilizan grandes capitales de Estados Unidos (como Chicago, Nueva York o San Francisco, por citar sólo algunas).

Poder filtrar la información, hacer vistas, gráficos o cuadros de mando son funcionalidades que, junto con el API de consulta o la posibilidad de descargar los datos en diferentes formatos, aumentan las alternativas de uso de la información publicada.

Esta herramienta puede ser utilizada no sólo por ciudadanos y empresas sino también por el personal de la propia administración. Los propios gestores de los datos son, de hecho, los que mejor saben qué explotaciones de datos pueden aportar ideas o nuevas conclusiones al trabajo que ya se viene realizando.

En estas fechas estamos impartiendo formación sobre dicha herramienta a personal de nuestra propia organización: responsables de datos y personal informático. A partir de esta experiencia esperamos publicar nuevas visualizaciones en dicho portal y convocar nuevas sesiones formativas tanto para personal interno como externo a nuestra administración.

Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia