Qué son los datos estructurados
Los datos estructurados son bloques de información estandarizados (conceptos y significados) que describen el contenido de sitios web y correos electrónicos para facilitar a las máquinas (buscadores web, por ejemplo), su indexación e interpretación de lo que contienen.
En una página de recetas, la información que se podría ofrecer como datos estructurados serían: los ingredientes, el tiempo y la temperatura de cocción, las calorías, etc.
Ahora bien, para que las máquinas comprendan dichos datos estructurados es necesario contar con un vocabulario que sea lo más universal posible.
Para mejorar la información disponible en Google de nuestros portales web, desde el servicio de la web corporativa, hemos incorporado en el código fuente, varios tipos de contenido con datos estructurados en formato JSON-LD, tal y como propone https://schema.org[1]
En resumen, se trata de estructurar internamente los datos de las páginas web de tal forma que, siendo transparente para los editores y el ciudadano, el resultado de las búsquedas realizadas por los motores de búsqueda (Google, Bing, Yahoo!) sean más eficaces y se muestren de forma más usable y visual.
Qué formato elige la Junta de Castilla y León
Entre los diversos vocabularios y formatos, la Junta de Castilla y León ha optado por seguir el formato JSON-LD que es un sistema de anotación de JavaScript incorporado en una etiqueta <script>.
A continuación se muestra un ejemplo de datos estructurados en formato JSON-LD:
Dos de las razones por lo que se ha optado por este lenguaje de marcado son:
- Los bloques <script> se pueden poner tanto en el encabezado como en el cuerpo de la página y no interfieren ni el texto visible para el usuario ni con el código HTML por lo que es una solución óptima tanto para los desarrolladores de la web como para los editores de los contenidos.
- Es el recomendado por Google para usar en su buscador. Entre otras cosas, porque usa los datos estructurados para habilitar funciones especiales y mejoras de los resultados de la búsqueda.
Vocabularios implementados
De todos los vocabularios disponibles en Schema.org se ha optado por implementar en primer lugar aquellos que son más relevantes para una web de una Administración Pública. En concreto, a día de hoy, la información en formato JSON-LD que se muestra es:
- La organización responsable de cada portal, junto con el logotipo (si es que tiene), las redes sociales en dónde está presente y la información de contacto. Publicado en todas las páginas de dicho portal, según el esquema https://schema.org/Organization
- La miga de pan de cada una de las páginas. https://schema.org/BreadcrumbList
- Los datos de contacto y geográficos de los organismos presentes en todos los directorios del SIAU. https://schema.org/Organization
- Todas las noticias o notas de prensa de cualquier portal. https://schema.org/NewsArticle
- Todos los eventos de los portales. https://schema.org/Event
- Los cursos de la ECLAP. https://schema.org/Course
- Las ofertas de empleo público del portal de Empleados Públicos. https://schema.org/JobPosting
- Los datasets del portal de Datos Abiertos. https://schema.org/Dataset
- Los videos en streaming tanto en directo como en diferido. https://schema.org/VideoObject
Ejemplos de utilización
A continuación se muestran ejemplos de la utilización de los datos de los eventos en formato JSON-LD para enriquecer sus búsquedas:
En forma de tarjetas destacadas (1)
La información aparecerá agrupada bajo un recuadro, como una tarjeta.
Como información adicional de los resultados (2)
La información muestra un resumen con los datos en una lista.
Detalle de un evento con localización geográfica (3)
La información muestra una localización geográfica
NOTA: Es preciso tener en cuenta que los resultados que ofrece Google pueden variar según el usuario.
Más información:
Antonio Ibáñez Pascual
Dirección General de Análisis y Planificación
Consejería de la Presidencia