Portal Europeo de Datos

Lista de verificación

Lista de verificación

Pasos esenciales que debe seguir antes de utilizar los datos.

Antes que nada, hay que tener acceso a los datos. Los datos no son un fin en sí mismos, sino que pueden utilizarse de distintas formas y servir a distintos propósitos. Asimismo, pueden estar asociados a varios tipos de licencias, estar en distintos formatos y ser de mayor o menor calidad. 

 

Su objetivo

Defina su objetivo: la utilización de datos abiertos puede añadir valor a sus actividades de distintas formas. Los datos abiertos permiten recabar información sobre un determinado tema en el que se desea profundizar o incluso sobre el que se quiere escribir (como en el caso del periodismo de datos). Los datos abiertos también pueden aportar información necesaria para una aplicación o un servicio; así, pueden ofrecer detalles sobre colegios a los desarrolladores de una herramienta para ayudar a los padres a encontrar el centro más adecuado para sus hijos. Las empresas pueden utilizar los datos abiertos para optimizar los perfiles de sus clientes y satisfacer mejor sus necesidades. Ya sea para fines privados o comerciales, los datos abiertos ofrecen todo un abanico de posibilidades.

Identifique las etiquetas de los datos: una vez definido el objetivo de los datos, es importante determinar si se ajustan a sus necesidades, para lo cual debe comprobar los metadatos, esto es, los datos sobre los datos. Por ejemplo, si desea crear una aplicación para identificar los mejores colegios de educación primaria de un barrio, debe comprobar si los conjuntos de datos que pretende utilizar incluyen centros que imparten educación primaria, si estos se encuentran en la zona de interés y si se dispone de indicadores de su rendimiento.

 

Licencia abierta

Compruebe si se trata de datos abiertos: consulte la información de la licencia asociada al conjunto de datos. Asegúrese de que existe una licencia que permita utilizar los datos como tiene previsto, esto es, que autorice la reutilización con fines de lucro, si lo que va a desarrollar es una aplicación comercial.

Compruebe los requisitos de atribución de autoría: la licencia podría exigir que las personas que utilicen los datos hagan la debida mención a quien los publica, lo que implicaría incluir una referencia al propietario en el producto o servicio. Es lo que se conoce como atribución de autoría.

Compruebe si se requiere compartir bajo la misma licencia: si se indica que los usuarios que combinan los datos con otros también deben publicar estos últimos como datos abiertos, ello implica que debe divulgar sus propios datos bajo una licencia similar, tras añadirlos a la fuente original. Esta modalidad se denomina compartir bajo la misma licencia o «share alike». Asegúrese de que la licencia se ajusta al fin al que va a destinar los datos.

¡Si no se dispone de una licencia, no es posible consultar las condiciones de uso! En tal caso conviene ponerse en contacto con el propietario de los datos para comprobar los usos autorizados.

 

Formato del archivo

Tras constatar que un conjunto de datos en concreto se ajusta exactamente a sus necesidades, probablemente podrá descargar los datos en varios formatos de archivo. Debe elegir el formato más adecuado para usted en función de sus conocimientos de informática. El formato más habitual para descargarse los datos en forma de tabla es «.csv». Esta opción permite añadir información al archivo o realizar cálculos con los datos. Los conjuntos de datos que pueden modificarse se publican en un formato abierto. La mayoría de conjuntos de datos están disponibles en formato abierto, pero algunos no pueden modificarse, como es el caso de los archivos «.pdf».

 

Calidad de los datos

La página en la que se aloja el conjunto de datos que desea descargar suele indicar la última fecha de modificación del archivo. Si necesita restringir los datos a un periodo determinado, debe comprobar si están fechados o si se han actualizado recientemente. Conviene comprobar que el archivo contiene la información esperada y asegurarse de interpretar correctamente las etiquetas. 

 

En el siguiente enlace hallará una breve lista de verificación elaborada por el Open Data Institute

Forma

  • ¿Cómo se han procesado los datos?
  • ¿Son datos primarios o han sido procesados?
  • ¿En qué sentido afecta su forma a su análisis/producto/aplicación?
  • ¿Qué transformaciones sintácticas (lenguaje) y semánticas (significado) serían necesarias?
  • ¿Son compatibles con otros conjuntos de datos de los que dispone?

Calidad

  • ¿Se trata de datos recientes?
  • ¿Con qué frecuencia se actualizan?
  • ¿Comprende todos los campos y su contexto?
  • ¿Durante cuánto tiempo se mantendrá la publicación? ¿A qué se ha comprometido quien publica los datos?
  • ¿Qué información posee sobre la precisión de los datos?
  • ¿Cómo se gestiona la ausencia de datos?

Eche un vistazo al Portal europeo de datos para comprobar si puede ofrecerle los datos que necesita.