Ir al contenido

Datos abiertos

De Wikipedia, la enciclopedia libre
(Redirigido desde «Open Data»)
Nube de datos abiertos vinculados en 2019.

El concepto datos abiertos (open data, en inglés) es una filosofía y una práctica que persiguen que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, patentes u otros mecanismos de control.[1]​ Tiene una ética similar a otros movimientos y comunidades abiertos, como el software libre, el código abierto (open source, en inglés) y el acceso libre (open access, en inglés).

Definición

[editar]

Se consideran datos abiertos todos aquellos datos accesibles y reutilizables, sin exigencia de permisos específicos.Open Knowledge Foundation señala que los Datos Abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, como mucho, al requerimiento de atribución y de compartirse de la misma manera en que aparecen, siempre respetando la seguridad y privacidad de la información.[2]​ La definición de apertura da detalles de lo que significa, destacando:[2]

  • Disponibilidad y acceso: la información debe estar disponible como un todo, a un coste razonable.
  • Reutilización y redistribución: los datos deben permitir su reutilización, redistribución e integración con otros datos.
  • Participación universal: todos deben poder servirse, reusar y compartir datos

Tiene dos vertientes: [3]

  • Deben ser técnicamente abiertos, lo que significa que preferentemente no sean exclusivos.
  • En términos jurídicos, deben ser abiertos, lo que significa que deben estar de manera pública y poder utilizarse sin restricción.

Los datos abiertos están centrados en material no documental como información geográfica, el genoma, compuestos químicos, fórmulas matemáticas y científicas, datos médicos, biodiversidad, etc.[cita requerida] Se trata de fuentes de datos que históricamente han estado bajo el control de organizaciones -públicas o privadas- y cuyo acceso ha estado restringido mediante limitaciones, licencias, copyright y patentes. Los partidarios de los datos abiertos argumentan que estas limitaciones van en contra del bien común y que estos datos tienen que ser puestos en disposición del público sin limitaciones de acceso, dado que se trata de información que pertenece a la sociedad -como el genoma- o que ha sido generada u obtenida por administraciones públicas financiadas por la ciudadanía;[4]​ por ejemplo, información geográfica, cartográfica o meteorológica generada por organismos públicos.

En 2007 se establecieron los “8 principios del Open Data” que determinan las condiciones de los Datos Abiertos para que se estimen como tal y su formato. [5]

El 30 de septiembre de 2010 es una fecha importante para la historia de los datos abiertos: los Archivos Nacionales del Reino Unido liberaron una licencia gubernamental de reutilización de los datos generados por dicha nación.[6]

Una descripción representativa de la necesidad de datos abiertos es la que se cita a continuación:

Numerosos científicos han subrayado la ironía de que precisamente en el momento histórico en el que tenemos tecnologías para permitir la disponibilidad y el proceso distribuido de datos científicos a nivel mundial, aumentando la colaboración e incrementando el ritmo y la profundidad del descubrimiento... estamos ocupados confinando esos datos y vetando el uso de las pertinentes nuevas tecnologías sobre el conocimiento.[7]

Características

[editar]

Han de ser fiables, estructurados, documentados y fácilmente accesibles:[8]

  • Se pueden referir a diferentes aspectos.
  • La procedencia de los datos es diversa: instituciones públicas, entidades privadas o incluso ciudadanos particulares.
  • Pueden estar sometidos a redistribución y transformación por cualquier miembro de la sociedad que los pone de nuevo a disposición de la propia sociedad.
  • Han de estar recopilados en catálogos públicos y accesibles.
  • Han de ser fiables. Para ello se documentará la meta información incorporando información de rastreo y control.
    • Han de estar formateados:
    • Tienen que estar almacenados en una tabla con tantas filas como sujetos de estudio y tantas columnas como variables recogidas.
    • Deben estar guardados en ficheros con formatos abiertos.

Tipologías

[editar]

Existen dos clasificaciones tipológicas: en primer lugar los repositorios orientados al gobierno abierto, basados en la comunicación bidireccional entre ciudadanos y gobiernos entendiendo que los datos son un bien público.[8]​ Los beneficios de este tipo son: promover la comunicación entre administraciones y ciudadanos, fomentar la transparencia y facilitar la participación ciudadana. El segundo tipo son los repositorios orientados a la ciencia abierta. Basados en el principio de que las investigaciones financiadas con recursos públicos han de ser públicas. Los beneficios de este tipo son: transparencia, reutilización para nuevas investigaciones y colaboración.[8]

Fuentes principales

[editar]

Los datos abiertos pueden provenir de cualquier fuente. Esta sección enumera algunos de los campos que publican (o al menos discuten la publicación) de datos abiertos.

En la ciencia

[editar]

El concepto de acceso abierto a datos científicos se estableció institucionalmente con la formación del sistema World Data Center, en preparación para el Año Geofísico Internacional de 1957-1958.[9]​ El Consejo Internacional de Uniones Científicas (ahora el Consejo Internacional para la Ciencia) supervisa varios Centros Mundiales de Datos con el mandato de minimizar el riesgo de pérdida de datos y maximizar el acceso a los datos.[10]

Si bien el movimiento de datos científicos abiertos es anterior a Internet, la disponibilidad de redes rápidas y ubicuas ha cambiado significativamente el contexto de los datos científicos abiertos, ya que publicar u obtener datos se ha vuelto mucho menos costoso y lento.

El Proyecto Genoma Humano fue una iniciativa importante que ejemplificó el poder de los datos abiertos. Se basó en los llamados Principios de Bermuda, estipulando que: "Toda la información sobre la secuencia genómica humana (...) debe estar disponible libremente y en el dominio público para alentar la investigación y el desarrollo y maximizar su beneficio para la sociedad".[11]​ Iniciativas más recientes, como el Consorcio de Genómica Estructural, han ilustrado que el enfoque de datos abiertos también puede utilizarse productivamente en el contexto de la I+D industrial.[12]

En 2004, los Ministros de Ciencia de todas las naciones de la Organización para la Cooperación y el Desarrollo Económicos (OCDE), que incluye a la mayoría de los países desarrollados del mundo, firmaron una declaración que establece que todos los datos de investigación financiados con fondos públicos deberían ponerse a disposición del público.[13]​ Tras una solicitud y una intensa discusión con instituciones productoras de datos en los Estados miembros, la OCDE publicó en 2007 los Principios y Directrices de la OCDE para el Acceso a los Datos de Investigación de Financiamiento Público, como una recomendación de derecho indicativo.[14]

En la empresa privada

[editar]

Las empresas privadas acumulan datos que si fueran datos abiertos irían en beneficio del bien común. Un ejemplo claro son los datos que las empresas privadas acumulan sobre medicamentos, tests biológicos, química, etc. que podrían beneficiar a millones de humanos. Existen entidades privadas “vinculadas o dependientes de las Administraciones Públicas” que, a ciertos efectos, se someten a las normas administrativas.[15]

En el gobierno

[editar]

Hay una variedad de argumentos diferentes para los datos abiertos en el gobierno.[16]​ Algunos defensores sostienen que poner la información gubernamental a disposición del público como datos abiertos legibles mecánicamente puede facilitar la transparencia, la responsabilidad y la participación pública. Otros argumentan que la apertura de la información oficial puede apoyar la innovación tecnológica y el crecimiento económico, al permitir que terceros desarrollen nuevos tipos de aplicaciones y servicios digitales. Las mejores aplicaciones de gobierno abierto buscan empoderar a los ciudadanos, ayudar a las pequeñas empresas o crear valor. La apertura de los datos del gobierno puede contribuir a la mejora de la educación, de las políticas públicas y la construcción de herramientas para resolver problemas.

En el plano internacional, Naciones Unidas tiene un sitio web de datos abiertos que publica datos estadísticos de los Estados Miembros y los organismos de Naciones Unidas,[17]​ y el Banco Mundial publicó una serie de datos estadísticos relativos a los países en desarrollo.[18]​ La Comisión Europea ha creado dos portales para la Unión Europea: el Portal de datos abiertos de la UE, que brinda acceso a datos abiertos de las instituciones, organismos y otros órganos de la UE, y el portal PublicData, que proporciona conjuntos de datos de organismos públicos locales, regionales y nacionales en toda Europa.[19]

En octubre de 2015, la Alianza para el Gobierno Abierto lanzó la Carta Internacional de los Datos Abiertos, un conjunto de principios y mejores prácticas para la publicación de datos gubernamentales abiertos formalmente adoptados por diecisiete gobiernos de países, estados y ciudades, durante su Cumbre Mundial en México.[20]

Argumentos

[editar]

El debate sobre Datos abiertos todavía está en evolución. Los argumentos en favor de los datos abiertos dependen a menudo del tipo de datos y sus posibles usos. Entre ellos se pueden incluir los siguientes:

  • "Los datos pertenecen a la raza humana". Ejemplos típicos son los genomas, los datos sobre organismos, la ciencia médica, los datos ambientales después del Convenio de Aarhus.
  • El dinero público se utilizó para financiar el trabajo y, por lo tanto, debería estar disponible universalmente.
  • Fue creado por o en una institución gubernamental (esto es común en los Laboratorios Nacionales de EE. UU. Y las agencias gubernamentales).
  • Los patrocinadores de la investigación no obtienen el valor total a menos que los datos resultantes estén disponibles gratuitamente.
  • Las restricciones en la reutilización de datos crean un anticomunes.
  • Se requieren datos para el buen funcionamiento de las actividades humanas en común y son un facilitador importante del desarrollo socioeconómico (cuidado de la salud, educación, productividad económica, etc.).[21]
  • En la investigación científica, la tasa de descubrimiento se acelera mediante un mejor acceso a los datos.[22]
  • La apertura de datos ayuda a combatir la "podredumbre de los datos" y garantiza que los datos de la investigación científica se conserven a lo largo del tiempo.[23]

Generalmente se sostiene que los hechos científicos no pueden ser protegidos por derechos de autor.[24]​ Sin embargo, los editores a menudo agregan declaraciones de derechos de autor (que a menudo prohíben su reutilización) a los datos fácticos que acompañan a las publicaciones. Puede no estar claro si los datos incrustados en el texto completo son parte del copyright.

Relación con otras actividades abiertas

[editar]

Los objetivos del movimiento de datos abiertos son similares a los de otros movimientos "abiertos".

  • El llamado acceso abierto (Open access, en inglés) se preocupa de hacer públicas y libres las publicaciones técnicas universitarias, en internet. En algunos casos, estos artículos incluyen conjuntos de datos abiertos (open datasets, en inglés).
  • El contenido abierto (Open content, en inglés) se ocupa de dirigir los recursos para un público humano (recursos como texto, fotos, o videos) accesible de forma libre.
  • En cuanto al conocimiento abierto (Open knowledge, en inglés), la Fundación Conocimiento Abierto (Open Knowledge Foundation, en inglés) proclama la "apertura" en varios temas, entre los que se incluyen los datos abiertos. Cubre los temas (a) científicos, históricos, geográficos, o por otro lado, (b) contenidos como música, películas, libros, (c) información de administraciones públicas y gobierno. Los datos abiertos están incluidos en el alcance de la definición de conocimiento abierto, que se cita en el protocolo para la implementación de acceso a datos abiertos en Science Commons.[25]
  • La llamada ciencia de datos abiertos (open notebook science) se identifica con la aplicación de conceptos de datos abiertos a métodos científicos tanto como se pueda, incluyendo experimentos fallidos y conjuntos grandes de datos experimentales.[26]
  • El software libre (free software, en inglés) se relaciona con las licencias bajo las cuales se pueden distribuir programas informáticos, y no está directamente relacionado, habitualmente, con los datos en sí.
  • El término ciencia abierta (open science, en inglés) se refiere a una aproximación para los conjuntos de datos científicos interrelacionados, métodos y herramientas de técnicas (Linked Data) para conseguir transparencia, escalabilidad e investigaciones entre distintas disciplinas.[27]

Mandato abierto

[editar]

Varios organismos de financiación que ordenan acceso abierto también exigen datos abiertos. Los Institutos Canadienses de Investigación en Salud (CIHR) presentan una buena expresión de los requisitos:

  • depositar datos bioinformáticos, atómicos y de coordenadas moleculares, datos experimentales en la base de datos pública apropiada inmediatamente después de la publicación de los resultados de la investigación.
  • retener los conjuntos de datos originales durante un mínimo de cinco años después de la concesión. Esto se aplica a todos los datos, publicados o no.[28]

El Horizonte 2020, mecanismo de financiación de la ciencia de la UE, exige que los proyectos financiados depositen sus bases de datos como "entregables" al final del proyecto, para que puedan ser verificados y reutilizados por terceros.[29][30]

Véase también

[editar]

Referencias

[editar]
  1. Definición de Conocimiento Abierto v.1.0 Open Knowledge Foundation Consultado el 30 de enero de 2011
  2. a b «¿Qué son los datos abiertos?». Open Data Handbook. Consultado el 15 de octubre de 2020. 
  3. «Aspectos fundamentales de los Datos Abiertos». Open Government Data Toolkit. Consultado el 16 de octubre de 2020. 
  4. «Origen, consolidación, expansión e implicancias del Acceso Abierto (Open Access) en América Latina y el Caribe». Revista ESS, 16 (2). 2011. Archivado desde el original el 19 de diciembre de 2013. Consultado el 16 de marzo de 2014. 
  5. Rivas, Begoña (25 de julio de 2018). «Sobre datos abiertos: definición, tipos y ejemplos para la educación». Ciberimaginario. Consultado el 20 de octubre de 2020. 
  6. «Open Government Licence enables re-use of information | The National …». archive.is. 30 de junio de 2012. Archivado desde el original el 30 de junio de 2012. Consultado el 14 de abril de 2018. 
  7. «Science Commons  » Towards a Science Commons». sciencecommons.org (en inglés estadounidense). Archivado desde el original el 13 de mayo de 2016. Consultado el 14 de abril de 2018. 
  8. a b c Román-González, Marcos (2019). «Capítulo 11: Análisis de censos, Datos abiertos e indicadores». En Belén Ballesteros, ed. Investigación social desde la práctica educativa. Madrid: UNED. ISBN 978-84-362-7510-0. 
  9. Summary | Earth Observations from Space: The First 50 Years of Scientific Achievements | The National Academies Press (en inglés). doi:10.17226/11991. Consultado el 13 de abril de 2018. 
  10. «Data Sharing Principles — World Data System: Trusted Data Services for Global Science». www.icsu-wds.org (en inglés). Archivado desde el original el 17 de septiembre de 2018. Consultado el 13 de abril de 2018. 
  11. Summary of Principles Agreed at the First International Archivado el 10 de mayo de 2018 en Wayback Machine.. Strategy Meeting on Human Genome Sequencing (Bermuda, 25-28 February 1996) as reported by HUGO.
  12. «Open data partnerships between firms and universities: The role of boundary organizations». Research Policy (en inglés) 44 (5): 1133-1143. 1 de junio de 2015. ISSN 0048-7333. doi:10.1016/j.respol.2014.12.006. Consultado el 13 de abril de 2018. 
  13. «Science, Technology and Innovation for the 21st Century. Meeting of the OECD Committee for Scientific and Technological Policy at Ministerial Level, 29-30 January 2004 - Final Communique - OECD». Www.oecd.org. Consultado el 26 de octubre de 2021. 
  14. OECD (12 de abril de 2007). OECD Principles and Guidelines for Access to Research Data from Public Funding (en inglés). OECD iLibrary. doi:10.1787/9789264034020-en-fr. Consultado el 13 de abril de 2018. 
  15. «Los datos abiertos en el sector privado: ¿asignatura pendiente?». datos.gob.es. Archivado desde el original el 27 de enero de 2023. Consultado el 4 de marzo de 2020. 
  16. Gray, Jonathan (3 de septiembre de 2014). Towards a Genealogy of Open Data (en inglés) (ID 2605828). Social Science Research Network. Consultado el 13 de abril de 2018. 
  17. «UNdata». data.un.org. Consultado el 13 de abril de 2018. 
  18. «World Bank Open Data | Data». data.worldbank.org (en inglés estadounidense). Consultado el 13 de abril de 2018. 
  19. «Welcome - PublicData.eu». publicdata.eu (en inglés). Archivado desde el original el 20 de noviembre de 2013. Consultado el 13 de abril de 2018. 
  20. Gurin, Joel (27 de octubre de 2015). «The Open Data Charter: A Roadmap for Using a Global Resource». Huffington Post (en inglés estadounidense). Consultado el 13 de abril de 2018. 
  21. Hilbert, Martin (15 de enero de 2013). Big Data for Development: From Information- to Knowledge Societies (en inglés) (ID 2205145). Social Science Research Network. Consultado el 13 de abril de 2018. 
  22. HOW TO MAKE THE DREAM COME TRUE: THE ASTRONOMERS’ DATA MANIFESTO Ray P. Norris
  23. «Stopping the rot: ensuring continued access to scientific data, irrespective of age. - F1000 Blogs». F1000 Blogs (en inglés británico). 19 de mayo de 2014. Consultado el 13 de abril de 2018. 
  24. «Science Commons  » Towards a Science Commons». sciencecommons.org (en inglés estadounidense). Archivado desde el original el 14 de julio de 2014. Consultado el 13 de abril de 2018. 
  25. «Science Commons  » Protocol for Implementing Open Access Data». sciencecommons.org (en inglés estadounidense). Archivado desde el original el 30 de enero de 2017. Consultado el 13 de abril de 2018. 
  26. http://drexel-coas-elearning.blogspot.com/2006/09/open-notebook-science.html Creación del término (en inglés)
  27. Kauppinen, T; Espíndola, G.M.D. (2011). «Linked Open Science-Communicating, Sharing and Evaluating Data, Methods and Results for Executable Papers». Procedia Computer Science (4): 726. doi:10.1016/j.procs.2011.04.076. 
  28. Translation,, Government of Canada, Canadian Institutes of Health Research, Research and Knowledge. «Tri-Agency Open Access Policy on Publications - CIHR». www.cihr-irsc.gc.ca (en inglés). Consultado el 19 de abril de 2018. 
  29. Commission, European. «Open access & Data management - H2020 Online Manual». ec.europa.eu (en inglés). Consultado el 19 de abril de 2018. 
  30. «Open Data - SPARC». SPARC (en inglés estadounidense). Consultado el 19 de abril de 2018. 

Enlaces externos

[editar]