Tendencias y consideraciones para implementar un proyecto de datos abiertos.
Open Research Data o datos abiertos de investigación hace referencia a los datos que han sido utilizados para elaborar una investigación científica y que serán publicados en acceso abierto. Deben cumplir con los Principios FAIR[1], es decir, ser localizables, accesibles, interoperables y reutilizables. Existen dos vías para su publicación: la vía verde mediante repositorios de datos abiertos y la vía dorada que plantea incluirlos como complemento de los artículos en las plataformas editoriales existentes.
En el Perú, a raíz de la implementación de la Ley Universitaria 30220, las universidades crearon repositorios institucionales y lograron darle visibilidad a la producción académica y científica de sus investigadores. Ahora debemos hacernos la pregunta: ¿los datasets que fueron utilizados en estas investigaciones se encuentran publicados en acceso abierto? Para responder a esta pregunta debemos analizar las condiciones y el contexto donde se utilizan los datos de investigación.
Es aquí donde se genera una paradoja porque los investigadores desean acceder a los datos de otros investigadores, pero ellos a su vez no permiten el acceso a sus datos. Es necesario implementar líneas de acción que incluyan la entrega de datasets como parte del proceso de publicación de un artículo o tesis y elaborar un Plan de Gestión de Datos para conocer cuáles son los requerimientos, características, estándares, restricciones y licencias.
La publicación de datasets se debe realizar en plataformas idóneas para su organización, administración y acceso. CKAN y Dataverse son softwares de código abierto que se vienen implementando en este tipo de proyectos a nivel mundial.
Tener en cuenta…
Una característica importante al momento de evaluar el software es conocer cuál es el esquema de metadatos y qué tan flexible pueden llegar a ser, considerando que los datasets provienen de diferentes áreas temáticas. Dentro del esquema de metadatos es esencial que los datasets estén vinculados a sus publicaciones y viceversa, logrando que los repositorios institucionales y los de datos abiertos se relacionen correctamente y el usuario pueda acceder a la información completa.
El desarrollo de este tipo de proyectos implica trabajar de manera interdisciplinar con diversos perfiles de investigadores en diferentes campos de la investigación. Los problemas que se evidencian durante el proceso son la falta de formación de los investigadores sobre cómo gestionar el ciclo de vida de sus datos manteniendo una estructurada organizada. En estos casos es aplicable el esquema de niveles de cinco estrellas para datos abiertos propuesto por Tim Berners-Lee en el 2006.
Este problema también se ve reflejado en el perfil profesional de los bibliotecólogos y bibliotecólogas que se desempeñan en este rubro. Es necesario desarrollar competencias sobre administración de softwares, vocabularios y esquemas semánticos: metadatos, derechos de autor y licencias alternativas, visualización de los datos, preservación digital, seguridad de los datos, acceso abierto e interoperabilidad. Además de desarrollar habilidades blandas como buena comunicación, trabajo en equipo, facilidad de adaptación y empatía.
No olvidemos que “el valor de los datos reside en su uso” (National Research Council).
[1] FAIR (Findability, Accessibility, Interoperability, and Reusability)
Referencias
1. Aleixandre-Benaventa, R., Ferrer, A., & Peset, F. (2019). Compartir los recursos útiles para la investigación: datos abiertos (open data). Educación Médica, 19(7), 1-8.
2. Hernandez-Perez, T. & Garcia-Moreno, M. (2013). Datos abiertos y repositorios de datos: nuevo reto para los bibliotecarios. El profesional de la información, 22(3), 259-263.
3. Peset, F., Aleixandre-Benavent, R., Blasco-Gil, Y., & Ferrer-Sapena, A. (2017). Datos abiertos de investigación. Camino recorrido y cuestiones pendientes. Anales de Documentación, 20(1), 1-12.
Artículos relacionados
Licenciada en Bibliotecología y Ciencias de la Información por la Universidad Nacional Mayor de San Marcos. Estudiante del Máster en Bibliotecas, Archivos y Continuidad Digital por la Universidad Carlos III de Madrid. Ex-becaria del Programa Iberex de Prácticas Formativas para Profesionales Iberoamericanos en Repositorios Digitales en Bibliotecas del Ministerio de Educación, Cultura y Deporte de España. Con experiencia profesional en repositorios digitales, metadatos, datos abiertos y digitalización en la Pontificia Universidad Católica del Perú (PUCP), Banco Interamericano de Desarrollo (BID), Autoridad Nacional del Agua (ANA), Organismo de Evaluación y Fiscalización Ambiental (OEFA).