Roxana Cerda-Cosme es especialista en gestión de la información científica. Desde que egresó de la carrera de Bibliotecología y Ciencias de la Información en San Marcos en el 2008, se interesó por los repositorios digitales cuando en el Perú casi nadie hablaba de DSpace y aún pocas universidades utilizaban la plataforma Cybertesis. De forma autodidacta, Roxana estudiaba el software esperando que en algún momento se presentara la oportunidad de aplicar sus conocimientos, y ese momento llegó en el 2012, cuando la Pontificia Universidad Católica del Perú convocó a profesionales que conocieran esos temas. Un año después obtendría su título con un trabajo sobre repositorios y con el paso del tiempo brindaría asesorías a diversas instituciones. Ahora es profesora asociada del Departamento de Biblioteconomía y Documentación de la Universidad Carlos III de Madrid. En dicha universidad obtuvo su máster y viene realizando el doctorado. Su interés actual es la gestión de datos de investigación científica y la ciencia abierta.
❦
Católica (Pontificia Universidad Católica del Perú) fue una de las primeras en instalar DSpace, incluso antes que San Marcos, que estaba con la metodología Cybertesis.
Cuando decidí hacer mi informe profesional, fue un año antes de entrar a Católica. Yo le tengo mucho cariño a mi informe porque cuando comencé a hacerlo justo San Marcos estaba en esa transición de pasar de la metodología Cybertesis a DSpace, y yo tuve que aprender esa metodología que era de verdad bastante engorrosa; no era tan amigable como DSpace. En ese momento, Católica fue la primera en instalar DSpace en el Perú.
Fue un momento de descubrimiento de parte de los profesionales involucrados, sobre todo de los bibliotecólogos; había mucho entusiasmo sobre el acceso abierto. En tu informe profesional presentas una guía, que es la Guía para la evaluación de repositorios institucionales de investigación de RECOLECTA. Hoy en día, el Concytec hace uso de esa guía porque tiene unos criterios base. En ese sentido, eres una pionera. ¿Qué te parece?
Bueno, me parece fantástico. Pero no por el calificativo de pionera. Obviamente, es saludable que entre colegas reconozcamos lo que cada uno ha aportado, pero digo fantástico porque si ya Perú está pensando en evaluar sus repositorios, es una manera constructiva de avanzar.
El sociólogo Joaquín Yrivarren ha escrito sobre la historia del acceso abierto en el Perú desde una mirada de los ideales que se pusieron allí, sobre todo el ideal de compartir la información para hacer un bien.
A mí me pasó algo muy interesante con el tema de los repositorios. Si bien es cierto que Católica fue la primera que instaló DSpace y el esquema de metadatos, llegó un momento en que se comenzó a hacer charlas para compartir lo que habíamos hecho. Gracias a eso, conozco casi todo el Perú dando charlas sobre metadatos y repositorios. Entonces, lo que te puedo decir, no solo de la mirada de Lima, sino de provincia, es que el primer paso era que todas las universidades tengan un repositorio y se publiquen las tesis. Pero una mirada más allá, por ejemplo, es que la universidad de Cusco (Universidad Nacional de San Antonio Abad del Cusco) tiene un patrimonio histórico y artístico muy importante que está guardado físicamente, pero lamentablemente no hay inversión para hacer la digitalización de todo ese acervo cultural. Ni hablar de lo que la selva tiene en sus bibliotecas sobre sus dialectos y cultura. Yo creo que ese debería ser el segundo paso, porque es cierto que hoy por hoy todos los repositorios tienen tesis, pero los repositorios no son solo para tesis, puedes publicar muchas cosas más.
La digitalización es una de las partes más costosas, ¿no?
Aparte de la digitalización, el tema de espacio en el disco, que tenga una alta calidad y encontrar un profesional que maneje toda la técnica, que sepa sobre todo hacer un buen esquema de metadatos para un tipo específico de documento. El repositorio de la PUCP me dio mucha experiencia no solo de tesis, sino sobre todo el bagaje que se puede publicar en un repositorio. Cuando ya fui a provincia me di cuenta que había tanto material para digitalizar que yo me preguntaba por qué no lo digitalizan. Y me respondían, primero, porque no tenemos el aparato; segundo, no tenemos una persona que sepa guiarnos y no tenemos personal. En sí no tenemos inversión.
No hay una política al final de cuentas.
Claro, se ha hecho hincapié en el tema de investigación, que me parece muy bien, pero también se puede ir un paso más allá.
Hacer un rescate del patrimonio cultural, que puede digitalizarse y mostrarse en los repositorios, sería muy valioso.
Yo creo que la infraestructura para repositorios ya está hecha, la gente ya sabe qué son, ya sabe qué es un metadato. Eso por un lado. El siguiente paso es enfatizar en el conjunto de datos que son producto de la investigación. ¿Dónde están? ¿Son encontrables? ¿Los puedo reutilizar?
Esos son los principios FAIR (del inglés Findable, Accessible, Interoperable y Reusable), ¿cierto?
Sí, los principios FAIR de la gestión de datos. Esos principios se dan porque se necesitaban buenas prácticas para la gestión de datos de investigación. ¿Por qué? Porque tu conjunto de datos tiene que ser encontrable. ¿Cómo? A través del uso de identificadores persistentes, por ejemplo. Una vez que lo encuentro, tiene que ser accesible. ¿Está en acceso abierto? Muchas veces los autores no tienen el permiso para que puedan compartir sus datos, eso no quiere decir que no puedas compartir el esquema de metadatos. Eso a mí como investigadora me ayuda un montón porque si bien no puedo acceder a los datos ya me da una luz de que se está haciendo alguna investigación sobre el mismo tema. De repente después me puedo contactar contigo.
Claro, para colaborar.
Entonces ya los encontré, ya pude acceder, pero tienen que ser interoperables, es decir, que pueda hablar con otros sistemas informáticos para que haya más visibilidad y se pueda compartir. Y sobre todo en lo que más se hace hincapié hoy en día es que puedan ser reusables. ¿Cómo? Pues que tenga una buena licencia, es decir, hasta dónde yo puedo usar tus datos; y que pueda ser reproducible, o sea, que si hago el mismo estudio tengo que llegar a los mismos resultados. ¿Sabes que durante la investigación que hice para mi primer paper para el doctorado me di con la sorpresa de que algunos artículos que fueron publicados durante la pandemia al día de hoy ya no están publicados porque se reutilizaron los datos y no se llegó a las mismas conclusiones? Eso quiere decir que hubo algo raro porque no puede ser reproducible.
¿Aplicaste estos principios en la elaboración de tu trabajo de fin de máster?
El trabajo de fin de máster fue interesante porque justo se dio en una etapa en la cual estábamos todos encerrados por el covid-19. Y pasó algo curioso, porque el covid, si bien es cierto aceleró el ingreso de la tecnología a nuestra vida, no solamente pasó en el día a día, también pasó en la comunicación científica, porque es el periodo donde más papers se han publicado y las editoriales comerciales se unieron y dieron el acceso abierto a todos los papers que tengan que ver con covid. Y yo decía: “Okey, muy bonito que se compartan los papers… ¿Y los datos? ¿Dónde están los datos?”. Debido a que al momento de hacer mi investigación no había muchos antecedentes sobre metodología cualitativa para la gestión de datos de investigación, lo que hicimos fue bajar todos los papers que se habían publicado durante el 2020 con alguna afiliación española y ver dónde estaban los datos de esos artículos.
¿Cuál fue la sorpresa?
Nos dimos cuenta que del 100%, solo el 12.5% había compartido sus datos de alguna manera. No te estoy diciendo que lo habían compartido como se recomienda, es decir, en un repositorio. Sí había autores que habían compartido en un repositorio, otros que el conjunto de datos estaba como material suplementario del artículo, como un anexo, o algunos que no tenían permiso para compartir. De este grupo pequeño del 12.5%, solo el 2.1% lo había compartido correctamente en un repositorio. Entonces, del 100% solo el 2.1% había hecho uso de repositorio de datos. Fue interesante en las conclusiones llegar al hecho de que, primero, hay una necesidad alta de capacitación para los investigadores. Los investigadores no comparten más datos no porque no quieran, sino porque no lo saben hacer. Vayamos a lo más básico: ¿qué es un dato? Muchas veces encontraba unos artículos que decían datos complementarios o datos de investigación, y lo que encontraba eran tablas o figuras. Eso no son los datos. Una tabla es la tabulación de mis datos originales. Lo que yo quería era saber dónde estaban los datos. Había mucha confusión de lo que es un dato de investigación. Durante la pandemia, el primer punto para comenzar a encontrar la vacuna fue que se compartió el código genético del virus. Imagínate si ese investigador no hubiese compartido eso correctamente en un repositorio para datos genéticos.
¿Y existen guías que el investigador puede consultar si quiere publicar sus datos?
Sí. Después de casi tres años desde que comenzó la pandemia, ya las editoriales han colocado buenas prácticas de ciencia abierta, incluso algunos indexadores te piden que tu revista tenga buenas prácticas de ciencia abierta, es decir, una declaración de disponibilidad de datos. Las editoriales te dan toda la información sobre dónde debes depositar tus datos, cuáles son las licencias que tienes que publicar para tu conjunto de datos, qué es un plan de gestión de datos. Obviamente, la persona más idónea somos los profesionales de la información, pero la pregunta ahí es si estamos capacitados hoy para hacer frente a lo que los investigadores nos pregunten, por ejemplo, sobre un plan de gestión de datos, identificadores persistentes o cómo hacer un buen esquema de metadatos.
Por lo tanto, es un campo que hay que explorar.
Y en constante cambio. Al inicio te pedían que sepas sobre metadatos, repositorios, interoperabilidad y acceso abierto. Hoy, cuando veo las ofertas de trabajo, piden que sepas un software para limpieza de datos, que sepas Open Refine, porque no es lo mismo que cures diez líneas de metadatos a tres mil; o que sepas manejar Python, R, o un software para visualización de datos.
Hasta SQL y ese tipo de cosas. También he visto varias convocatorias con ese perfil. Parece que ya está insertado entre las nuevas competencias del nuevo profesional.
Pero otra cosa que yo valoro mucho cuando he querido sumar personas a mi equipo es que tengan alta minuciosidad, porque cuando trabajas con metadatos tienes que ver el detalle, porque si vuelas una línea borras todo el esquema.
Yo conozco de cerca los metadatos de Renati que llegan de todas las universidades recolectadas. Son alrededor de medio millón de registros y hay que hacer un trabajo de limpieza de todo eso. Allí se ve la necesidad de que gestores de repositorios tengan la formación y la sensibilidad de la importancia de los metadatos porque eso sirve para realizar luego estudios, digamos, de la producción académica nacional.
En Lima hay buenos profesionales de la información, más mujeres también a cargo de los repositorios. Cuando yo comencé a trabajar todos eran hombres. Ahora me ha dado mucho gusto que en la última reunión del Concytec había más chicas. Eso por un lado, y, por otro, es que en Lima por lo menos contamos con profesionales de la información a cargo de repositorios. En provincia muchas veces recae sobre ingenieros informáticos que no están ajenos a querer aprender. El tema es que nadie llega a enseñarles. Primero no hay una persona que sepa sobre estos temas y no hay una persona que pueda tener voz propia frente a las autoridades y decirles: “Mira, por más que tengas muy bonito tu tesis o lo que vayas a publicar en el repositorio, si no tiene un buen sistema de metadatos no lo va a encontrar nadie”. Pero claro, si una persona no tiene los conocimientos no puede defender su posición, a menos que le entreguen los metadatos. Eso es otra cosa. A mí me pasó que tenía fotografías de la vestimenta de mujeres del año 60, pero no había nada, ni siquiera algo escrito detrás de la foto. Ahí tienes que ponerte a buscar.
Cuando has llegado a España a hacer la maestría te has encontrado con tu sensei, con Eva Méndez. En Twitter ella se define como militante del acceso abierto, ha formado parte del comité asesor del Dublin Core Metadata Initiative que usamos en los repositorios y ha participado también en OpenAire.
Ahora está en CoARA, que es la coalición que está promoviendo una apertura a la ciencia para poder formar una comunidad en la cual se pueda evaluar la información científica de manera diferente. No solo con rankings, no solo con cuartiles, sino que haya una nueva forma de comunicación, porque recuerda que el siguiente paso del movimiento de acceso abierto es la ciencia abierta. Yo creo que ahora Eva, más que una militante del acceso abierto, también es una militante de generar un nuevo espacio de evaluación de la comunicación científica a partir de la apertura de la ciencia.
Entiendo que Eva también es tu asesora para la tesis doctoral.
Yo solicité que sea mi asesora y ella lo aceptó. Es una persona muy directa, me encanta por eso. Me acuerdo que en la primera reunión que tuvimos de TFM me dijo: “A ver, ¿tú vas a dar el TFM por el cartón o porque quieres aprender?”. Y yo: “Porque quiero aprender”. Cuando terminé el TFM, me dijo: “¿Por qué no apuestas por el doctorado? Tu tema de investigación es bastante interesante”. Y yo dije sí, porque de lo que yo era consciente es que cuando vine de Perú tenía un buen currículo a nivel profesional, pero no tenía un perfil muy marcado de investigadora y yo quería desarrollar esa parte, yo quería publicar, es por eso que también tomé la decisión de hacer el doctorado porque mi tesis es por recopilación de artículos. Eso me daba una ventana para seguir publicando y generar mi camino como investigadora. Desde el día uno Eva ha sido, más que una tutora, una buena amiga. Ella lo primero que me preguntaba al inicio era: “¿Has comido?, ¿tienes dónde vivir?, ¿tienes trabajo?” Y yo decía: “Sí”. “Entonces podemos comenzar a trabajar”. Eso lo valoro mucho, porque a otra persona no le importa. Y siempre te está retando: “¿Y para cuándo la conferencia en inglés? ¿Y para cuándo la estancia internacional?”. Estoy bastante contenta con la tutora que tengo.
¿Cómo es que has llegado a convertirte en una profesora asociada del Departamento de Biblioteconomía y Documentación de la Universidad Carlos III de Madrid? No sé si hubo otro bibliotecólogo peruano enseñando en una universidad europea.
Yo tuve la misma duda. He encontrado colegas colombianos, brasileros, chilenos, pero no peruanos. No sé si es que antes de mí hubo otra persona que también ha sido profesora asociada de la UC3M. Uno de los factores para que tu puedas ser profesora asociada es que tengas un buen currículo profesional. Entonces me acuerdo que Eva me lo propuso, me presenté y me llamaron. Y de verdad te digo una cosa: ha sido una experiencia muy grata; exhausta, pero enriquecedora, porque aparte del doctorado y de dar clases como profesora, también trabajo como coordinadora en una editorial de revistas médicas. Pero ha sido muy gratificante porque ver el debate de los alumnos en clase es otra energía. Por lo menos en el curso de Género, Ciencia y Tecnología, ver cuál es su modo de pensar en los debates que hay de acuerdo a cuánto se ha avanzado aquí en los derechos de la mujer. Y el otro curso de Técnicas de Búsqueda y Uso de Información para mí fue un reto porque eran alumnos de ingeniería aeroespacial, aeronáutica, cosas que en Perú yo no había visto.
Eres una especialista en la gestión de la información científica, has cumplido con los grados que es otra de las metas profesionales que normalmente uno se impone, también eres profesora universitaria que es el sueño de muchos colegas y realizas trabajo como editora de una revista científica en el área de la salud. ¿Cómo te sientes?
Te puedo decir que me siento feliz y agradecida. Pero también entiendo que lo que me está pasando, las oportunidades que se vienen dando, responden a años de trabajo, a horas frente al ordenador leyendo cosas que en el Perú aún no se daban, horas que al día siguiente tenía que dar una conferencia y estás cansada y quieres cerrar el ordenador, pero dices no, mañana no tiene que salir ni un error. Y también entiendo que lo que me está pasando es en parte, primero, de creer que tú puedes y de confiar en tus capacidades, de ver el camino recorrido y decir: “¿Sabes qué? Yo puedo. ¿Que se viene un reto más grande? Yo puedo”. Yo buscaba un referente y no lo encontré, entonces me tuve que inventar y soñar en grande. Segundo, tener la valentía para poder dejar a tu familia, emigrar a otro país, ser bastante resiliente, mirar para adelante, siempre para adelante. No diría que es suerte. Hubo veces en el que con toda la ilusión del mundo he aplicado a una beca y no me la daban. Y llegó el momento en que decía: “No preguntes por qué no te dan, pregunta ¿para qué te está pasando eso? Por algo pasa”.
Uno puede considerar que los metadatos son cosas aburridas, pero mira hasta dónde te pueden llevar estos temas.
Es que, de verdad, cuando empecé la carrera jamás me hubiese imaginado todas las puertas que me iba a abrir. Pero también me he dado cuenta que depende mucho de la persona, si tiene el coraje de afrontar los retos, porque yo recuerdo que muchas veces he llamado a gente para que trabaje conmigo, yo enseñándoles inclusive, y he recibido respuestas como que: “Mira, a mí déjame catalogando que yo soy feliz catalogando, a mí no me hables de más cosas”. He tenido capacitaciones en las cuales las personas a las que yo les he enseñado DSpace se han parado y me han dicho: “A mí no me enseñes eso”, y se han ido. Y luego, pasado el tiempo, me han dicho: “Muchas gracias por enseñarme que la tecnología no muerde”.
Artículos relacionados
Licenciado en Bibliotecología por la UNMSM. Máster en Periodismo y Comunicación de la Ciencia, Tecnología, Medio Ambiente y Salud por la Universidad Carlos III de Madrid. Contacto: cesar_023@hotmail.com