Cualquiera que trabaje en el rubro de los repositorios sabe quién es Libio Huaroto: una figura clave en la creación de los primeros repositorios digitales en el Perú. A fines de los 80, trabajó para la biblioteca de la Facultad de San Fernando de la UNMSM donde poco después se aplicarían los primeros servicios de internet gracias a la Red Científica Peruana. Con esa experiencia pasaría luego a la Biblioteca Central. Ahí, un equipo junto con el apoyo de estudiantes de Bibliotecología e Ingeniería de Sistemas sacaría adelante un proyecto para digitalizar las tesis. Ya en el 2002, la UNMSM aprobaría una resolución que los autorizaba a publicarlas con permiso del autor.
Al principio no todo el mundo estuvo de acuerdo. “Hubo cierta discusión sobre por qué se estaban publicando las tesis pues consideraban que se atentaba contra el derecho de autor. Por supuesto, en un ámbito académico es natural discutir este tipo de proyectos cuando nacen”, cuenta Libio. No obstante, una invitación empujaría la iniciativa hacia ligas mayores: “Pasado un año y medio, se recibió una invitación de la Unesco a través del Sistema de Bibliotecas de la Universidad de Chile y financiamiento para aplicar la metodología Cybertesis en Latinoamérica”. Así, en el 2003, viajaría a Santiago de Chile para conocer la novedosa metodología de origen franco-canadiense.
Cuando Libio volvió al Perú, el equipo de la Biblioteca Central se puso a jugar con la metodología modificándola para hacerla más atractiva. Hasta que, en junio de 2004, presentaron oficialmente la plataforma… con apenas 6 tesis. “Nos habíamos retrasado porque yo tenía la intención de tener mayor número de documentos, pero al final me di cuenta de que los proyectos nacen así, con dos o tres documentos. Finalmente tomamos la decisión de sacarlo con esa cantidad y con el equipo, que eran estudiantes y trabajadores de la biblioteca, nos pusimos a celebrar. Era el 6 de junio de 2004, si no me equivoco, que se lanzó formalmente la plataforma”.
En la actualidad, Libio es responsable del repositorio de la Universidad Peruana de Ciencias Aplicadas (UPC) y un participante activo de los eventos ETD de la Network Digital Library of Thesis and Dissertation (NDLTD). Precisamente, el ETD 2012 que se celebró en el Perú lo organizaron conjuntamente la UNMSM y la UPC.
¿San Marcos fue la primera universidad que implementó un repositorio de tesis?
Formalmente sí. Antes de que empezáramos este movimiento desde San Marcos, había una institución peruana —no recuerdo el nombre— que figuraba en los directorios de repositorios. Yo tuve la oportunidad de participar el 2005 en un evento en Australia sobre las tesis y ahí, justamente, se mostró la estadística de los países donde aparecía en una lámina una línea muy delgada que correspondía a un repositorio en el Perú. Precisamente la participación en estos eventos me dio ideas para plantear una propuesta como Cybertesis, pues valía la pena hacer el esfuerzo de darle énfasis para que se pudiera propagar. Para formalizar el trabajo que veníamos haciendo, hubo una coordinación con la Universidad de Chile, de ese modo San Marcos se convirtió en un nicho de experimentación porque habíamos modificado el código fuente y lo habíamos enviado a la casa matriz en Francia que es la que inicialmente elaboró el código de Cybertesis; posteriormente, parte de ese código fue implementado en la versión distribuida.
Era el contexto de un cierto florecimiento que motivo su difusión en otras universidades. Luego se sumaría la Escuela de Posgrado de la Universidad Nacional de Ingeniería, la Universidad Ricardo Palma y, en el caso de la UPC, nos solicitaron apoyo para realizar un mayor desarrollo de la plataforma. Entonces se implementaron nuevas funcionalidades a la metodología y esos nuevos cambios también se derivaron a Francia. La PUCP también estuvo muy decidida en esa época, pero tuvo que lidiar cerca de dos años con el área de tecnología que tenía a su cargo el proyecto de las tesis digitales desde una óptica distinta, pero al final le dieron la responsabilidad a la Biblioteca Central y fueron ellos los que, en el 2010, si no me equivoco, aplicaron DSpace. Ahora había dos plataformas: una que ya se venía trabajando y otra que se instauraba. Pero toda tecnología tiene sus cosas positivas y negativas, y uno de los problemas que se le criticaba a Cybertesis era lo laborioso del procesamiento.
Lo recuerdo…
Si queremos comparar cómo era la metodología Cybertesis, era lo mismo que trabajar hoy con una revista con marcación Marcalyc donde se requiere más tiempo de procesamiento e inversión de recursos. Esa fue una de las razones fundamentales por las cuales se dejó de usar este estándar hasta que no recibió más el apoyo de los organismos internacionales como la Universidad de Lyon o la Unesco. Pero además porque estaba usando una tecnología antigua y ya no había financiamiento para realizar nuevos desarrollos o mejorar la plataforma. Por eso, con el apoyo del Concytec, todas las instituciones que tenían Cybertesis migraron a DSpace.
Por otro lado, parece que ahora existe todo un ecosistema. Gestionar un repositorio no solo tiene que ver con la parte tecnológica, sino que implica también conocer sobre derechos de autor, medición de la producción científica, aspectos de catalogación, reconocimiento de grados y títulos… En ese sentido, ¿no te parece que ya una sola persona no puede abordar todo un repositorio?
Probablemente algunos ven al repositorio como una máquina más cuando en realidad ese es un enfoque equivocado. Todo lo que implica el repositorio de manera colateral, todo lo que está sumergido, la vinculación con los derechos de autor, la preservación digital, las necesidades del usuario, la visibilidad, no pueden ser abordados por una sola persona hoy en día, y mucho más ahora que se está implantando un nuevo orden a raíz de la pandemia. Una de las cosas que felicito, incluso cuando puede haber sido negativo para algunas universidades, es el licenciamiento. El hecho de incluir como un requisito que todas las universidades tengan un repositorio, ciertamente para aquellos quienes estamos a favor de este movimiento, ha sido extraordinario. Y creo que esa decisión en el contexto de esta pandemia toma mayor realce pues si uno mira las estadísticas de acceso y descarga verá que se han triplicado. Imagina que no se hubiera incluido en el licenciamiento estos repositorios: los usuarios no hubieran podido tener acceso a los documentos que se necesitan para realizar los trabajos de investigación. Lo que se debe hacer es seguir fortaleciendo esa línea con normativas para tener personal capacitado y no una sola persona, sino un equipo de trabajo.
Ahora, recuerdo que antes de que los repositorios empezaran a masificarse se hablaba de diversas plataformas, pero finalmente se posicionó DSpace. Como experto en esta plataforma, ¿qué se aproxima en las actualizaciones? O tal vez ya le hemos sacado tanto el jugo que difícilmente pueda ofrecer más.
El desarrollo de los repositorios, hablando de DSpace por ejemplo, pero sobre todo del protocolo de interoperabilidad como es el caso del OAI-PMH, son herramientas que han quedado desfasadas. Digamos que el acceso abierto no ha acompañado el desarrollo de estas herramientas, no solo por el DSpace sino también por los otros productos. A nivel de COAR, que es la coalición de repositorios, ya desde hace algunos años se viene trabajando en una nueva generación de repositorios, como ellos lo han denominado, y en esa línea hay toda una serie de discusiones y propuestas, pero aún no hay una solución ideal para reemplazar plataformas como DSpace. En Latinoamérica y Norteamérica este producto es muy conocido, pero en Reino Unido o Alemania prefieren otros con características similares que tienen al OAI como herramienta de comunicación. Además, están las empresas comerciales, pero no han tenido el grado de desarrollo que hoy requerimos. DSpace tiene muchos problemas, de hecho, lo tiene la versión actual, la 6.3, pero el reflejo de esta problemática también se traslada a la versión que está en desarrollo, que es la versión 7, que tiene dos o tres años de atraso y aún no tiene fecha para que salga oficialmente. Aun así, en caso salga, tiene que madurar.
Todavía no podría comentar al detalle la nueva plataforma, pero uno de los problemas de cara al usuario, que no creo que resuelva la versión 7, es el tema de la recuperación de información. Hay una necesidad creciente de parte de los usuarios, al menos desde mi experiencia, que están requiriendo una mayor exigencia sobre el modo en que el motor de búsqueda presenta la información. Me parece que eso no se ha abordado en la nueva versión y ahí todavía hay que avanzar. El otro aspecto que reclaman los usuarios es la personalización de la plataforma con una interfaz gráfica más vistosa. Cuando inicié en esto no era muy partícipe de estas modificaciones porque cada vez que hay una actualización todos los cambios realizados se tienen que aplicar a la nueva versión. Pero creo que hoy en día se ha superado esa situación y lo que está prevaleciendo de parte de los usuarios es una mayor vista gráfica sobre la plataforma. Y también, en el marco de la pandemia, lo que se está viendo es el requerimiento de las métricas. DSpace no tiene una herramienta que te permita tenerlas de manera rápida y efectiva. Tienes que usar servicios de terceros que tampoco son herramientas óptimas, por lo menos es lo que se ve en el mercado. Por lo tanto, se tiene que recurrir a herramientas nuevas que permitan obtener rápidamente reportes y métricas, no solo del DSpace, sino del conjunto de plataformas que tiene una biblioteca, me refiero al Open Journal Systems o sistema de bibliotecas como KOHA o algún otro. ¿Cómo puedes obtener todas las métricas de estos recursos en un solo tablero? Por suerte hay herramientas que solucionan eso. De hecho, en la UPC ya hay un primer desarrollo a nivel del OJS, una herramienta llamada Elasticsearch para reportes dinámicos. Sé que otras universidades también están trabajando con una herramienta similar.
Hace poco Virginia Inés Simón, coordinadora del Observatorio del Tratado de Marrakech en América Latina, cuestionaba que en los repositorios no se cuente con mecanismos de acceso para las personas con discapacidad visual. ¿Tienes noticia de algún tipo de repositorio que técnicamente haya resuelto esta necesidad?
El repositorio del Indecopi es uno de los que ahora está trabajando en esa línea. De hecho, han realizado algunas adaptaciones en el código fuente de su software para personas con discapacidad visual; hay algunos lineamientos que se tienen que ajustar para que DSpace pueda adecuarse a estas personas. De ahí no tengo noticia de otra institución. De repente habría que conversar con el equipo del Indecopi para conocer esa experiencia porque no solo es a nivel de adecuación de la plataforma, sino también del material que están colocando. Eso sería importante porque estamos dejando de lado recursos para este grupo de usuarios a nivel de repositorios.
En algunas conferencias has tratado de la representación geoespacial como medio para mejorar la visibilidad de las tesis. ¿En qué consiste?
Este proyecto se desarrolló en la UPC con el objetivo de llevar por la parte visual al usuario pues hay una necesidad de llegar a los recursos a través de entornos gráficos. Cuando me refiero a entornos gráficos no solo me estoy refiriendo a que un portal se vea más bonito y tenga más colores, sino que la forma de acceso se ofrece en diferentes contextos y uno de esos es la representación geográfica. Lo que hicimos fue tomar las tesis de arquitectura, mapear donde habían sido llevadas a cabo pues al ser proyectos arquitectónicos se dan, obviamente, en una ubicación determinada. Entonces tomamos esas tesis, identificamos los lugares, ubicamos las coordenadas UTM y las registramos en el repositorio.
La idea de la georreferenciación no es nueva, es algo que se viene haciendo en otras instituciones. En el caso de la UPC surgieron cosas curiosas que hemos conversado con algunos programas académicos, como Medicina, que planteó que sería interesante que en esa ubicación geográfica se coloque el nombre del asesor porque hay estudiantes que hacen el Serums [Servicio Rural y Urbano Marginal en Salud] y tienen que elegir una zona. Entonces querían saber qué docentes habían asesorado tesis en regiones como la selva. Así podías tener en el mapa del Perú los hitos de dónde se habían hecho las tesis y, al seleccionar uno, expusiera básicamente el título, el autor, el asesor y el enlace. Entonces el estudiante podía saber rápidamente qué asesor había asesorado tales tesis en determinadas regiones. Nos pareció interesante y lo incluimos como parte de la metadata que se veía en el hito, porque en la georreferenciación tienes el mapamundi y cuando llegas al hito se despliega una ventana donde ves un metadato que puedes configurar y colocar ahí los datos que consideres importantes. Además, teníamos en el equipo a una geógrafa que nos ayudó a sacar los reportes por distritos.
Los ejemplos que comentas nos hablan de innovación constante.
Lo que estábamos avizorando era obtener un reporte que entregásemos a los alcaldes de tal manera que el municipio pudiera saber cuáles son los proyectos que se han hecho de arquitectura de manera gráfica, no un informe que tiene cien o doscientas páginas, y que de repente pudieran tomarse alguno de esos proyectos para llevarlos a cabo. Podríamos decir que como universidad es un aporte al desarrollo de la sociedad porque este tipo de proyectos han tenido una metodología de investigación. Además, si eres estudiante y ves que en un distrito se ha hecho una cantidad determinada de tesis podrías enfocarte en otro donde no se ha realizado ninguno. Es interesante seguir explorando ese tipo de iniciativas. Y si una entidad reguladora como la Sunedu puede implementar una directiva en ese sentido, creo que sería beneficioso para que se puedan desarrollar nuevos proyectos a nivel de todas las universidades. Si la información está en el metadato y se centraliza a través de Alicia o Renati, se podrían generar los mapas desde ahí.
Pasando a otro tema, hoy en día se está hablando de los sistemas CRIS (Current Research Information Systems). Hay quienes lo conocen, pero para otros parece un asunto complejo. ¿Qué países o instituciones en el mundo encabezan o son modelos en la aplicación de estos sistemas?
En el marco del #PerúCRIS se dieron a conocer algunos reportes sobre los sistemas CRIS que utilizan hoy en día todas las instituciones académicas y de investigación en el mundo. Una de las cosas que se observó fue que había más de 50 instituciones que utilizan PURE, que es un software comercial. Actualmente algunas universidades como la San Ignacio de Loyola, San Marcos, Pacífico, la Universidad de Lima, son instituciones que ya han adquirido PURE justamente porque tenían un sistema de gestión de apoyo a la investigación hechos en casa y que, en un nuevo escenario, deberían llevarlo a un modelo estandarizado, como es el caso del PURE u otro producto similar. La política que tiene Concytec sobre esto es que van a apostar por una plataforma open source llamado DSpace-CRIS, pero que al final va a cumplir las mismas funciones que el PURE o más bien este se va a tener que adecuar a los lineamientos que se van a dar finalmente en el marco del #PerúCRIS porque todavía no hay algo concreto, es decir, no hay una directriz sobre los campos que se deberán considerar para el procesamiento. En este momento se están discutiendo los metadatos y se espera que esté en las últimas etapas para que luego se publique, así como se hizo con la Guía Alicia 2.0. Hay instituciones que quieren implementar su CRIS, pero si no se tienen claro cuáles son los campos que se van a considerar, es un tanto peligroso querer embarcarse de manera formal en un proyecto donde todavía no se tienen definidos los lineamientos.
En Portugal se iba a llevar a cabo un evento en el que ibas a participar. ¿En qué consistió?
El 2011 fui nominado para formar parte del board del NDLTD junto con una profesora de Brasil para integrar el grupo del comité internacional. Y una de las cosas que hace este comité es el evento anual ETD en cada país. En el Perú se llevó a cabo en el 2012. Los años anteriores he participado bien presentando un proyecto del Perú o como asistente, porque uno tiene que estar al tanto de las experiencias que se desarrollan en el marco de este grupo de las tesis. Es importante que más miembros del Perú puedan en algún momento participar con ponencias o como asistentes, porque siempre ofrece luces para presentarlas en tu institución o en tu país, ya sea en ideas innovadoras o en políticas. Recuerdo que estuve en Washington en el 2015, si no me equivoco, y como parte del evento hubo a la hora del almuerzo algo que ellos llaman el 3MT, que consiste en sustentar una tesis en 3 minutos. Entonces hubo 8 candidatos a doctor que, en ese momento, sustentaron sus tesis.
¡Una tesis doctoral en tres minutos!
Así es. Y al final los asistentes votaron. Me pareció interesante la idea y lo traje a la UPC. Ya vamos en el tercer año y lo realizaremos en noviembre. Este tipo de iniciativas las miras en esos eventos. Por cierto, olvidé comentar que en el contexto de Cybertesis se dio Ateneo, Amauta y también la RPTD [Red Peruana de Tesis Digitales] que eran los recolectores nacionales en ese momento. Esos proyectos precisamente los tomé de esos eventos donde ya veíamos recolectores nacionales y que tecnológicamente no eran nada del otro mundo. Es más, todo lo que se hace a nivel de COAR y proyectos de grandes repositorios, se exponen ahí. Invito a los lectores de esta revista que se inscriban al ETD. Va a ser gratuito este año debido a la pandemia. Si bien está en inglés no creo que haya problemas en ese sentido.
ETD 2020
La conferencia anual ETD 2020 se llevará a cabo en Emiratos Árabes Unidos del 16 al 18 de noviembre en Al Ain, en la United Arab Emirate University. Inscríbete.
Artículos relacionados
Licenciado en Bibliotecología por la UNMSM. Máster en Periodismo y Comunicación de la Ciencia, Tecnología, Medio Ambiente y Salud por la Universidad Carlos III de Madrid. Contacto: cesar_023@hotmail.com
La entrevista a Libio Huaroto es muy interesante y permite apreciar los esfuerzos que se van haciendo para el desarrollo de construir los repositorios de tesis, que son el fruto de la investigación que se hace en el país, o los proyectos que muchas veces no son aprovechados o puestos en practica por poca visibilidad. Contribuciones importantes que se podrían hacer realidad en beneficio del país.
Muy buena entrevista.