❦
En cualquier campo científico, la producción de la literatura académica está fuertemente sesgada y es asimétrica en el sentido de que la mayor proporción de la producción de documentos se concentra en un pequeño grupo de individuos altamente productivos. Para medir esta asimetría Alfred Lotka (1926) propuso el modelo del cuadrado inverso que establecía que más o menos el 60% de lo que publican y producen los científicos corresponde a la producción de los pequeños productores de documentos, es decir, aquellos que producen apenas un documento.
Sin embargo, quien inició estas exploraciones no fue precisamente Alfred Lotka sino más bien Arnold Dresden (1922) quien estudió la producción de 278 autores que publicaron 1,102 artículos en la revista American Mathematical Society, Sección de Chicago, en un periodo de 25 años (1897-1922), encontrando que aproximadamente la mitad de los autores (50%) publicaron un artículo y que un grupo de 10 autores aportaban alrededor del 30% del total de artículos publicados en esa revista. Para explicar esta asimetría Dresden utilizó el modelo lognormal, pero su modelo no ganó notoriedad y fue oscurecido por la propuesta de Lotka de 1926, tanto que hasta ahora existen muy pocas exploraciones usando la distribución lognormal.
Sin embargo, originalmente, la ley de Lotka fue aplicada usando el modelo del cuadrado inverso; lamentablemente, el propio Lotka no probó el ajuste estadístico de sus datos y, en su fórmula, dio por sentado que el valor de n es igual a 2; de allí el nombre del modelo de “cuadrado inverso”. Después de muchos experimentos usando la prueba chi-cuadrada, que es un procedimiento estadístico utilizado para determinar si existe una diferencia significativa entre los los valores observados y los valores esperados de los datos, el modelo del “cuadrado inverso” de Lotka fue desechado y reemplazado por un modelo más adecuado llamado de “poder inverso generalizado” (Pao, 1982, 1985). Para estimar el valor de n, Pao recomienda el uso del método de los mínimos cuadrados y en eso fue secundado por Nicholls (1989), quien recomienda el uso de la máxima probabilidad. Entonces, desde la década de los 80 en las aplicaciones de la ley de Lotka, el valor del exponente n dejaba de ser exclusivamente igual a 2 y podría ser 1, 2, 3, 4, 5, …, n dependiendo de los datos observados y de los campos científicos explorados. Aun así muchos “bibliómetras” siguen usando el modelo del cuadrado inverso ya desechado y reemplazado, tampoco se preocupan en ajustar sus datos con ninguna prueba estadística tipo chi-cuadrada o Kolgomorov-Smirnov.
Para estudiar y aplicar este modelo existen muchos softwares gratuitos. Uno, llamado precisamente LOTKA, fue desarrollado por Rousseau & Rousseau (2000). Existe también un paquete llamado “Lotka’s Law” desarrollado por Alon Friedman en el Proyecto R. En este mismo proyecto existen muchos otros paquetes que se pueden usar gratuitamente para evaluar el ajuste de la ley de Lotka; por ejemplo, los paquetes “easynls”, “nls2”, “nlstools” “poweRlaw”, “Gamlss”, “Actuar”, etcétera, etcétera.
La ley de Lotka en su versión equivocada sigue siendo usada y citada con gran profusión a pesar de que existen muchos otros modelos más adecuados que producen mejores resultados. Solo para alertar a los “bibliómetras”, se indican algunos otros modelos que pueden ser revisados pues están disponibles en la literatura publicada:
– Gauss Poisson inversa generalizada
– Poisson lognormal cero truncado
– Poisson compuesto cero truncado
– Binomial negativa cero truncada
– Lagrangian Poisson cero truncada
Uno de los más entusiastas proponentes de estos últimos modelos fue Sichel (1992, 1985). Por otro lado, es bueno recordar que esta asimetría se asemeja a la distribución de Pareto quien en 1906 (20 años antes que Lotka), elaboró una expresión matemática para describir la desigual distribución de la riqueza en Italia, al haber observado que el 20% de las personas poseían el 80% de la riqueza. En manos de la minoría de la población estaba la mayor parte de la riqueza, una expresión muy semejante a la ley de Lotka. Lamentablemente, la distribución de Pareto no ha sido explorada en el campo de la Bibliotecología y la Ciencia de la Información. La que ha sido explorada con mayor énfasis ha sido la ley de Lotka (1926), pero en su versión equivocada ya suplantada y mejorada por los otros modelos señalados en esta nota.
❦
Referencias bibliográficas
Dresden, A. (1922). A report on the scientific work of the Chicago section, 1897-1922. Bulletin of the American Mathematical Society, 28, 303-307.
Lotka, A. J. (1926). The frequency distribution of scientific productivity. Journal of the Washington Academy of Sciences, 16(12), 317-323.
Nicholls, P. T. (1989). Bibliometric modeling processes and the empirical validity of Lotka’s law. Journal of the American Society for Information Science, 40(6), 379-385.
Nicholls, P. T. (1989). Bibliometric modeling processes and the empirical validity of Lotka’s law. Journal of the American Society for Information Science, 40(6), 379-385.
Pao, M. L. (1982). Lotka’s test. Collection management, 4(1/2), 111-124.
Pao, M. L. (1985). Lotka’s law: a testing procedure. Information processing & management, 21(4), 305-320.
Rousseau, N, Rousseau, R. (2000). LOTKA: A program to fit a power law distribution to observed frequency data. Cybermetrics: International Journal of Scientometrics, Informetrics and Bibliometrics 4.
Sichel, H. S. (1992). Anatomy of the generalized inverse Gaussian-Poisson distribution with special applications to bibliometric studies. Information Processing & Management, 28(1), 5-17.
Sichel, H. S. (1985). A bibliometric distribution which really works. Journal of the American Society for Information Science, 36(5), 314-321.
Artículos relacionados
Doctor en Ciencia de la Información.
Bibliotecólogo Emérito por la Universidad de California en Riverside (EE. UU.). Participa regularmente en congresos y eventos de la especialidad presentando resultados de investigación en bibliometría, información e ideología, y sociología de la información. ORCID: 0000-0001-5014-801X. Contacto: ruben@ucr.edu