Você está na página 1de 7

ViBlioSOM: visualización de información bibliometrica mediante el

mapeo autorganizado1
Sotolongo-Aguilar, Gilberto *; Guzmán-Sánchez, María Victoria *
* I Finlay, Habana, Cuba: gsotolongo@finlay.edu.cu ; mvguzman@finlay.edu.cu

Antecedentes
Se ha planteado que en la actualidad se vive una segunda revolución industrial; pero en lugar de vapor, el
impulso de esta nueva revolución es la información. Sin el uso de herramientas automatizadas para el
procesamiento de datos y el uso de indicadores cuantitativos, la asimilación o medición de todo este nuevo
conocimiento o sus implicaciones se escapa a las posibilidades de habilidades y destrezas de cualquier
persona o grupo de personas.

Esta situación, inevitablemente llama la atención sobre disciplinas relacionadas con el análisis de información
como son la bibliometría y la patentometría (considerada esta última como una de las técnicas que componen
el grupo de métodos analíticos pertenecientes a la Bibliometría). Relacionadas con esta disciplina han surgido
una serie de metodologías y herramientas, algunas de ellas con fines muy específicos para un área
determinada o problema, una base de datos señalada, o con un grupo de indicadores limitados. Se puede
añadir, además, que suelen ser herramientas o servicios muy costosos.

Ante la presencia de estos múltiples "modos de hacer" y la existencia de decenas de software (con
limitaciones funcionales), que se deben considerar para estos tipos de estudios, antes se desarrolló una
metodología (MOBIS-ProSoft) que consiste, en esencia, en un sistema modular abierto basado en diferentes
software propietario (Sotolongo, Suárez y Guzmán; 2000). En la metodología se han aplicado, para el
descubrimiento de conocimiento, técnicas de la minería de datos y minería de textos (con determinada
definición estructural).

Como complemento a lo anterior se ha desarrollado un método de visualización de información bibliométrica


mediante el mapeo autorganizado denominado ViBlioSOM ® (marca registrada del Instituto Finlay),
incorporado técnicas basadas en las redes neuronales artificiales (Algoritmo de Kohonen del tipo Self-
Organizing-Maps o SOM), al análisis de información bibliográfica. Lo anterior está basado en
Viscovery®SOMine herramienta que utiliza la tecnología SOM desarrollada por la firma austríaca Eudaptics
Software Gmbh. Son escasos los estudios, en el ámbito internacional, que utilicen el algoritmo SOM para los
fines de los estudios bibliométricos o patentométricos. En el marco de estos trabajos hemos introducido aquí,
en Cuba, el término Patentometría; así como la obtención de mapas científico-tecnológicos sin necesidad de

1
El presente trabajo está basado en la descripción del resultado que formó parte del expediente titulado
"Herramienta para el análisis de oportunidades científico-tecnológicas", que obtuvo el Premio Anual de la
Academia de Ciencias de Cuba 2001.
recurrir a un sistema integral para estos propósitos. Nótese que en el mercado estos sistemas pueden ir desde
algo mas de 7 mil hasta 2 millones de dólares.

Todo lo anterior ha permitido enriquecer el procesamiento, visualización y análisis de los indicadores


bibliométricos, con una metodología propia y a bajo costo. Adicionalmente, se ha considerado la validación
metodológica del sistema. (Sotolongo, Guzmán, Saavedra, Carrillo; 2001).

Objetivos
Los objetivos fundamentales de este trabajo han sido: complementar el desarrollo de MOBIS-ProSoft y
aplicar una metodología propia, menos costosa y universal, para la recuperación, tratamiento y análisis de la
información (ViBlioSOM®), consolidando una infraestructura informática para realizar investigaciones
bibliométricas.

Los métodos y herramientas aquí propuestas pueden ser aplicados a cualquier campo del saber y tienen un
vínculo muy estrecho con los procesos de inteligencia empresarial, vigilancia científico-tecnológica, gestión
del conocimiento y evaluación de proyectos. Al propio tiempo, pueden ser aplicados en servicios
bibliotecarios e informativos y en observatorios de ciencia y tecnología. (Saavedra, Sotolongo, Guzmán;
2000), (Sotolongo, Guzmán, García, Sanz, 1998), (Guzmán, Sanz, Sotolongo, 1998).

Metodología

Sistema para el análisis de información

El MOBIS-ProSoft está condicionado por varios factores como lo son imposibilidad de hacer manualmente
estudios basados en el análisis de grandes volúmenes de datos, el tiempo de trabajo invertido en el
procesamiento manual, la necesidad de hacer este proceso repetitivo, necesidad de validar los resultados, entre
otros. Otros factores están asociados al actual desarrollo tecnológico que permite la aplicación de la
inteligencia artificial al análisis de información como lo es, por ejemplo, la tecnología de las redes neuronales
artificiales.

El MOBIS-ProSoft permite (entre otras ventajas) incorporar nuevos desarrollos sin desarticular la esencia
misma del sistema. Esta flexibilidad está orientada a obtener indicadores precisos, configurarlos o poder
integrar nuevos aspectos resultados de un posterior desarrollo. Se consideró la utilización de software
propietarios por ser estos sistemas documentados, más accesibles y cuyos resultados son validados por la
utilización de múltiples grupos de investigadores. La implemetación del MOBIS-ProSoft consiste en la
integración de varios módulos que permiten realizar las siguientes funciones: búsqueda y recuperación de
información bibliográfica; tratamiento y conversión de ficheros; creación y gestión de bases de datos;
obtención de indicadores; y , el análisis (Sotolongo, Guzmán, García, Sanz; 1998), (Sotolongo, Suárez,
Guzmán; 2000).

Esta plataforma garantiza una secuencia lógica de todos los resultados, desde el primer dato salvado hasta su
posterior representación en mapas. Estos resultados podrán ser reproducidos por cualquier especialista que
conozca el sistema descrito.

Mapas científico-tecnológicos

Como se ha dicho, nuestro propósito en este trabajo,lo constituye la aplicación de las redes neuronales
artificiales (RNA) al análisis de información bibliográfica, ya sea científica como tecnológica. Nos estamos
refiriendo al método denominado ViBlioSOM®.. Este método complementa la metodología anterior
(MOBIS-ProSoft). Mediante la visualización de información bibliométrica, permite descubrir relaciones
significativas entre datos ”primarios” a partir del análisis exploratorio y la minería de datos o texto. Facilita,
además, las representaciones gráficas de los datos, las más novedosas, están asociadas a los mapas (en 2D y
3D) semánticos o de conceptos.

Estos mapas están inspirados en las propias funciones de la corteza cerebral y esta es, posiblemente, la
estructura más fascinante que existe en la fisiología humana. La corteza es en esencia una capa extensa
(aproximadamente de 1m2 , en humanos adultos) y fina (entre 2 y 4 mm de grosor) que consta de seis capas de
neuronas (con un gran nivel de interconexión entre ellas). La corteza, está plegada en la forma conocida con
el objetivo de maximizar la densidad de empaquetado en el cráneo (Freeman y Skapura, 1993), si esa corteza
plegada se extiende se obtendrá una hoja plana con neuronas o elementos de procesamiento. Este hecho
natural es tratado de emular por las RNA de forma computacional, constituyendo la inspiración biológica del
finlandés Teuvo Kohonen para desarrollar en la década de los años ochenta los mapas autorganizados (Self-
Organizing Map o SOM).

En los mapas cada documento (podría ser una patente) ocupa un lugar en el espacio, en función de sus
contenidos temáticos. Cada área del mapa refleja un contenido específico y los tópicos van variando
suavemente a lo largo del mismo. Es decir, se establece una correspondencia entre la información de entrada y
un espacio de salida de dos dimensiones, los datos de entrada con características comunes activarán zonas
próximas en el mapa. Esto permite realizar análisis de datos complejos, información con ruido, y aplicarlo a
grandes volúmenes de información, permite además identificar relaciones de cercanía o similitud, o sea
“descubrir el conocimiento” (Sotolongo, Guzmán, 2001).
Aplicaciones
Las ventajas estratégicas y económicas que representan los resultados obtenidos han sido identificadas en las
propias aplicaciones prácticas hechas por el equipo de trabajo que lo desarrolló; así como por otras
instituciones, de diferentes sectores económicos del país, que ya la han implementado. A partir de estos
trabajos se han identificado situaciones estratégicas que no han sido divulgadas, como son las líneas
tecnológicas en las que trabajan los competidores, alianzas entre empresas, tecnologías emergentes y en
declive, etc. Han permitido solucionar un determinado problema tecnológico, por ejemplo identificándose
procesos para mejorar el petróleo pesado. Se ha evaluado la situación científico-tecnológica de aspectos
importantes dentro de la investigación o la producción y se ha medido la relación entre la investigación y la
innovación.

Un ejemplo concreto, aplicado al estudio del sector de la Biotecnología, específicamente la situación


tecnológica de la Neisseria meningitidis, propició identificar (a partir de un mapa) la alianza tecnológica que
existía entre dos empresas norteamericanas (La Universidad de Rockefeller y la North American Vaccine) y
que ambas, a su vez, posiblemente estuvieran desarrollando innovaciones basadas en la misma línea
tecnológica propuesta por el Centro de Ingeniería Genética y Biotecnología (patente EPX 199203 0474313).

Estas herramientas también fueron aplicadas en la caracterización de los procesos para mejorar el petróleo
pesado. El sector está muy especializado, de forma general. Parece ser que las diferentes organizaciones
trabajan en dos o tres procesos específicos para el tratamiento del petróleo pesado y en dos o tres productos
finales a obtener. La situación del sector, de forma general, se aprecia por la identificación de un cluster
formado por las siguientes organizaciones: Conoco, Inc., Alberta Oil Sands Technology, Intevep, S.A., Gulf
Canada Resources Inc., Petro-Canada Inc., Kureha Kagaku Kogyo Kabushiki Kaisha, Chevron Co., Standard
Oil Company. Estas empresas están trabajando en temas similares de investigación. Sus fortalezas
tecnológicas radican fundamentalmente en procesos relacionados con el Craqueo Catalítico y en menor
medida en procesos térmicos mediante vapor.

Este enfoque también se aplicó en temas tan disímiles como, la dinámica no lineal y la agricultura. Los aquí
presentados son solo dos ejemplo del potencial de estas herramientas.

Referencias.
Freeman JA.; Skapura DM. Redes Neuronales. Algoritmos, aplicaciones y técnicas de programación. México:
Addison-Wesley 1993.
Guzmán, MV.; Sanz, E.; Sotolongo, G. (1998) Bibliometrics Study on Vaccines (1990-1995) Part I: Scientific
Production in Iberian-American Countries. Scientometrics, 43(2):189-205.
Kornikov, A.R. (1997). Intelligent technologies new opportunities for modern industry. Information
Technology, 3:1-14.
Saavedra, O.; Sotolongo, G.; Guzmán, MV. Medición de la producción científica en América Latina en el
campo agrícola y afines: un estudio bibliométrico.). Diciembre del 2000.
Sotolongo, G.; Guzmán, MV. (2001). Aplicaciones de las redes neuronales. El caso de la bibliometría.
Ciencias de la Información, 32(1):27-34.
Sotolongo, G; Guzmán, MV. Saavedra, O.; Carrillo, HA. (2001) Mining Informetrics Data with Self-
organizing Maps. In: Davis, M.; Wilson, CS. (Eds.). Proceedings of the 8 th International Society for for
Scientometrics and Informetrics. Australia July 16-20. Sydney: BIRG; 2001: 665-673.
Sotolongo, G; Guzmán, MV.; García, I.; Sanz, I. (1998). Retos de la bibliometría: la vigilancia y evaluación
de la actividad científico y tecnológica. Reencuentros, 21(abril):39-44.
Sotolongo, G; Suárez, CA.; Guzmán, MV. (2000) Modular Bibliometrics Information System with Propietary
Software (MOBIS-ProSoft): a versatile approach to bibliometric research tools. : Library and Information
Science Electronic Journal (LIBRES), September 30, Volume 10 Issue 2: http://libres.curtin.edu.au/
Figura 1. Dependencia tecnológica de la patente cubana
por empresas norteamericanas.
Clusters (flat) - matriz de tematicas
T e x a c o Mobil Oil Corporation Alberta Oil Authority L i n d e A k t i e n g e s e lM l sict sh ua bf ti s h i
C7 Minister Resources of Canada C3
C6 Atlantic Richfield Co
R.e s e a r c h A s s o c i a t i o n f o r R e s i d u a l O i l P r o c e s s i n g
Exxon Intevep, S.A. C2 S h e l l O i l C oUm
OpPa nLyL C
I dSeumni tOs ui l K
CoosmapnaCnoy . o , fL P t de. n n s y l v a n i a
C5 Chevron Co. Conoco, Inc.
Institut Francais du Petrole C1 Cosmo Oil Co., Ltd.
C4 Standard Oil Company, Indiana UOP
Ashland Oil, Inc.
Phillips Petroleum Company Kureha Kagaku Kogyo Kabushiki Kaisha
Catalysts & Chemicals Industries Co., Ltd.
E n g e l h a r d M i n e r a l s & C h e m i c a l s C o rCpaor m a tei ol nE n e r g y , I n c .
C8 Chiyoda Co., Ltd.
UOP Inc. S - C a l R e sMeiat sr cu hi ECnogripn.e e r i n g & S h i p b u i l d i n g C o . L T D
Kerr-McGee Refining Corporation Southern California Gas Company
UniPure Corporation
Amoco Corporation
Elan Energy Inc.
H y d r o c a r b oA
n lR
b e rsteaaR
r cehs,eIanrcc.h C o u n c i l
Air Products And Chemicals, Inc.
Petro-Canada Inc. Gulf Canada Resources Inc. Gulf Research & Development Company
C o n t i n eHnyt d
a lr oOcial rCboom
n pTaencyh n o l o g i e s ,Petrolite
Inc. Corporation
Delta Central Refining, Inc. CaterpillU a reIdnac,. T o s h i t a k a
American Cyanam China
i d C o Petro-Chemical
mpany Corporation
Allied Corporation
Stone & Webster Engineering Petreleo
Corp. Brasileiro S.A. - S Petrobras
umitomo Chemical Company, Limited
Marathon Oil Company N i h o n S e k i y u H a n b a i K a b uFuji
s h i kOil
i K aCompany,
i s h a N i p p oLtd.
n Mining Co., Ltd.
Nippon Oil Co., Ltd. Hitachi, Ltd.
Pullman Incorporated
C9 Fuji Standard Research, Inc.
Emultec Limited
AGIP Petroli S.p.A. Imperial Chemical Industries (UK)
Sumitomo Metal Industries, Ltd. United States Department of Energy
Remsol (U.S.A.) Corporation
HRI, Inc.
British Gas Corporation
The Pritchard Corporation

Clariant GmbH
M e t a l l g e s e l l s c h a f t A k t i e n gWeos rel ldl sEcnhearfgt y S yEsm t epm
r ess, aI nCcoolropmobr ai at enda d e P eCt raonl a
ed o isa- n
- EOc oc cpiedter onlt a l P e t r o l e u m L t d .
Nalco Chemical Company Laboratorios Paris, C.A.
Bitumen Development Corporation Limited O r m a t P r o c e s s T e c h n o l o g i e s , I n c .
Board of Trustees operating Michigan S Th t aet eS U
t annidv a
e rr d
s i tOy i l C o m p a n y
Canadian Patents & Development Ltd. C i t i e s S eHr ve im
ceisCp hoemr ep aLni cy e n s i n g C o r p o r a t i o n
MHaosescahcshtuA s eGt t s I n s t i t u t e o f T e c h n o l o g y M i n e s a n d R e s o u r c e s C a n a dCao P meptar o g nCi ea nFar d
an a cIanics.e d e R a f f i n a g e
Kashima Oil Co., Ltd. Murphy Oil Company Limited
Shell California Production Inc.

Figura 2. Situación tecnológica del sector petróleo


pesado según los procesos de mejoramiento.

Você também pode gostar