DataSOMining
DataSOMining
es la primera version que se implementó de la metodologia ViuBlioSOM. Actualmente se encuentra en desarrollo una nueva versión a la que hemos llamado ViBlioSOM Software. Por el momento estamos implementando de manera piloto los algoritmos en el prototipo LabSOM .
La funcionalidad de Data SOMining abarca:
a) Recuperación de datos. Se accesan las fuentes de información y se recuperan los datos a ser analizados (e.g.: registros de publicaciones científicas y de patentes). En esta versión, mediante peticiones de búsqueda se adquieren los registros deseados en la base de datos MedLine.
b) Preprocesamiento de datos. Se verifica la integridad de la base de datos y se normalizan los distintos campos de los registros recuperados, mediante el uso de tesauros y la sustitución de valores.
c) Transformación de datos. Se aplican distintas transformaciones a los datos preprocesados con el fin de utilizarlos posteriormente en la fase de minería de datos. En esta versión se obtienen matrices de frecuencias, clasificaciones y coocurrencias. También permite la aplicación de distintas transformaciones a los datos, tales como los criterios de: Jacard, Curtial, Distribución, Condicional, entre otros.
d) Minería de datos. El sistema permite ajustar los parámetros del algoritmo SOM para entrenar la red neuronal, usando como datos de entrada a las matrices obtenidas en la etapa anterior.
e) Visualización: Se generan diversos mapas para la interpretación de los resultados obtenidos de la red neuronal: mapas de componentes, mapa U-Matrix, Ward y SOM-Ward para delimitar los conglomerados.
Autores:
|