DataSOMining


DataSOMining es la primera version que se implementó de la metodologia ViuBlioSOM. Actualmente se encuentra en desarrollo una nueva versión a la que hemos llamado ViBlioSOM Software. Por el momento estamos implementando de manera piloto los algoritmos en el prototipo LabSOM .

La funcionalidad de Data SOMining abarca:

a) Recuperación de datos. Se accesan las fuentes de información y se recuperan los datos a ser analizados (e.g.: registros de publicaciones científicas y de patentes). En esta versión, mediante peticiones de búsqueda se adquieren los registros deseados en la base de datos MedLine.

b) Preprocesamiento de datos. Se verifica la integridad de la base de datos y se normalizan los distintos campos de los registros recuperados, mediante el uso de tesauros y la sustitución de valores.

c) Transformación de datos. Se aplican distintas transformaciones a los datos preprocesados con el fin de utilizarlos posteriormente en la fase de minería de datos. En esta versión se obtienen matrices de frecuencias, clasificaciones y coocurrencias. También permite la aplicación de distintas transformaciones a los datos, tales como los criterios de: Jacard, Curtial, Distribución, Condicional, entre otros.

d) Minería de datos. El sistema permite ajustar los parámetros del algoritmo SOM para entrenar la red neuronal, usando como datos de entrada a las matrices obtenidas en la etapa anterior.

e) Visualización: Se generan diversos mapas para la interpretación de los resultados obtenidos de la red neuronal: mapas de componentes, mapa U-Matrix, Ward y SOM-Ward para delimitar los conglomerados.


Autores: