El objetivo de la unidad de investigación es el desarrollo de teorías, técnicas y sistemas para extraer y entregar conocimiento útil de grandes masas de datos.
Hoy en día, el descubrimiento de conocimiento y la minería de datos es una tecnología que combina métodos de análisis de datos con algoritmos sofisticados para procesar grandes conjuntos de datos, y un campo de investigación activo que tiene como objetivo desarrollar nuevos métodos de análisis de datos para nuevas formas de datos. Por un lado, las herramientas de clasificación, agrupamiento y descubrimiento de patrones ahora forman parte de sistemas maduros de análisis de datos y Business Intelligence y se han aplicado con éxito a problemas en varios dominios comerciales y científicos. Por otro lado, la creciente heterogeneidad y complejidad de las nuevas formas de datos, como las que provienen de la medicina, la biología, la Web, los sistemas de observación de procesos biológicos, los datos de movilidad que llegan de las redes inalámbricas, requieren nuevas formas de patrones y modelos, junto con nuevos algoritmos para descubrir dichos patrones y modelos de manera eficiente.
En este contexto, la misión del laboratorio KDD es buscar investigación fundamental, aplicaciones estratégicas y educación superior.
En la era del Big Data, las organizaciones modernas recopilan, almacenan y analizan cada vez más los datos específicos de las personas.
Estos datos generalmente describen diferentes dimensiones de la vida social diaria y son el corazón de una sociedad del conocimiento, donde la comprensión de los fenómenos sociales complejos se sustenta en el conocimiento extraído de los mineros de grandes datos a través de las diversas dimensiones sociales mediante el uso de la minería de datos, la máquina Aprendizaje y tecnologías de IA.
Uno de los desafíos más apremiantes y fascinantes que enfrenta la ciencia de datos hoy en día es comprender la complejidad de nuestra sociedad interconectada globalmente. Los grandes datos que surgen de las migas de pan digitales de las actividades humanas prometen permitirnos examinar la verdad fundamental del comportamiento individual y colectivo con un detalle y escala sin precedentes. Hay una necesidad urgente de aprovechar estas oportunidades para el avance científico y para el bien social. El principal obstáculo para este logro, además de la escasez de científicos de datos, es la falta de una infraestructura abierta a gran escala, donde se puedan llevar a cabo grandes investigaciones de datos y minería social.
Se desarrollan como áreas de Trabajo:
- Investigación: perfeccionamiento de estrategias y técnicas existentes (Reporting Odds Ratio, proportional reporting ratio, Yule’s Q, Poisson probability, Chi-square test, information Component) y desarrollo de coeficientes especiales de comparación.
- Extensión: Aplicación de las herramientas de descubrimiento de conocimiento a:
- Base de datos de reportes de farmacovigilancia:
- Centro de Vigilancia y Seguridad de Medicamentos
- FAERS
- Redes Sociales (Facebook, Twitter, otras)
- Base de datos de reportes de farmacovigilancia:
- Docencia
- Desarrollo de curso de Estadística orientado a pregrado.
- Desarrollo de un programa de capacitación en Big Data & Analytics