fbpx
imagen del cargador

Data mining y Knowledge Discovery in Databases: dos herramientas claves en el análisis de datos

equipo8

Por: Diana González-Bravo
MD, Epidemiólogo
Investigador MBE
Neuroeconomix

Hemos explorado el término data mining y cómo es el proceso de extracción de información para obtener insights útiles a partir de  una masa de información, pero, data mining y Knowledge Discovery in Databases ¿son lo mismo? ¿qué se hace con la información obtenida de la minería de datos?

¿Data Mining y Knowledge Discovery in Databases (KDD), son lo mismo?

Podríamos pensar que estos términos en inglés son complicados e intelectuales. La verdad es que la minería de datos es un proceso riguroso pero cotidiano en la investigación de cualquier tipo.

Si bien, la minería de datos y el Knowledge Discovery  en bases de datos (KDD por sus siglas en inglés) se tratan con frecuencia como sinónimos, son términos disímiles pero complementarios.

El objetivo común de la minería de datos y del Knowledge Discovery  es derivar expresiones de características comunes, de un conjunto de datos

La minería de datos es el proceso de búsqueda de  información entre una gran cantidad de datos y es en ella que ocurre la etapa de identificación de las variables que serán analizadas en el proceso de KDD.

Por otro lado, el descubrimiento de conocimiento a partir de bases de datos (KDD- Knowledge Discovery in Databases) es el proceso de extracción y análisis de información, previamente desconocida y potencialmente útil. 

 

¿Cómo se usa la minería de datos y el KKD?

Se utilizan varios algoritmos y técnicas  para el proceso de minería de datos y su posterior análisis, dentro de estas se encuentran:

clasificación, cluster o agrupación, regresión, reglas de asociación, árboles de decisión, entre otras.

Con la enorme cantidad de datos almacenados en archivos, bases de datos y otros repositorios, es cada vez más importante, si no necesario, desarrollar medios poderosos para el análisis y técnicas que faciliten la interpretación de esta información y la extracción de conocimiento. A continuación les explicamos las más relevantes.Estas técnicas son algoritmossofisticados que se aplican sobre un conjunto de datos para obtener resultados útiles, que podrían ayudar en investigación y en la toma de decisiones.

Las técnicas más representativas son:

arboles

 

– Árboles de decisión: es un modelo predictivo que sirve para representar y categorizar condiciones que suceden de forma sucesiva, con el fin de resolver un problema

 

 

modelos data

 

– Modelos estadísticos: son ecuaciones que se emplean en los diseños de investigación para indicar los diferentes factores que modifican las variables de interés

 

 

redes neuronales

 

– Redes neuronales: su nombre, está inspirado en el espectacular funcionamiento del sistema nervioso. Éste es un sistema de interconexiones en una red, cuyo fin es es generar un output robusto a partir de un análisis de alta complejidad.

 

 

Haga click en este link para acceder a un curso gratuito sobre el tema, online, ofertado por el National Programme on Technology Enhanced Learning (NPTEL), con certificado del entrenamiento.

https://alison.com/course/data-analytics-mining-and-analysis-of-big-data

En nuestro próximo blog de herramientas para análisis de datos le mostraremos formas y ejemplos aplicables de cómo pueden usarse estas metodologías en el sector salud.

Referencias

  1. Han Jiawei, Kamber Micheline, Pei Jian. Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann, Elsevier. 2012.
  2. Altamiranda, L.; Peña, A. M.; Ospino, M.; Volpe, I.; Ortega, D. y Cantillo, E. Minería de datos como herramienta para el desarrollo de estrategias de mercadeo B2B en sectores productivos, afines a los colombianos: una revisión de casos en Sotavento. 2013. 22: 126-136.
  3. Ramageri Bharati M. Data mining techniques and applications. Indian Journal of Computer Science and Engineering. 2010. 4: 301-305
  4. Encyclopedia Birtannica. Data mining, by Christopher Clifton. Fecha de acceso 13/03/2018. Disponible en: https://www.britannica.com/technology/data-mining
  5. Ohsuga. Difference between data mining and knowledge discovery – a view to discovery from knowledge-processing. IEEE International Conference on Granular Computing. 2005. 1: 7-12
Compartir en facebook
Compartir en twitter
Compartir en linkedin
0 Comments
Inline Feedbacks
View all comments
Tiene un proyecto similar

Agende una video llamada y ¡hablemos!

Suscríbase a nuestro blog