loader image

Data mining y Knowledge Discovery in Databases: dos herramientas claves en el análisis de datos

Data mining y Knowledge Discovery in Databases: dos herramientas claves en el análisis de datos

[:es]

Data mining y Knowledge Discovery in Databases: dos herramientas claves en el análisis de datos

equipo8

Por: Diana González-Bravo
MD, Epidemiólogo
Investigador MBE
Neuroeconomix

Hemos explorado el término data mining y cómo es el proceso de extracción de información para obtener insights útiles a partir de  una masa de información, pero, data mining y Knowledge Discovery in Databases ¿son lo mismo? ¿qué se hace con la información obtenida de la minería de datos?

[TheChamp-Sharing count=”1″ total_shares=”ON” title=”COMPARTIR”]

¿Data Mining y Knowledge Discovery in Databases (KDD), son lo mismo?

Podríamos pensar que estos términos en inglés son complicados e intelectuales. La verdad es que la minería de datos es un proceso riguroso pero cotidiano en la investigación de cualquier tipo.

Si bien, la minería de datos y el Knowledge Discovery  en bases de datos (KDD por sus siglas en inglés) se tratan con frecuencia como sinónimos, son términos disímiles pero complementarios.

El objetivo común de la minería de datos y del Knowledge Discovery  es derivar expresiones de características comunes, de un conjunto de datos

La minería de datos es el proceso de búsqueda de  información entre una gran cantidad de datos y es en ella que ocurre la etapa de identificación de las variables que serán analizadas en el proceso de KDD.

Por otro lado, el descubrimiento de conocimiento a partir de bases de datos (KDD- Knowledge Discovery in Databases) es el proceso de extracción y análisis de información, previamente desconocida y potencialmente útil. 

 

¿Cómo se usa la minería de datos y el KKD?

Se utilizan varios algoritmos y técnicas  para el proceso de minería de datos y su posterior análisis, dentro de estas se encuentran:

clasificación, cluster o agrupación, regresión, reglas de asociación, árboles de decisión, entre otras.

Con la enorme cantidad de datos almacenados en archivos, bases de datos y otros repositorios, es cada vez más importante, si no necesario, desarrollar medios poderosos para el análisis y técnicas que faciliten la interpretación de esta información y la extracción de conocimiento. A continuación les explicamos las más relevantes.Estas técnicas son algoritmossofisticados que se aplican sobre un conjunto de datos para obtener resultados útiles, que podrían ayudar en investigación y en la toma de decisiones.

Las técnicas más representativas son:

arboles

 

– Árboles de decisión: es un modelo predictivo que sirve para representar y categorizar condiciones que suceden de forma sucesiva, con el fin de resolver un problema

 

 

modelos data

 

– Modelos estadísticos: son ecuaciones que se emplean en los diseños de investigación para indicar los diferentes factores que modifican las variables de interés

 

 

redes neuronales

 

– Redes neuronales: su nombre, está inspirado en el espectacular funcionamiento del sistema nervioso. Éste es un sistema de interconexiones en una red, cuyo fin es es generar un output robusto a partir de un análisis de alta complejidad.

 

 

Haga click en este link para acceder a un curso gratuito sobre el tema, online, ofertado por el National Programme on Technology Enhanced Learning (NPTEL), con certificado del entrenamiento.

https://alison.com/course/data-analytics-mining-and-analysis-of-big-data

En nuestro próximo blog de herramientas para análisis de datos le mostraremos formas y ejemplos aplicables de cómo pueden usarse estas metodologías en el sector salud.

[likebtn theme=”custom” btn_size=”42″ f_size=”20″ icon_size=”36″ icon_l_c_v=”#8a1414″ icon_d_c_v=”#8a1414″ bg_c=”#ffffff” bg_c_v=”#ffffff” brdr_c=”#ffffff” lang=”es” dislike_enabled=”0″ icon_dislike_show=”0″ alignment=”center”]

Referencias

  1. Han Jiawei, Kamber Micheline, Pei Jian. Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann, Elsevier. 2012.
  2. Altamiranda, L.; Peña, A. M.; Ospino, M.; Volpe, I.; Ortega, D. y Cantillo, E. Minería de datos como herramienta para el desarrollo de estrategias de mercadeo B2B en sectores productivos, afines a los colombianos: una revisión de casos en Sotavento. 2013. 22: 126-136.
  3. Ramageri Bharati M. Data mining techniques and applications. Indian Journal of Computer Science and Engineering. 2010. 4: 301-305
  4. Encyclopedia Birtannica. Data mining, by Christopher Clifton. Fecha de acceso 13/03/2018. Disponible en: https://www.britannica.com/technology/data-mining
  5. Ohsuga. Difference between data mining and knowledge discovery – a view to discovery from knowledge-processing. IEEE International Conference on Granular Computing. 2005. 1: 7-12

SUSCRÍBASE A NUESTRO BLOG

[contact-form-7 id=”361″]
[:]

Share on facebook
Share on twitter
Share on linkedin

Una respuesta

  1. El principio activo del tratamiento para la distrofia congénita de la retina mediada por el RPE65 recibe el nombre de voretigene neparvovec-rzyl. Es un nombre complicado, como el de otros genoterápeuticos, pero opino que su mención también acerca al médico lector a este fascinante tópico.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Publicaciones destacadas
Tiene un proyecto similar

Agende una video llamada y ¡hablemos!

Suscríbase a nuestro blog