¿Qué es la minería de datos o dataminig?

Al trabajar con una gran cantidad de información, se debe trabajar con la minería de datos.

2145

Se estima que en la actualidad, el 98% de los datos con los que se cuenta son de origen digital, mientras que el 2% proviene de fuentes como encuestas, de acuerdo con información de Universia. De hecho, se estima que en la actualidad el ser humano cuenta con más información que nunca en su historia. ¿Cómo se trabaja con todo esto? El modo de hacerlo es a través de la minería de datos, término sobre el que te platicaremos en las siguientes líneas.

Como explicábamos en la actualidad hay una gran cantidad de información, la cual puede estar estructurada, semi estructurada o no estructurada, siendo ésta última la más común. Aunque se cuenta con una número enorme de datos, ¿qué es lo que quieren decir? ¿Cómo se puede extraer conocimiento útil, por ejemplo, para conocer el comportamiento de los consumidores?

Para lograr responder a estas preguntas se recurre a la minería de datos, que se puede definir, según información de Muy Interesante y del portal de Microsoft, la exploración de bases de datos para conseguir conocimiento de valor, producto de determinado de su procesamiento, el cual no sólo ayudará a definir patrones, sino también para realizar predicciones a partir de modelos matemáticos.

Supongamos que al científico de datos se le da un paquete con todas las interacciones que han tenido los usuarios con las redes sociales de una tienda online. La cantidad de información es gigantesca. ¿Cómo se trabaja con ella? Una de las primeras cosas que hará será establecer objetivos para saber qué información en la que tiene que buscar.

Posteriormente, se procesan los datos, se quitan los que no sirven y se le da forma a lo que queda. Luego se determina el algoritmo por el que se hará pasar la base de datos depurada, para analizar los patrones y comportamientos. Finalmente se analizan los resultados que se consiguen.