Introducción a la minería de datos

Aquí, en este artículo, aprenderemos acerca de la introducción a la minería de datos, ya que los humanos han estado extrayendo de la tierra durante siglos, para obtener todo tipo de materiales valiosos. A veces, durante la minería, se descubren cosas desde el suelo que nadie esperaba encontrar en primer lugar. Por ejemplo, en 1898, durante la excavación de una tumba para encontrar momias en Saqqara, Egipto, se encontró un artefacto de madera que se parecía exactamente a un avión. ¡Se remonta al año 200 aC, hace unos 2200 años! Pero, ¿qué información posible podríamos obtener de un gran conjunto de datos? E incluso si comenzamos a extraerlo, ¿hay alguna posibilidad de obtener resultados inesperados del conjunto de datos? Antes de eso, veamos qué es exactamente la minería de datos.

¿Qué es la minería de datos?

  • Básicamente es la extracción de información / conocimiento vital de un gran conjunto de datos.
  • Piense en los datos como un gran terreno / superficie rocosa. No sabemos qué hay dentro, no sabemos si hay algo útil debajo de las rocas.
  • En esta introducción a la minería de datos, buscamos información oculta, pero sin tener idea de qué tipo de información queremos encontrar y para qué planeamos usarla, la encontramos.
  • Al igual que en el concepto de minería tradicional, en la minería de datos también hay varias técnicas y herramientas, que varían según el tipo de datos que extraemos, por lo que hemos aclarado qué es la minería de datos a través de este tema de introducción a la minería de datos.

Ejemplo de minería de datos

Hemos aprendido acerca de la introducción a la minería de datos en la sección anterior y ahora procedemos con los ejemplos de minería de datos, que se enumeran a continuación:

  • Entonces, hay un operador de red móvil. Consultan a un minero de datos para profundizar en los registros de llamadas del operador. No se otorgan objetivos específicos al minero de datos.
  • Se da un objetivo cuantitativo de encontrar al menos 2 nuevos patrones en un mes.
  • Cuando el minero de datos comienza a investigar los datos, encuentra un patrón de que hay menos llamadas internacionales el miércoles en comparación con otros días.
  • Esta información se comparte con la gerencia y se les ocurre el plan para reducir las tarifas de llamadas internacionales los miércoles y comenzar una campaña.
  • Las tarifas de llamadas aumentan, los clientes están contentos con el bajo precio de las llamadas, ¡más clientes se registran y la compañía gana más dinero! ¡Ganar-ganar!

Teniendo en cuenta el ejemplo anterior, veamos ahora los diversos pasos involucrados en la minería de datos.

Pasos involucrados en la minería de datos

Hemos aprendido sobre la introducción a la minería de datos en la sección anterior y ahora estamos avanzando con los pasos involucrados en la minería de datos, que se enumeran a continuación:

  • Entendimiento empresarial

En esta Introducción a la minería de datos, entenderemos todos los aspectos de los objetivos y necesidades comerciales. La situación actual se evalúa mediante la búsqueda de recursos, supuestos y otros factores importantes. En consecuencia, establecer una buena introducción al plan de minería de datos para lograr los objetivos comerciales y de minería de datos.

  • Comprensión de datos

Inicialmente, los datos se recopilan de todas las fuentes disponibles. Luego elegimos el mejor conjunto de datos desde donde podemos extraer los datos que podrían ser más beneficiosos.

  • Preparación de datos

Una vez que se identifica el conjunto de datos, se selecciona, limpia, construye y formatea en la forma deseada.

  • Modelado de datos

Es un proceso de remodelación de los datos dados de acuerdo con los requisitos del usuario. podrían crearse uno o más modelos en el conjunto de datos preparado y, por último, los modelos deben evaluarse cuidadosamente con la participación de las partes interesadas para asegurarse de que los modelos creados cumplan con las iniciativas empresariales.

  • Evaluación

Este es uno de los procesos más necesarios en la minería de datos. Incluye revisar todos los aspectos del proceso para verificar cualquier posible falla o fuga de datos en el proceso. Además, podrían surgir nuevos requisitos comerciales debido a los nuevos patrones descubiertos.

  • Despliegue

Significa simplemente presentar el conocimiento de tal manera que las partes interesadas puedan usarlo cuando lo deseen. En nuestro ejemplo anterior, se descubrió que las llamadas internacionales eran menos los miércoles, por lo que esta información se presentó a las partes interesadas que a su vez utilizaron esta información para su ventaja y aumentaron sus ganancias.

Técnicas utilizadas en minería de datos

En la sección anterior, hemos aprendido sobre la introducción a la minería de datos, ahora avanzamos con las técnicas utilizadas en la minería de datos que se enumeran a continuación:

  • Análisis de conglomerados

El análisis de clúster permite identificar un grupo de usuarios dado de acuerdo con características comunes en una base de datos. Estas características podrían incluir edad, ubicación geográfica, nivel educativo, etc.

  • Detección de anomalías

Se utiliza para determinar cuándo algo es notablemente diferente del patrón regular. Se utiliza para eliminar cualquier inconsistencia o anomalía de la base de datos en la fuente.

  • Análisis de regresión

Esta técnica se utiliza para hacer predicciones basadas en relaciones dentro del conjunto de datos. Por ejemplo, uno puede predecir la tasa de existencias de un producto en particular analizando la tasa pasada y también teniendo en cuenta los diferentes factores que determinan la tasa de existencias. O como se muestra a continuación, si tenemos los datos de la altura y el peso de diferentes personas, entonces, dada la altura o el peso, podríamos determinar el otro valor.

  • Clasificación

Esto trata de las cosas que tienen etiquetas. Tenga en cuenta que en la detección de conglomerados, las cosas no tenían una etiqueta y al usar la minería de datos tuvimos que etiquetar y formar en conglomerados, pero en la clasificación, existe información que puede clasificarse fácilmente mediante un algoritmo. Un ejemplo son los filtros de correo no deseado. El filtro de correo no deseado se proporciona tanto con mensajes relevantes como con mensajes no deseados (Datos de capacitación). Las diferencias entre ambos se identifican, lo que le permite clasificar correctamente los correos electrónicos futuros.

  • Aprendizaje asociativo

Se utiliza para analizar qué cosas tienden a ocurrir juntas, ya sea en parejas o en grupos más grandes. Por ejemplo, las personas que tienden a comprar limones, también compran naranjas, las personas que tienden a comprar pan, también compran leche, etc. Por lo tanto, se analizan las compras realizadas por todos los clientes y las cosas que ocurren juntas se colocan juntas para aumentar las ventas. Entonces, la leche se coloca cerca del pan, los limones se colocan junto a las naranjas, etc.

¿Es ética la minería de datos?

Entonces, estoy planeando un viaje de fin de semana a Goa con un amigo, busco en Internet buenos lugares para visitar en Goa. La próxima vez que abro Internet, encuentro anuncios sobre varios hoteles en Goa para alojarme.

  • ¿Buena cosa?

Sí, internet me ha ayudado a simplificar mi viaje. Después de todo, si decido visitar Goa, necesitaría dormir en algún lugar y un anuncio que me muestre un hotel es mucho más útil que un anuncio que me muestra ropa al azar para comprar.

  • ¿Cosa mala?

¡Si! ¿Por qué una compañía de minería de datos que nunca antes había escuchado sabría a dónde voy de vacaciones? ¿Qué pasa si no le he dicho a nadie acerca de este viaje, pero aquí, de repente, Internet sabe que voy a ir allí? La verdad es que el modelo de negocio de la empresa de minería de datos depende de esto. Recopilan estos datos a través de cookies y scripts, luego los venden a los anunciantes que, a su vez, intentan venderme algo más (en este caso, una habitación de hotel).

Por lo tanto, podría ser bueno o malo dependiendo de cómo lo veamos. Además, siempre podríamos desactivar las cookies o pasar de incógnito en el caso anterior. Aunque cualquiera sea el caso, una cosa es segura. La minería de datos llegó para quedarse.

Artículos recomendados

Esta ha sido una guía de Introducción a la minería de datos. Aquí discutimos su significado, técnicas y pasos involucrados en la introducción a la minería de datos con un ejemplo para comprender mejor. También puede consultar los siguientes artículos para obtener más información:

  1. Preguntas de la entrevista de minería de datos
  2. Análisis predictivo vs minería de datos
  3. Introducción a la ciencia de datos
  4. ¿Qué es el análisis de regresión?

Categoría: