Introducción a los métodos de aprendizaje automático

El siguiente artículo, Métodos de aprendizaje automático proporciona un resumen de los métodos más utilizados en el aprendizaje automático. El aprendizaje automático es una técnica que hace que una computadora pueda 'aprender' cosas por sí misma. Los algoritmos mejoran adaptativamente su rendimiento a medida que aumentan los datos disponibles para el aprendizaje. Es decir, más datos, más preciso será nuestro modelo.

¿Cómo aprenden las máquinas?

Hay varios métodos para hacer eso. El método a seguir depende completamente de la declaración del problema. Dependiendo del conjunto de datos y nuestro problema, hay dos formas diferentes de profundizar. Uno es aprendizaje supervisado y el otro es aprendizaje no supervisado. El siguiente cuadro explica la clasificación adicional de los métodos de aprendizaje automático. Los discutiremos uno por uno.

¡Mira el siguiente cuadro!

Comprendamos qué significa el aprendizaje supervisado.

Aprendizaje supervisado

Como su nombre lo indica, imagine un maestro o un supervisor que lo ayude a aprender. Lo mismo vale para las máquinas. Entrenamos o enseñamos a la máquina utilizando datos etiquetados.

Algunas de las mejores aplicaciones de aprendizaje supervisado son:

  • Análisis de sentimientos (Twitter, Facebook, Netflix, YouTube, etc.)
  • Procesamiento natural del lenguaje
  • Clasificación de la imagen
  • Análisis predictivo
  • Reconocimiento de patrones
  • Detección de spam
  • Procesamiento de voz / secuencia

Ahora, el aprendizaje supervisado se divide aún más en clasificación y regresión. Vamos a entender esto.

Clasificación

La clasificación es el proceso de encontrar un modelo que ayuda a separar los datos en diferentes clases categóricas. En este proceso, los datos se clasifican en diferentes etiquetas de acuerdo con algunos parámetros dados en la entrada y luego las etiquetas se predicen para los datos. Categórica significa que la variable de salida es una categoría, es decir, roja o negra, spam o no spam, diabética o no diabética, etc.

Los modelos de clasificación incluyen la máquina de vectores de soporte (SVM), el vecino K más cercano (KNN), Naive Bayes, etc.

a) Clasificador de máquina de vectores de soporte (SVM)

SVM es un método de aprendizaje supervisado que analiza los datos y los clasifica en una de dos categorías. Yo uso un hiperplano para clasificar los datos. Un clasificador discriminativo lineal intenta dibujar una línea recta que separa los dos conjuntos de datos y, por lo tanto, crea un modelo para la clasificación. Simplemente trata de encontrar una línea o curva (en dos dimensiones) o una variedad (en múltiples dimensiones) que divida las clases entre sí.

Nota: para la clasificación multiclase, SVM utiliza 'one vs rest', lo que significa calcular diferentes SVM para cada clase.

b) Clasificador vecino más cercano a K (KNN)

  • Si lees detenidamente, el nombre en sí sugiere lo que hace el algoritmo. KNN considera que los puntos de datos que están más cerca, son mucho más similares en términos de características y, por lo tanto, es más probable que pertenezcan a la misma clase que el vecino. Para cualquier nuevo punto de datos, se calcula la distancia a todos los demás puntos de datos y la clase se decide en función de K vecinos más cercanos. Sí, puede sonar cojo, pero para algunas de las clasificaciones, funciona como cualquier cosa.
  • Un punto de datos se clasifica por el número máximo de votos de sus vecinos, luego el punto de datos se asigna a la clase más cercana entre sus k-vecinos.
  • En KNN, no se requiere el aprendizaje del modelo y todo el trabajo ocurre en el momento en que se solicita una predicción. Es por eso que KNN a menudo se conoce como un algoritmo de aprendizaje lento.

c) Clasificador Naïve Bayes

  • Naïve Bayes es un algoritmo de aprendizaje automático altamente recomendado para problemas de clasificación de texto. Se basa en el teorema de probabilidad de Bayes. Estos clasificadores se denominan ingenuos porque suponen que las variables de características son independientes entre sí. Eso significa, por ejemplo, que tenemos una oración completa para la entrada, luego Naïve Bayes supone que cada palabra en una oración es independiente de las demás. Y luego clasificarlos en consecuencia. Lo sé, parece bastante ingenuo, pero es una gran opción para problemas de clasificación de texto y es una opción popular para la clasificación de correo electrónico no deseado.
  • Proporciona diferentes tipos de algoritmos Naive Bayes como BernoulliNB, GaussianNB, MultinomialNB.
  • Considera que todas las características no están relacionadas, por lo que no puede aprender la relación entre las características. Por ejemplo, digamos, a Varun le gusta comer hamburguesas, también le gusta comer papas fritas con coca cola. Pero no le gusta comer una hamburguesa y una combinación de papas fritas con coca cola. Aquí, Naïve Bayes no puede aprender la relación entre dos características, sino que solo aprende la importancia de cada característica individual.

Ahora pasemos al otro lado de nuestro método de aprendizaje supervisado, que es una regresión.

Regresión

La regresión es el proceso de encontrar un modelo que ayuda a diferenciar los datos usando valores continuos. En esto, se ordena la naturaleza de los datos pronosticados. Algunos de los modelos de regresión más utilizados incluyen regresión lineal, bosque aleatorio (árboles de decisión), redes neuronales.

Regresión lineal

  • Uno de los enfoques más simples en el aprendizaje supervisado, que es útil para predecir la respuesta cuantitativa.
  • La regresión lineal incluye encontrar la línea recta que mejor se ajuste a través de los puntos. La línea que mejor se ajusta se llama línea de regresión. La línea de mejor ajuste no pasa exactamente por todos los puntos de datos, sino que trata de acercarse a ellos.
  • Es el algoritmo ampliamente utilizado para datos continuos. Sin embargo, solo se enfoca en la media de la variable dependiente y se limita a una relación lineal.
  • La regresión lineal se puede usar para series de tiempo, pronósticos de tendencias. Puede predecir ventas futuras, en función de los datos anteriores.

Aprendizaje sin supervisión

  • El aprendizaje no supervisado se basa en el enfoque que puede considerarse como la ausencia de un maestro y, por lo tanto, de medidas de error absoluto. Es útil cuando es necesario aprender la agrupación o agrupación de elementos. Los elementos se pueden agrupar (agrupar) según su similitud.
  • En el aprendizaje no supervisado, los datos no están etiquetados, no están categorizados y los algoritmos del sistema actúan sobre los datos sin capacitación previa. Los algoritmos de aprendizaje no supervisados ​​pueden realizar tareas más complejas que los algoritmos de aprendizaje supervisados.
  • El aprendizaje no supervisado incluye la agrupación que se puede hacer usando K significa agrupación, jerarquía, mezcla gaussiana, modelo oculto de Markov.

Las aplicaciones de aprendizaje sin supervisión son:

  1. Detección de similitud
  2. Etiquetado automático
  3. Segmentación de objetos (como Persona, Animal, Películas)

Agrupamiento

  • La agrupación en clúster es una técnica de aprendizaje no supervisada que se utiliza para el análisis de datos en muchos campos. El algoritmo de agrupamiento resulta útil cuando queremos obtener información detallada sobre nuestros datos.
  • Un ejemplo del mundo real de la agrupación sería la agrupación de géneros de Netflix, que se divide para diferentes clientes objetivo, incluidos intereses, demografía, estilos de vida, etc. clientes.

a) K significa Agrupación

  • K significa que el algoritmo de agrupamiento intenta dividir los datos desconocidos dados en grupos. Selecciona al azar el centroide de los grupos 'k', calcula la distancia entre los puntos de datos y el centroide de los grupos y finalmente asigna el punto de datos al centroide del grupo cuya distancia es mínima de todos los centroides del grupo.
  • En k-medias, los grupos se definen por el centroide más cercano para cada grupo. Este centroide actúa como 'Cerebro' del algoritmo, adquieren los puntos de datos que están más cerca de ellos y luego los agregan a los grupos.

b) Agrupación jerárquica

La agrupación jerárquica es casi similar a la agrupación normal a menos que desee crear una jerarquía de agrupaciones. Esto puede ser útil cuando desee decidir la cantidad de clústeres. Por ejemplo, suponga que está creando grupos de artículos diferentes en la tienda de comestibles en línea. En la página de inicio, desea algunos elementos amplios y una vez que hace clic en uno de los elementos, se abren categorías específicas, es decir, grupos más específicos.

Reducción de dimensionalidad

La reducción de dimensionalidad se puede considerar como la compresión de un archivo. Significa, sacar la información que no es relevante. Reduce la complejidad de los datos e intenta mantener los datos significativos. Por ejemplo, en la compresión de imágenes, reducimos la dimensionalidad del espacio en el que la imagen permanece como está, sin destruir demasiado contenido significativo en la imagen.

PCA para visualización de datos

El análisis de componentes principales (PCA) es un método de reducción de dimensiones que puede ser útil para visualizar sus datos. PCA se usa para comprimir datos de dimensiones superiores a datos de dimensiones inferiores, es decir, podemos usar PCA para reducir datos de cuatro dimensiones en tres o dos dimensiones para que podamos visualizar y obtener una mejor comprensión de los datos.

Artículos recomendados

Esta es una guía de métodos de aprendizaje automático. Aquí hemos discutido una introducción, ¿Cómo aprenden las máquinas? clasificaciones de aprendizaje automático y un diagrama de flujo junto con una explicación detallada. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Arquitectura de aprendizaje automático
  2. Marcos de aprendizaje automático
  3. Herramientas de aprendizaje automático
  4. Técnicas de aprendizaje automático
  5. Aprendizaje automático de hiperparámetros
  6. Algoritmo de agrupamiento jerárquico
  7. Agrupación jerárquica | Agrupamiento Aglomerativo y Divisivo

Categoría: