Introducción a los métodos del núcleo

Los núcleos o métodos de núcleo (también llamados funciones de núcleo) son conjuntos de diferentes tipos de algoritmos que se utilizan para el análisis de patrones. Se utilizan para resolver un problema no lineal mediante el uso de un clasificador lineal. Los métodos Kernels se emplean en SVM (Support Vector Machines) que se utilizan en problemas de clasificación y regresión. El SVM utiliza lo que se llama un "truco del kernel" donde los datos se transforman y se encuentra un límite óptimo para las posibles salidas.

La necesidad del método Kernel y su funcionamiento

Antes de comenzar a trabajar con los métodos del núcleo, es más importante comprender las máquinas de vectores de soporte o los SVM porque los núcleos se implementan en los modelos SVM. Por lo tanto, Support Vector Machines son algoritmos supervisados ​​de aprendizaje automático que se utilizan en problemas de clasificación y regresión, como clasificar una manzana para clasificar la fruta y clasificar un León para el animal de la clase.

Para demostrar, a continuación se muestra cómo son las máquinas de vectores de soporte:

Aquí podemos ver un hiperplano que separa los puntos verdes de los azules. Un hiperplano es una dimensión menos que el plano ambiental. Por ejemplo, en la figura anterior, tenemos 2 dimensiones que representan el espacio ambiental, pero el solitario que divide o clasifica el espacio es una dimensión menor que el espacio ambiental y se llama hiperplano.

Pero, ¿y si tenemos información como esta:

Es muy difícil resolver esta clasificación usando un clasificador lineal, ya que no hay una buena línea lineal que pueda clasificar los puntos rojo y verde ya que los puntos se distribuyen aleatoriamente. Aquí viene el uso de la función del núcleo que lleva los puntos a dimensiones más altas, resuelve el problema allí y devuelve la salida. Piense en esto de esta manera, podemos ver que los puntos verdes están encerrados en un área perimetral mientras que el rojo se encuentra fuera de él, del mismo modo, podría haber otros escenarios en los que los puntos verdes podrían estar distribuidos en un área con forma de trapecio.

Entonces, lo que hacemos es convertir el plano bidimensional que primero se clasificó por hiperplano unidimensional ("o una línea recta") en el área tridimensional y aquí nuestro clasificador, es decir, el hiperplano no será una línea recta sino un dos -dimensional plano que cortará el área.

Para obtener una comprensión matemática del núcleo, comprendamos la ecuación del núcleo de Lili Jiang que es:

K (x, y) = donde,
K es la función del núcleo,
X e Y son las entradas dimensionales,
f es el mapa del espacio n-dimensional al espacio m-dimensional y,
Es el producto punto.

Ilustración con la ayuda de un ejemplo.

Digamos que tenemos dos puntos, x = (2, 3, 4) e y = (3, 4, 5)

Como hemos visto, K (x, y) =.

Primero calculemos

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
entonces,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) y
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
entonces el producto de punto,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 +144 + 240 + 120 + 240 + 400) =
1444
Y,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Como descubrimos, f (x) .f (y) y K (x, y) nos dan el mismo resultado, pero el método anterior requería muchos cálculos (debido a la proyección de 3 dimensiones en 9 dimensiones) mientras se usaba kernel, fue mucho más fácil.

Tipos de kernel y métodos en SVM

Veamos algunas de las funciones del núcleo o los tipos que se utilizan en SVM:

1. Kernel de línea : digamos que tenemos dos vectores con el nombre x1 e Y1, entonces el kernel lineal se define por el producto de punto de estos dos vectores:

K (x1, x2) = x1. x2

2. Núcleo polinomial : un núcleo polinomial se define mediante la siguiente ecuación:

K (x1, x2) = (x1. X2 + 1) d,

Dónde,

d es el grado del polinomio y x1 y x2 son vectores

3. Kernel gaussiano : este kernel es un ejemplo de kernel de función de base radial. A continuación se muestra la ecuación para esto:

La sigma dada desempeña un papel muy importante en el rendimiento del núcleo gaussiano y no debe sobrestimarse ni subestimarse, debe ajustarse cuidadosamente según el problema.

4. Kernel exponencial : está en estrecha relación con el kernel anterior, es decir, el kernel gaussiano con la única diferencia es: se elimina el cuadrado de la norma.

La función de la función exponencial es:


Esta también es una función de núcleo de base radial.

5. Kernel laplaciano : este tipo de kernel es menos propenso a cambios y es totalmente igual al kernel de función exponencial discutido anteriormente, la ecuación del kernel laplaciano se da como:

6. Núcleo hiperbólico o sigmoide : este núcleo se utiliza en áreas de redes neuronales de aprendizaje automático. La función de activación para el núcleo sigmoide es la función sigmoide bipolar. La ecuación para la función del núcleo hiperbólico es:

Este núcleo es muy utilizado y popular entre las máquinas de vectores de soporte.

7. Kernel de base radial de Anova : se sabe que este kernel funciona muy bien en problemas de regresión multidimensional al igual que los núcleos gaussiano y laplaciano. Esto también se incluye en la categoría de núcleo de base radial.

La ecuación para el núcleo de Anova es:

Hay muchos más tipos de Método Kernel y hemos discutido los núcleos más utilizados. Depende únicamente del tipo de problema que decidirá la función del núcleo que se utilizará.

Conclusión

En esta sección, hemos visto la definición del núcleo y cómo funciona. Intentamos explicar con la ayuda de diagramas sobre el funcionamiento de los núcleos. Luego hemos tratado de dar una ilustración simple usando matemáticas sobre la función del núcleo. En la parte final, hemos visto diferentes tipos de funciones del núcleo que se usan ampliamente hoy en día.

Artículos recomendados

Esta es una guía de los métodos del núcleo. Aquí discutimos una introducción, necesidad, está funcionando y tipos de métodos de kernel con la ecuación apropiada. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Algoritmos de minería de datos
  2. K- Algoritmo de agrupamiento de medios
  3. Algoritmo de fuerza bruta
  4. Algoritmo del árbol de decisión
  5. Métodos de Kernel en Machine Learning
  6. Árbol de decisión en el aprendizaje automático

Categoría: