Introducción a la regresión polinómica

La regresión se define como el método para encontrar la relación entre las variables independientes y dependientes para predecir el resultado. El primer modelo de regresión polinómica fue utilizado en 1815 por Gergonne. Se utiliza para encontrar la mejor línea de ajuste utilizando la línea de regresión para predecir los resultados. Existen muchos tipos de técnicas de regresión, la regresión polinómica es una de ellas. Antes de comprender esto, es aconsejable tener un conocimiento adecuado de la regresión lineal, por lo que será fácil marcar las diferencias entre ellos.

¿Por qué la regresión polinómica?

  • Esta es una de las técnicas de regresión que utilizan los profesionales para predecir el resultado. Se define como la relación entre las variables independientes y dependientes cuando la variable dependiente está relacionada con la variable independiente que tiene un enésimo grado. No requiere que la relación entre las variables dependientes e independientes sea lineal, por lo que si la línea es una curva, puede tener cualquier término polinomial.
  • La principal diferencia entre la regresión lineal y la polinómica es que la regresión lineal requiere que las variables dependientes e independientes estén relacionadas linealmente, mientras que esto puede ajustarse mejor a la línea si incluimos un grado más alto en el término variable independiente en la ecuación. La ecuación de la regresión polinómica que tiene un enésimo grado se puede escribir como:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ans n

  • Si agregamos grados más altos, como el cuadrático, convierte la línea en una curva que se ajusta mejor a los datos. Generalmente, se usa cuando los puntos en el conjunto de datos están dispersos y el modelo lineal no puede describir el resultado claramente. Siempre debemos vigilar el sobreajuste y el subajuste al considerar estos grados en la ecuación.
  • Es mejor considerar el grado que pasa a través de todos los puntos de datos, pero a veces tomar un grado más alto, como 10 o 20, puede pasar a través de todos los puntos de datos y reducir el error, pero también captura el ruido de los datos que está ajustando demasiado el modelo y se puede evitar agregando más muestras al conjunto de datos de entrenamiento. Por lo tanto, siempre es aconsejable elegir un grado óptimo para el modelo.

Hay dos técnicas que se utilizan para decidir el grado de la ecuación:

  • Selección directa: es el método para aumentar el grado hasta que sea lo suficientemente significativo como para definir el modelo.
  • Selección hacia atrás: es el método para disminuir el grado hasta que sea lo suficientemente significativo como para definir el modelo.

Procedimiento para aplicar la regresión polinómica

Encuentre los pasos o procedimientos a continuación para aplicar la regresión polinómica a cualquier conjunto de datos:

Paso 1: importe el conjunto de datos correspondiente a cualquier plataforma (R o Python) e instale los paquetes necesarios para aplicar el modelo.

Paso 2: Divida el conjunto de datos en conjuntos de entrenamiento y prueba para que podamos aplicar el algoritmo al conjunto de datos de entrenamiento y probarlo usando el conjunto de datos de prueba.

Paso 3: aplique métodos de análisis de datos exploratorios para estudiar el fondo de los datos como la media, la mediana, la moda, el primer cuartil, el segundo cuartil, etc.

Paso 4: aplique el algoritmo de regresión lineal al conjunto de datos y estudie el modelo.

Paso 5: aplique el algoritmo de regresión polinómica al conjunto de datos y estudie el modelo para comparar los resultados, ya sea RMSE o R cuadrado, entre la regresión lineal y la regresión polinómica.

Paso 6: Visualice y prediga los resultados de la regresión lineal y polinómica e identifique qué modelo predice el conjunto de datos con mejores resultados.

Usos de regresión polinómica

  • Se utiliza en muchos procedimientos experimentales para producir el resultado utilizando esta ecuación.
  • Proporciona una gran relación definida entre las variables independientes y dependientes.
  • Se utiliza para estudiar los isótopos de los sedimentos.
  • Se utiliza para estudiar el aumento de diferentes enfermedades dentro de cualquier población.
  • Se utiliza para estudiar la generación de cualquier síntesis.

Características de la regresión polinómica

  • Es un tipo de método de regresión no lineal que nos dice la relación entre la variable independiente y la dependiente cuando la variable dependiente está relacionada con la variable independiente del enésimo grado.
  • La mejor línea de ajuste se decide por el grado de la ecuación de regresión polinómica.
  • El modelo derivado de la regresión polinómica se ve afectado por los valores atípicos, por lo que siempre es mejor tratar los valores atípicos antes de aplicar el algoritmo al conjunto de datos.
  • La función Polynomialfeature () se convierte en una característica de la matriz según el grado de la ecuación.
  • La naturaleza de la curva puede estudiarse o visualizarse utilizando un diagrama de dispersión simple que le dará una mejor idea sobre la relación de linealidad entre las variables y decidirá en consecuencia.

Conclusión

La regresión polinómica se usa en muchas organizaciones cuando identifican una relación no lineal entre las variables independientes y dependientes. Es una de las técnicas de regresión difíciles en comparación con otros métodos de regresión, por lo que tener un conocimiento profundo sobre el enfoque y el algoritmo lo ayudará a lograr mejores resultados.

Artículos recomendados

Esta es una guía para una regresión polinómica. Aquí discutimos las características y los usos de la regresión polinómica. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Algoritmo SVM
  2. Métodos Kernel
  3. Función Excel de LINEST
  4. Algoritmos de aprendizaje automático
  5. Regresión lineal vs regresión logística | Principales diferencias

Categoría: