Introducción a la arquitectura de aprendizaje automático

La arquitectura de aprendizaje automático como asignatura ha evolucionado en los últimos períodos desde un concepto de fantasía hasta una prueba de la realidad.
Lo que evolucionó de un enfoque básico hacia el reconocimiento de patrones es sentar las bases para el desarrollo de una importante plataforma de inteligencia artificial. La idea básica era determinar si las máquinas son capaces de aprender de los datos que se les proporcionan y ser capaces de producir acciones repetibles con mayor confiabilidad y una toma de decisiones eficiente. Por lo tanto, podemos definir el aprendizaje automático como una rama de la inteligencia artificial que entrena máquinas en Cómo aprender. La capacidad de aprendizaje automático hace que un sistema sea capaz de realizar la toma de decisiones sin aportes explícitos de los usuarios. Esta capacidad se desarrolla en el sistema en función de un espacio muestral de datos llamado datos de entrenamiento. El uso del aprendizaje automático es visible hoy en día en cada avance tecnológico, ya sea su capacidad para que los sistemas móviles sugieran opciones en aplicaciones basadas en búsquedas previas del usuario, en el menú basado en eventos en sitios de restaurantes, en la asignación de literas de trenes basadas en la edad, etc. En un contexto más amplio, el aprendizaje automático puede considerarse como una aplicación para el análisis predictivo.

El aprendizaje automático puede definirse formalmente como una tecnología de análisis de datos para que el sistema extraiga el conocimiento sin ninguna definición explícita para realizarlo basado en una serie de observaciones.

Tipos de arquitectura de aprendizaje automático

La arquitectura de aprendizaje automático se puede clasificar en función del algoritmo utilizado en el entrenamiento.

1. Aprendizaje supervisado

En el aprendizaje supervisado, los datos de capacitación utilizados son un modelo matemático que consta de entradas y salidas deseadas. Cada entrada correspondiente tiene una salida asignada que también se conoce como señal de supervisión. A través de la matriz de capacitación disponible, el sistema puede determinar la relación entre la entrada y la salida y emplearla en las entradas posteriores después del entrenamiento para determinar la salida correspondiente. El aprendizaje supervisado puede ampliarse aún más en el análisis de clasificación y regresión basado en los criterios de salida. El análisis de clasificación se presenta cuando las salidas tienen una naturaleza restringida y están limitadas a un conjunto de valores. Sin embargo, el análisis de regresión define un rango numérico de valores para la salida. Se ven ejemplos de aprendizaje supervisado en los sistemas de detección de rostros y verificación de hablantes.

2. Aprendizaje no supervisado

A diferencia del aprendizaje supervisado, el aprendizaje no supervisado utiliza datos de capacitación que no contienen resultados. El aprendizaje no supervisado identifica la entrada de la relación en función de las tendencias, los puntos en común y la salida se determina en función de la presencia / ausencia de tales tendencias en la entrada del usuario.

3. Entrenamiento de refuerzo

Esto se utiliza en el entrenamiento del sistema para decidir sobre un contexto de relevancia particular usando varios algoritmos para determinar el enfoque correcto en el contexto del estado actual. Estos son ampliamente utilizados en la capacitación de portales de juegos para trabajar en las entradas del usuario en consecuencia.

Arquitectura del proceso de aprendizaje automático

Fig: - Diagrama de bloques de la arquitectura de flujo de decisión para sistemas de aprendizaje automático,

Tratemos ahora de comprender las capas representadas en la imagen de arriba.

1. Adquisición de datos

Como el aprendizaje automático se basa en los datos disponibles para que el sistema tome una decisión, el primer paso definido en la arquitectura es la adquisición de datos. Esto implica la recopilación de datos, la preparación y la segregación de los escenarios de casos basados ​​en ciertas características involucradas en el ciclo de toma de decisiones y el envío de los datos a la unidad de procesamiento para llevar a cabo una mayor categorización. Esta etapa a veces se denomina etapa de preprocesamiento de datos. El modelo de datos espera datos confiables, rápidos y elásticos que pueden ser de naturaleza discreta o continua. Luego, los datos se pasan a los sistemas de procesamiento de flujo (para datos continuos) y se almacenan en almacenes de datos por lotes (para datos discretos) antes de pasar a las etapas de modelado o procesamiento de datos.

2. Procesamiento de datos

Los datos recibidos en la capa de adquisición de datos se envían luego a la capa de procesamiento de datos donde se somete a una integración y procesamiento avanzados e implica la normalización de los datos, la limpieza de los datos, la transformación y la codificación. El procesamiento de datos también depende del tipo de aprendizaje utilizado. Por ejemplo, si se está utilizando el aprendizaje supervisado, los datos serán necesarios para ser segregados en múltiples pasos de datos de muestra requeridos para la capacitación del sistema y los datos así creados se denominan datos de muestra de capacitación o simplemente datos de capacitación. Además, el procesamiento de datos depende del tipo de procesamiento requerido y puede involucrar opciones que van desde la acción sobre datos continuos que implicarán el uso de una arquitectura basada en funciones específicas, por ejemplo, arquitectura lambda. También puede involucrar la acción sobre datos discretos que pueden requiere procesamiento enlazado a la memoria. La capa de procesamiento de datos define si el procesamiento de la memoria se realizará a los datos en tránsito o en reposo.

3. Modelado de datos

Esta capa de la arquitectura implica la selección de diferentes algoritmos que podrían adaptar el sistema para abordar el problema para el que se está desarrollando el aprendizaje. Estos algoritmos se están desarrollando o heredando de un conjunto de bibliotecas. Los algoritmos se utilizan para modelar los datos en consecuencia, esto hace que el sistema esté listo para el paso de ejecución.

4. Ejecución

Esta etapa del aprendizaje automático es donde se realiza la experimentación, se realizan pruebas y se realizan ajustes. El objetivo general de ser optimizar el algoritmo para extraer el resultado de la máquina requerida y maximizar el rendimiento del sistema. El resultado del paso es una solución refinada capaz de proporcionar los datos necesarios para que la máquina tome decisiones.

5. Despliegue

Al igual que cualquier otra salida de software, las salidas ML deben operacionalizarse o reenviarse para su posterior procesamiento exploratorio. El resultado puede considerarse como una consulta no determinista que debe implementarse en el sistema de toma de decisiones.

Se recomienda mover sin problemas la salida de ML directamente a producción, donde permitirá que la máquina tome decisiones directamente basadas en la salida y reduzca la dependencia de los pasos exploratorios adicionales.

Conclusiones

La arquitectura de aprendizaje automático ahora ocupa el mayor interés de la industria, ya que cada proceso busca optimizar los recursos disponibles y la producción en función de los datos históricos disponibles, además, el aprendizaje automático implica grandes ventajas sobre el pronóstico de datos y el análisis predictivo cuando se combina con la tecnología de ciencia de datos. La arquitectura de aprendizaje automático define las diversas capas involucradas en el ciclo de aprendizaje automático e involucra los pasos principales que se llevan a cabo en la transformación de datos en bruto en conjuntos de datos de capacitación capaces de permitir la toma de decisiones de un sistema.

Artículos recomendados

Esta ha sido una guía para la arquitectura de Machine Learning. Aquí discutimos el concepto, el proceso y los tipos de arquitectura de aprendizaje automático. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Aprendizaje supervisado vs Aprendizaje profundo
  2. ¿Qué es la API en Java?
  3. ¿Qué es la arquitectura HBase?
  4. ¿Qué es el desbordamiento del búfer?

Categoría: