lunes, 15 de enero de 2024

Críticas al Aprendizaje Profundo

El aprendizaje profundo es un subconjunto de aprendizaje automático basado en redes neuronales artificiales en donde la estructura de la red neuronal se compone de varias capas de entrada, salida y ocultas. Cada capa contiene unidades que trasforman los datos de entrada en información que la capa siguiente puede usar para realizar una tarea de predicción determinada. De esta forma, una máquina puede aprender a través de su propio procesamiento de datos.

La representación gráfica de una red neuronal basada en aprendizaje profundo es la siguiente:


Existen varias críticas a este tipo de aprendizaje. Las principales son:

  • Aprendizaje según observaciones

Como los modelos de aprendizaje profundo aprenden a partir de observaciones, solo saben lo que había en los datos con los que entrenaron por lo que si los datos de entrenamiento no son representativos, los modelos no aprenden de una manera que sea generalizable.

  • Sesgos de aprendizaje

Del mismo modo, si un modelo se entrena con datos que contienen sesgos, el modelo reproduce esos sesgos en sus predicciones. Esto se acentúa cuando los modelos de aprendizaje profundo no indican explícitamente cuáles son los factores importantes que determinan la respuesta del modelo (son modelos de caja negra).

  • Requieren grandes cantidades de datos

Se necesita una gran cantidad de datos de entrenamiento para poder hacer predicciones aceptables debido a que las redes neuronales están basadas en un proceso de prueba y error. Además, los modelos más potentes y precisos necesitan más parámetros, lo que se traduce en una cantidad mayor aún de datos de entrenamiento.

  • Tasa de aprendizaje

Es complicado acertar con la tasa de aprendizaje para entrenar el modelo. Una tasa de aprendizaje alta hace que converja demasiado rápido, produciendo una solución que no es óptima. Una tasa de aprendizaje baja hace que el proceso se pueda estancar y sea muy difícil llegar a una solución.

  • Requisitos de hardware

El aprendizaje profundo es dependiente de máquinas con mucha potencia que puedan realizar un gran número de operaciones de multiplicación de matrices. Se requieren unidades de procesamiento gráfico multinúcleo de alto rendimiento y otras unidades de procesamiento similares para garantizar una mayor eficiencia y un menor consumo de tiempo. Estas unidades son caras y consumen grandes cantidades de energía.

  • Tiempo de entrenamiento
Las redes neuronales basadas en aprendizaje profundo tardan demasiado tiempo en entrenarse debido a que estos modelos tienen muchas capas en la red.
  • Falta de multitarea

Una vez se han entrenado estos modelos, se vuelven inflexibles y no pueden resolver problemas similares. Los modelos de aprendizaje profundo ofrecen soluciones eficientes y precisas, pero solo para un problema específico. Resolver un problema similar requiere volver a entrenar el sistema.

  • Falta de razonamiento

Cualquier aplicación que requiera un razonamiento (aplicación del método científico, planificación a largo plazo o manipulación de datos similar a la de un algoritmo) está más allá de los límites que las técnicas actuales de aprendizaje profundo pueden hacer de momento.

  • Se necesitan datos estructurados

De primeras no se pueden entrenar los modelos de aprendizaje profundo con datos no estructurados (sin etiquetas). Solo se puede tratar los datos no estructurados una vez estos han sido entrenados y han alcanzado un nivel aceptable de precisión.


No hay comentarios:

Publicar un comentario

¿Qué medio de transporte es mejor en una ciudad grande como Madrid?

Un año más he sobrevivido a los contenidos de las asignaturas del Máster en Cultura Científica de la UPNA. He entregado todas las tareas (au...