El aprendizaje profundo es un subconjunto de aprendizaje automático basado en redes neuronales artificiales en donde la estructura de la red neuronal se compone de varias capas de entrada, salida y ocultas. Cada capa contiene unidades que trasforman los datos de entrada en información que la capa siguiente puede usar para realizar una tarea de predicción determinada. De esta forma, una máquina puede aprender a través de su propio procesamiento de datos.
La representación gráfica de una red neuronal basada en aprendizaje profundo es la siguiente:
Existen varias críticas a este tipo de aprendizaje. Las principales son:
- Aprendizaje según observaciones
Como los modelos de aprendizaje profundo aprenden a partir de observaciones, solo saben lo que había en los datos con los que entrenaron por lo que si los datos de entrenamiento no son representativos, los modelos no aprenden de una manera que sea generalizable.
- Sesgos de aprendizaje
Del mismo modo, si un modelo se entrena con datos que contienen sesgos, el modelo reproduce esos sesgos en sus predicciones. Esto se acentúa cuando los modelos de aprendizaje profundo no indican explícitamente cuáles son los factores importantes que determinan la respuesta del modelo (son modelos de caja negra).
- Requieren grandes cantidades de datos
Se necesita una gran cantidad de datos de entrenamiento para poder hacer predicciones aceptables debido a que las redes neuronales están basadas en un proceso de prueba y error. Además, los modelos más potentes y precisos necesitan más parámetros, lo que se traduce en una cantidad mayor aún de datos de entrenamiento.
- Tasa de aprendizaje
Es complicado acertar con la tasa de aprendizaje para entrenar el modelo. Una tasa de aprendizaje alta hace que converja demasiado rápido, produciendo una solución que no es óptima. Una tasa de aprendizaje baja hace que el proceso se pueda estancar y sea muy difícil llegar a una solución.
- Requisitos de hardware
El aprendizaje profundo es dependiente de máquinas con mucha potencia que puedan realizar un gran número de operaciones de multiplicación de matrices. Se requieren unidades de procesamiento gráfico multinúcleo de alto rendimiento y otras unidades de procesamiento similares para garantizar una mayor eficiencia y un menor consumo de tiempo. Estas unidades son caras y consumen grandes cantidades de energía.
- Tiempo de entrenamiento
- Falta de multitarea
Una vez se han entrenado estos modelos, se vuelven inflexibles y no pueden resolver problemas similares. Los modelos de aprendizaje profundo ofrecen soluciones eficientes y precisas, pero solo para un problema específico. Resolver un problema similar requiere volver a entrenar el sistema.
- Falta de razonamiento
Cualquier aplicación que requiera un razonamiento (aplicación del método científico, planificación a largo plazo o manipulación de datos similar a la de un algoritmo) está más allá de los límites que las técnicas actuales de aprendizaje profundo pueden hacer de momento.
- Se necesitan datos estructurados
De primeras no se pueden entrenar los modelos
de aprendizaje profundo con datos no estructurados (sin etiquetas). Solo se
puede tratar los datos no estructurados una vez estos han sido entrenados y han
alcanzado un nivel aceptable de precisión.
Bibliografía
https://www.techtarget.com/searchenterpriseai/definition/deep-learning-deep-neural-network
No hay comentarios:
Publicar un comentario