freshidea - Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Limitaciones del aprendizaje automático marcadas por las demandas de datos

El aprendizaje automático tiene capacidades impresionantes en la empresa, pero con altos requisitos de datos y dificultades con la explicabilidad, sigue siendo incapaz de alcanzar un uso generalizado.

Si bien el aprendizaje automático tiene una variedad de casos de uso y la capacidad de análisis profundo, no está exento de limitaciones.

Con grandes requisitos de datos junto con desafíos en transparencia y explicabilidad, aprovechar al máximo el aprendizaje automático puede ser difícil para las organizaciones. Comprender estas realidades del aprendizaje automático y establecer expectativas realistas es la única forma de colocar a su organización en una posición más sólida.

Alto potencial, pero alta demanda de datos

Los datos son el núcleo del aprendizaje automático. La naturaleza misma del aprendizaje automático es entrenar un algoritmo con datos de muestra limpios y preparados. Mediante este proceso repetido, puede aprender del conjunto de datos y crear y aplicar generalizaciones a datos que nunca antes había visto.

Una de las hazañas más impresionantes del aprendizaje automático hasta la fecha está representada por el notable rendimiento y la capacidad del modelo GPT-3 de OpenAI, que puede generar una salida de texto sorprendentemente similar a la humana a partir de una pequeña cantidad de texto inicial. Si bien los resultados son notables, la realidad es que se invirtieron petabytes de datos, millones de dólares en CPU y GPU y muchas horas de entrenamiento para crear el modelo resultante.

Esta cantidad de datos y cómputo no está disponible para el desarrollador de modelos de aprendizaje automático promedio y destaca uno de los principales desafíos con el estado actual de la técnica del aprendizaje automático: una dependencia extrema de los datos.

Todas las formas de aprendizaje automático dependen en gran medida de los datos, desde el aprendizaje supervisado y no supervisado hasta incluso el aprendizaje por refuerzo que puede enseñarse a sí mismo en múltiples iteraciones. Pero para lograr muchas de las tareas del aprendizaje automático con niveles aceptables de precisión, se requieren grandes cantidades de datos para entrenar los algoritmos de aprendizaje automático, especialmente las redes neuronales de aprendizaje profundo actualmente favorecidas.

Las redes neuronales de aprendizaje profundo constan de muchas capas de neuronas artificiales individuales que están conectadas a capas posteriores con muchas conexiones por neurona. Cada una de estas conexiones consta de ponderaciones y sesgos que deben ser determinados por el algoritmo de aprendizaje automático durante múltiples iteraciones de entrenamiento para que la red general esté adecuadamente entrenada. Cuantas más capas, más ponderaciones y sesgos deben calcularse. Estos cálculos requieren una cantidad significativa de potencia informática, así como datos y tiempo.

Sin embargo, estas limitaciones de datos no son las mismas para muchas aplicaciones conversacionales como chatbots o sistemas de detección y reconocimiento de objetos. Las organizaciones pueden utilizar estas redes previamente capacitadas directamente o simplemente volver a capacitar las redes mediante enfoques de aprendizaje por transferencia.

Sin embargo, este enfoque de aprendizaje por transferencia solo funciona si el nuevo dominio de capacitación es algo similar a la red existente. Es posible volver a entrenar una red de reconocimiento de imágenes que ya ha sido entrenada en imágenes generales para usarlas en imágenes de radiología, pero no es posible volver a entrenar una red de reconocimiento de voz para que detecte el fraude de tarjetas de crédito.

Los problemas de datos se expanden más allá de la necesidad de cantidades suficientes de datos. Las organizaciones también tienen desafíos para limpiar, preparar y etiquetar esos datos. Desafortunadamente, las máquinas están limitadas en la medida en que pueden preparar, recopilar y etiquetar datos por sí mismas, sin mano de obra y apoyo humanos.

Cada uno de los diversos tipos de aprendizaje automático requiere una cantidad significativa de datos sobre los que entrenarse.

Cuestiones de interpretabilidad y transparencia

La confianza es crucial cuando se trata de la adopción pública de la IA y el aprendizaje automático. La mejor forma de generar esa confianza es mediante resultados fiables, precisos y explicables. No poder entender cómo estos sistemas obtienen sus resultados solo genera dudas.

Las formas más populares de aprendizaje automático utilizan redes neuronales de aprendizaje profundo y, como se explicó anteriormente, producen sus resultados a través de interconexiones complicadas, que a veces llegan a millones de parámetros. Mirar la red neuronal proporciona muy poca visibilidad para comprender cómo las entradas específicas contribuyen a las salidas específicas.

Estas sofisticadas redes neuronales son esencialmente cajas negras, porque no tenemos visibilidad ni transparencia sobre cómo funcionan. Para muchos casos de uso, este tipo de falta de explicabilidad es un problema importante. Los sistemas de aprendizaje automático que se utilizan en sistemas críticos, como aplicaciones médicas, vehículos autónomos o la toma de decisiones importantes que cambian la vida, solo pueden ser confiables si sus resultados se pueden verificar fácilmente.

Sin una verificación tan fácil, es necesario mantener al ser humano al tanto o encontrar enfoques basados ​​en máquinas menos precisos, pero más explicables. Si bien no todos los algoritmos de aprendizaje automático enfrentan la misma falta de explicabilidad, el impulso actual para hacer un mayor uso de los sistemas de aprendizaje profundo o los modelos de aprendizaje automático de terceros solo se volverá más urgente.

Desafíos en las aplicaciones de aprendizaje automático

Generalmente, los sistemas inteligentes permanecen fuera del alcance del presente, por lo que cada modelo de aprendizaje automático tiende a construirse con una ventana de aplicación estrecha específica para el dominio del problema que está resolviendo.

Si bien el aprendizaje automático ha demostrado ser experto en el manejo de numerosas tareas, incluido el reconocimiento de imágenes y objetos, así como la identificación de patrones y la detección de anomalías, sus casos de uso no son aplicables a todos los escenarios. Los sistemas de aprendizaje automático funcionan mejor cuando se aplican a una tarea que de otro modo haría un ser humano. Si no se le pide a la máquina que sea creativa, que tenga intuición o que aplique el sentido común, puede sobresalir.

Al final del día, las máquinas todavía están lejos de tener capacidades humanas. Como se puede ver en los desafíos actuales con los vehículos totalmente autónomos, las máquinas enfrentan desafíos en muchas situaciones que los humanos pueden manejar fácilmente. El aprendizaje automático es bueno para aprender de datos explícitos, pero no luchan por comprender el mundo y cómo funciona. A un sistema de aprendizaje automático se le puede enseñar cómo es un jarrón, pero no entiende de manera inherente que retiene agua.

Estas limitaciones de sentido común e intuición se sienten en aplicaciones en las que los humanos necesitan interactuar con una máquina. Los chatbots y los asistentes de voz a menudo fallan cuando se les hacen preguntas de sentido común. Los sistemas autónomos tienen grandes puntos ciegos cuando no reconocen un problema potencialmente crítico que un humano puede detectar de inmediato. Los sistemas de reconocimiento literalmente no pueden detectar al elefante en la habitación.

Todavía no tenemos sistemas completamente autónomos en los que podamos confiar plenamente. Como tal, la inteligencia artificial y los sistemas de aprendizaje automático se están aprovechando de la mejor manera en roles de 'inteligencia aumentada' donde el humano todavía está al tanto. El poder del aprendizaje automático se aplica para ayudar a los humanos a hacer su trabajo y vivir mejor sus vidas, en lugar de reemplazarlos con algo que realice esas tareas de manera inadecuada.

Los sistemas de aprendizaje automático han exhibido capacidades significativas durante la última década y claramente están aquí para quedarse. Sin embargo, todavía es demasiado pronto para decir cuáles serán los impactos a largo plazo y las tendencias de adopción del aprendizaje automático y, como tal, todos debemos tener en cuenta las limitaciones del aprendizaje automático para no prometer demasiado sus capacidades y no llegar a cumplir esas promesas.

Investigue más sobre Tendencias de cómputo empresarial

Close