fbpx
Get In Touch
1201 3rd Avenue Seattle, WA 98101, US
(HQ) Av. Punto Sur 31, Tlajomulco de Zúñiga, Jal 45050, MX
Carrera 11B # 99 - 25, Btá, 110221, CO
Let's talk
hello@inmediatum.com
Ph: +1 (650) 603 0883
Sales attention M - F 9am - 5pm (CT)
Get support
Careers
Endless inspiration and meaningful work
See open positions
Back

Algoritmos de deep learning.

Los algoritmos de deep learning ejecutan datos a través de varias “capas” de algoritmos de redes neuronales, cada uno de los cuales pasa una representación simplificada de los datos a la siguiente capa.

La mayoría de los algoritmos de aprendizaje automático funcionan bien en conjuntos de datos que tienen hasta unos pocos cientos de funciones o columnas. Sin embargo, un conjunto de datos no estructurado, como el de una imagen, tiene una cantidad tan grande de características que este proceso se vuelve engorroso o completamente inviable. Una sola imagen de 800 por 1000 píxeles en color RGB tiene 2,4 millones de funciones, demasiadas para que las manejen los algoritmos tradicionales de aprendizaje automático.

Los algoritmos de deep learning aprenden progresivamente más sobre la imagen a medida que pasa por cada capa de la red neuronal. Las primeras capas aprenden a detectar entidades de bajo nivel como bordes, y las capas posteriores combinan entidades de capas anteriores en una representación más holística. Por ejemplo, una capa intermedia podría identificar los bordes para detectar partes de un objeto en la foto, como una pierna o una rama, mientras que una capa profunda detectará el objeto completo, como un perro o un árbol.

¿Por qué es importante el deep learning?

La capacidad de procesar una gran cantidad de funciones hace que el deep learning sea muy poderoso cuando se trata de datos no estructurados. Sin embargo, los algoritmos de deep learning pueden ser excesivos para problemas menos complejos porque requieren acceso a una gran cantidad de datos para ser efectivos. Por ejemplo, ImageNet, el punto de referencia común para entrenar modelos de deep learning para el reconocimiento integral de imágenes, tiene acceso a más de 14 millones de imágenes.

Si los datos son demasiado simples o incompletos, es muy fácil que un modelo de deep learning se sobreajuste y no se generalice bien a nuevos datos. Como resultado, los modelos de deep learning no son tan efectivos como otras técnicas (como árboles de decisión potenciados o modelos lineales) para la mayoría de los problemas comerciales prácticos, como comprender la rotación de clientes, detectar transacciones fraudulentas y otros casos con conjuntos de datos más pequeños y menos funciones. En ciertos casos, como la clasificación multiclase, el deep learning puede funcionar para conjuntos de datos estructurados más pequeños.

¿Qué es una red neuronal?

Una red neuronal es una red de neuronas artificiales conocidas como nodos, que está estructurada como un cerebro humano. Estos nodos se apilan uno al lado del otro en tres capas:

  1. La capa de entrada
  2. La (s) capa (s) oculta (s)
  3. La capa de salida

¿Cuáles son los mejores algoritmos de deep learning?

Red neuronal convolutional

Yann LeCun desarrolló la primera CNN en 1988 y la llamó LeNet. Luego se usó principalmente para reconocer caracteres como códigos postales y dígitos.

Las CNN ahora conocidas como ConvNets, constan de una estructura de múltiples capas y se utilizan principalmente para el procesamiento de imágenes y la detección de objetos.

CNN tiene una capa de convolución que tiene varios filtros para lidiar con su complejidad y realizar la operación de convolución.

Las CNN también tienen una capa de unidad lineal rectificada (ReLU) para realizar operaciones en elementos y presentar un mapa de características rectificado como salida.

Retropropagación

Las redes neuronales pueden aprender la función deseada utilizando grandes cantidades de datos y un algoritmo iterativo llamado retropropagación. Alimentamos la red con datos, produce una salida, comparamos esa salida con la deseada (usando una función de pérdida) y reajustamos los pesos en función de la diferencia.

Y repetir. Y repetir. El ajuste de pesos se realiza mediante una técnica de optimización no lineal denominada descenso de gradiente estocástico.

Después de un tiempo, la red se volverá realmente buena para producir la salida. Por lo tanto, el entrenamiento ha terminado. De ahí que logremos aproximarnos a nuestra función. Y si pasamos una entrada con una salida desconocida a la red, nos dará una respuesta basada en la función aproximada.

Usemos un ejemplo para aclarar esto. Digamos que por alguna razón queremos identificar imágenes con un árbol. Alimentamos la red con cualquier tipo de imágenes y produce una salida. Como sabemos si la imagen tiene realmente un árbol o no, podemos comparar la salida con nuestra verdad y ajustar la red.

Este artículo puede interesarle ¿En qué se diferencia el deep learning de las redes neuronales?

Carla Serrato
Carla Serrato
Especialista en ciencias sociales y de comportamiento. Carla no solo asesora a nuestro departamento de UX en INMEDIATUM sino que su investigación permite optimizar nuestros algoritmos de inteligencia artificial como para la prevención de riesgo crediticio, genera mejor adherencia a tratamientos médicos, reconocimiento facial para identificar rasgos de la personalidad entre otros.

We use cookies to give you the best experience. Cookie Policy