Algoritmos de machine learning: que problemas resuelve

Si bien los algoritmos de machine learning tienen el potencial de resolver una enorme cantidad de problemas comerciales, muchas empresas luchan por identificar dónde se aplican mejor sus recursos limitados para las soluciones de machine learning.

Afortunadamente, los problemas que se resuelven de manera más efectiva con el machine learning comparten algunas características clave.

En los servicios financieros, por ejemplo, la detección de fraudes es un área prometedora para el machine learning porque las empresas tienen miles de puntos de información de transacciones y las transacciones fraudulentas comparten algunos indicadores clave. Por otro lado, predecir el mercado de valores no es un caso de uso de machine learning convincente; a pesar de la abundancia de datos disponibles, los precios de mercado están sujetos a un número casi ilimitado de factores impredecibles. Una empresa de telecomunicaciones podría estar interesada en utilizar el machine learning para predecir la rotación de clientes.

El uso de un modelo para identificar clientes con alto riesgo de abandono es muy efectivo, y los analistas también pueden apuntar a clientes de alto valor con riesgo de abandono para maximizar las ganancias. El cuidado de la salud presenta una amplia variedad de casos de uso de machine learning, uno de los cuales es la identificación de sensores defectuosos. Los casos de uso, como el diagnóstico de pacientes y la creación de planes de tratamiento, son áreas de desarrollo prometedoras para el machine learning, pero los algoritmos no reemplazarán el juicio de los profesionales médicos en el corto plazo. Una de las aplicaciones más poderosas del machine learning es el mantenimiento predictivo.

Considere la industria del petróleo y el gas, donde la eficiencia y el valor dependen en gran medida de la confiabilidad de los activos.

La capacidad de predecir fallas de activos y tomar medidas antes de que ocurran es una excelente oportunidad para emplear el machine learning, ya que a menudo se puede acceder fácilmente a los datos históricos sobre el mantenimiento y las fallas de los equipos.

Los problemas comerciales más adecuados para las soluciones de machine learning son de naturaleza similar; la mayoría busca responder una pregunta específica y dirigida, cuya respuesta se puede capturar en una gran cantidad de datos históricos, y tiene el potencial de aumentar la eficiencia y agregar valor para la empresa. Dos métodos principales de machine learning son el aprendizaje supervisado y no supervisado. El aprendizaje supervisado requiere datos de entrenamiento etiquetados de acuerdo con la variable objetivo, y un modelo de aprendizaje supervisado aprende a predecir el objetivo en datos ocultos. El aprendizaje no supervisado no requiere datos de entrenamiento etiquetados y no genera una predicción; en cambio, los algoritmos de aprendizaje no supervisados derivan patrones y otros conocimientos útiles de un conjunto de datos.

Clases de machine learning

Aprendizaje supervisado

En esencia, el aprendizaje supervisado es el método de utilizar datos históricos para responder a una pregunta sobre el comportamiento futuro, como “¿fallará este equipo?” o “¿este cliente dejará la empresa?”. Un modelo de aprendizaje supervisado aprende de los datos de entrenamiento con la variable objetivo y predice la variable para nuevos puntos de datos. El aprendizaje supervisado se clasifica en una de cuatro categorías: clasificación binaria, clasificación de clases múltiples, clasificación de etiquetas múltiples y regresión. Cada clase de problema de ML se puede resolver con varios algoritmos de ML, pero no se puede usar un único algoritmo para todas las clases de ML. La siguiente publicación de esta serie cubrirá los algoritmos de machine learning con mayor detalle y cómo decidir qué algoritmo usar.

Clasificación binaria: la clasificación binaria clasifica los datos en una de dos categorías, por lo que cada entrada devuelve una salida de “sí” o “no”. La regresión logística, los árboles de decisión y los algoritmos Naïve Bayes pueden resolver problemas de clasificación binaria.

Para el problema de predecir la rotación de clientes en telecomunicaciones, un modelo de clasificación binaria usaría datos históricos con perfiles de clientes e información sobre qué clientes se retiraron para predecir si un cliente actual se retirará.

Clasificación multiclase: la clasificación multiclase se vuelve más compleja por la presencia de más de dos etiquetas de salida; en lugar de una salida de “sí” o “no”, el modelo debe predecir una de varias categorías de salida para cada valor de entrada. Naïve Bayes y los algoritmos de árboles de decisión son más adecuados para la clasificación de clases múltiples, mientras que la regresión logística es menos efectiva.

Por ejemplo, una empresa minorista podría utilizar la clasificación de clases múltiples para predecir si un cliente gastará mucho, medio o poco.

Regresión: La regresión es el método de predecir un valor continuo (a diferencia de categórico) dadas las características de los datos históricos. Un modelo de regresión podría predecir cómo cambia un precio con el tiempo o la cantidad de días antes de que falle un equipo. Un modelo de regresión predice el valor numérico de una variable dependiente en función de una serie de variables independientes o predictores. La regresión lineal es el algoritmo más simple para resolver problemas de regresión.

Las técnicas de regularización pueden mejorar la precisión de los modelos de regresión lineal al reducir el riesgo de sobreajuste del modelo. (Un modelo sobreajustado se entrena tan de cerca en los datos de entrenamiento que no generaliza lo suficientemente bien como para hacer predicciones precisas sobre datos no vistos). Los árboles de decisión son populares para su uso en problemas de regresión más complejos.

Aprendizaje no supervisado: agrupamiento

La agrupación ayuda a los analistas a reconocer patrones que pueden explicar ciertos fenómenos, identificar valores atípicos en un conjunto de datos e informar decisiones basadas en la demografía del cliente. Un modelo de agrupación en clústeres agrupa datos similares en función de una serie de características, y los analistas pueden obtener información sobre cada grupo. La agrupación en clústeres es una herramienta poderosa para la detección de anomalías: considere un caso de uso de la salud de un sensor en el cuidado de la salud. La agrupación de datos de un tipo de sensor ayuda a indicar qué sensores no funcionan correctamente, ya que todos pueden mostrar un conjunto similar de comportamientos anómalos que son difíciles o imposibles de identificar al examinar los datos de un solo sensor.

Aprendizaje no supervisado: reducción de la dimensionalidad.

La reducción de la dimensionalidad puede mejorar en gran medida el rendimiento de otros modelos. Cuando un conjunto de datos tiene muchas características, se necesita una mayor cantidad de datos de entrenamiento para reflejar con precisión todas las combinaciones posibles de características y resultados; de lo contrario, es poco probable que el modelo funcione bien en datos no vistos. La reducción de dimensionalidad es el proceso de reducir la cantidad de características en un conjunto de datos mediante la eliminación de características irrelevantes (selección de características) o la consolidación en una cantidad menor de características más potentes (extracción de características). Si bien es poco probable que la reducción de dimensionalidad se use de forma aislada, puede mejorar en gran medida el éxito de otros modelos entrenados con el conjunto de datos.

La reducción de la dimensionalidad es particularmente importante en los casos en que la interpretabilidad del modelo, o la capacidad de explicar por qué un modelo tomó la decisión que tomó, es esencial.

El problema de la detección de fraudes es un caso de uso convincente para la reducción de la dimensionalidad junto con un algoritmo de agrupación o clasificación; cuando un modelo identifica una transacción como fraudulenta, es fundamental que el motivo para hacerlo sea claro y explicable. El uso de un algoritmo de machine learning de selección de funciones para eliminar funciones que no afectan directamente la probabilidad de fraude permite a los analistas identificar fácilmente por qué otro algoritmo identificó una transacción como fraudulenta.

Este articulo puede interesarle Pasos para el éxito en 2022: Gestión de inventario de construcción

Clases de machine learning

Aprendizaje supervisado

Aprendizaje no supervisado: agrupamiento

Aprendizaje no supervisado: reducción de la dimensionalidad.

Carla Serrato

¿Cuáles son los beneficios de DAM?

¿Quién usa DAM?: Gestión de activos digitales

¿Qué es la gestión de activos digitales?

Introducción a la IA sin código: problemas que la IA puede resolver

Clases de machine learning

Aprendizaje supervisado

Aprendizaje no supervisado: agrupamiento

Aprendizaje no supervisado: reducción de la dimensionalidad.

Carla Serrato

Related Posts

¿Cuáles son los beneficios de DAM?

¿Quién usa DAM?: Gestión de activos digitales

¿Qué es la gestión de activos digitales?