El procesamiento del lenguaje natural se esfuerza por construir máquinas que comprendan y respondan a datos de texto o voz, y respondan con texto o voz propia, de la misma manera que lo hacen los humanos.
¿Qué es el procesamiento del lenguaje natural?
El procesamiento del lenguaje natural (PNL) se refiere a la rama de la informática, y más específicamente, a la rama de la inteligencia artificial o IA, que se ocupa de dar a las computadoras la capacidad de comprender texto y palabras habladas de la misma manera que los seres humanos.
La PNL combina la lingüística computacional (modelado del lenguaje humano basado en reglas) con modelos estadísticos, de aprendizaje automático y de aprendizaje profundo. Juntas, estas tecnologías permiten a las computadoras procesar el lenguaje humano en forma de texto o datos de voz y “comprender” su significado completo, con la intención y el sentimiento del hablante o escritor.
La PNL impulsa programas informáticos que traducen texto de un idioma a otro, responden a comandos hablados y resumen grandes volúmenes de texto rápidamente, incluso en tiempo real. Es muy probable que haya interactuado con NLP en forma de sistemas GPS operados por voz, asistentes digitales, software de dictado de voz a texto, chatbots de servicio al cliente y otras comodidades para el consumidor. Pero la PNL también juega un papel cada vez más importante en las soluciones empresariales que ayudan a agilizar las operaciones comerciales, aumentar la productividad de los empleados y simplificar los procesos comerciales de misión crítica.
Tareas de PNL
El lenguaje humano está lleno de ambigüedades que hacen que sea increíblemente difícil escribir software que determine con precisión el significado deseado de los datos de texto o voz. Homónimos, homófonos, sarcasmo, modismos, metáforas, excepciones gramaticales y de uso, variaciones en la estructura de las oraciones: estas son solo algunas de las irregularidades del lenguaje humano que los humanos tardan años en aprender, pero que los programadores deben enseñar a las aplicaciones basadas en el lenguaje natural para reconocer y comprender con precisión desde el principio, si esas aplicaciones van a ser útiles.
Varias tareas de PNL desglosan el texto humano y los datos de voz de manera que ayudan a la computadora a dar sentido a lo que ingiere. Algunas de estas tareas incluyen las siguientes:
El reconocimiento de voz, también llamado conversión de voz a texto, es la tarea de convertir de manera confiable los datos de voz en datos de texto. El reconocimiento de voz es necesario para cualquier aplicación que siga comandos de voz o responda preguntas habladas. Lo que hace que el reconocimiento de voz sea especialmente desafiante es la forma en que las personas hablan: rápidamente, arrastrando las palabras, con diferentes énfasis y entonación, con diferentes acentos y, a menudo, con una gramática incorrecta.
La resolución de co-referencia es la tarea de identificar si dos palabras se refieren a la misma entidad y cuándo. El ejemplo más común es determinar la persona u objeto al que se refiere un determinado pronombre (p. Ej., ‘Ella’ = ‘María’), pero también puede implicar la identificación de una metáfora o un modismo en el texto (p. Ej., Una instancia en la que ‘ oso ‘no es un animal sino una persona grande y peluda).
La generación de lenguaje natural a veces se describe como lo opuesto al reconocimiento de voz o de voz a texto; es la tarea de poner información estructurada en lenguaje humano.
La desambiguación del sentido de las palabras es la selección del significado de una palabra con múltiples significados a través de un proceso de análisis semántico que determina la palabra que tiene más sentido en el contexto dado. Por ejemplo, la desambiguación del sentido de las palabras ayuda a distinguir el significado del verbo “hacer” en “hacer la calificación” (lograr) frente a “hacer una apuesta” (colocar).
Parte del etiquetado del habla, también llamado etiquetado gramatical, es el proceso de determinar la parte del discurso de una palabra o fragmento de texto en particular en función de su uso y contexto. Parte del discurso identifica “hacer” como un verbo en “Puedo hacer un avión de papel” y como un sustantivo en “¿Qué marca de coche tienes?”
El análisis de sentimientos intenta extraer del texto cualidades subjetivas (actitudes, emociones, sarcasmo, confusión, sospecha).
El reconocimiento de entidad con nombre, o NEM, identifica palabras o frases como entidades útiles. NEM identifica “Kentucky” como una ubicación o “Fred” como el nombre de un hombre.
Este artículo puede interesarle ¿En qué se diferencia el deep learning de las redes neuronales?