2.2 KiB
2.2 KiB
title | localeTitle |
---|---|
Natural Language Processing | Procesamiento natural del lenguaje |
Procesamiento del lenguaje natural (PNL)
Como dice la Wikipedia, "El procesamiento del lenguaje natural (PNL) es un subcampo de ciencias de la computación, ingeniería de la información e inteligencia artificial que se ocupa de las interacciones entre las computadoras y los lenguajes humanos (naturales), en particular cómo programar computadoras para procesar y analizar grandes cantidades. de datos en lenguaje natural ". En términos más simples, es un proceso en el cual las computadoras dan sentido al lenguaje natural generado por los humanos.
Desafíos en la PNL
1. Fácil o en su mayoría resuelto
*Spam detection
*Part of Speech Tagging
*Named Entity Recognition
2.Intermedio o haciendo buen progreso.
*Sentiment analysis
*Coreference resolution
*Word sense disambiguation
*Parsing
*Machine Translation
*Information Translation
3. Difícil o aún necesitas mucho trabajo
*Text Summarization
*Machine dialog system
Tecnicas comunes
*Structure extraction
*Identify and mark sentence, phrase, and paragraph boundaries
*Language identification
*Tokenization
*Acronym normalization and tagging
*Lemmatization / Stemming
*Entity extraction
*Phrase extraction
Bibliotecas de uso popular
*NLTK, the most widely-mentioned NLP library for Python.
*SpaCy, an industrial-strength NLP library built for performance.
*Gensim, a library for document similarity analysis.
*TextBlob, a user-friendly and intuitive NLTK interface.
*CoreNLP from stanford group
*PolyGlot, a natural language pipeline that supports massive multilingual applications.
Más información:
Para leer más: