freeCodeCamp/guide/russian/machine-learning/natural-language-processing/index.md

61 lines
2.8 KiB
Markdown
Raw Normal View History

2018-10-12 20:00:59 +00:00
---
title: Natural Language Processing
localeTitle: Обработка естественного языка
---
## Обработка естественного языка (НЛП)
Как говорит Википедия, «обработка естественного языка (NLP) является подполем компьютерной науки, информатики и искусственного интеллекта, связанным с взаимодействием между компьютерами и человеческими (естественными) языками, в частности, как программировать компьютеры для обработки и анализа больших объемов данных естественного языка ». Проще говоря, это процесс, в котором естественный язык, порожденный людьми, воспринимается компьютерами.
### Проблемы в НЛП
#### 1\. Легко или в основном решено
```
*Spam detection
*Part of Speech Tagging
*Named Entity Recognition
```
#### 2\. Внедрение или достижение хорошего прогресса
```
*Sentiment analysis
*Coreference resolution
*Word sense disambiguation
*Parsing
*Machine Translation
*Information Translation
```
#### 3.Гард или еще нужно много работы
```
*Text Summarization
*Machine dialog system
```
### Общие методы
```
*Structure extraction
*Identify and mark sentence, phrase, and paragraph boundaries
*Language identification
*Tokenization
*Acronym normalization and tagging
*Lemmatization / Stemming
*Entity extraction
*Phrase extraction
```
### Популярные библиотеки
```
*NLTK, the most widely-mentioned NLP library for Python.
*SpaCy, an industrial-strength NLP library built for performance.
*Gensim, a library for document similarity analysis.
*TextBlob, a user-friendly and intuitive NLTK interface.
*CoreNLP from stanford group
*PolyGlot, a natural language pipeline that supports massive multilingual applications.
```
#### Дополнительная информация:
Для дальнейшего чтения:
* Нажмите [здесь](https://medium.com/@gon.esbuyo/get-started-with-nlp-part-i-d67ca26cc828) для статьи о вступлении в НЛП.
* Нажмите [здесь](https://en.wikipedia.org/wiki/Natural_language_processing) для ссылки в Википедии.