freeCodeCamp/guide/russian/machine-learning/glossary/index.md

8.2 KiB
Raw Blame History

title localeTitle
Glossary глоссарий

глоссарий

Быстрое одно или два предложения, описывающие общие термины. См. Отдельные страницы для более подробно.

  • Machine Learning - Пересечение статистики и информатики в чтобы научить компьютеры выполнять задачи без явного программирования.
  • Глубокое обучение - общий термин для методов машинного обучения, основанный на представлении данных обучения, в отличие от алгоритмов, основанных на выполнении данной задачи. Он включает в себя такие архитектуры, как глубокие нейронные сети, сети глубоких убеждений и повторяющиеся нейронные сети.
  • Neuroevolution - универсальный термин для методов машинного обучения, основанный на генерации нейронных сетей через вес, смещение и архитектуру посредством случайных мутаций сети. Наиболее распространенными формами нейроэволюции являются нейроэволюция дополняющих топологий ( NEAT ) и интерактивно ограниченная нейроэволюция ( ICONE ).
  • Статистическое обучение - использование машинного обучения с целью статистический вывод, в котором вы делаете выводы из данных, а не сосредоточить внимание на точности прогнозирования
  • Управленческое обучение - использование исторических данных для прогнозирования будущего. Пример: использование исторических данных о ценах, в которых продавались дома, для прогнозирования цены, в которой будет продаваться ваш дом. Регрессия и классификация подпадают под контролируемое обучение.
  • Неконтролируемое обучение - поиск шаблонов в немаркированных данных. Пример. Группировка клиентов путем покупки. Кластеризация происходит под неконтролируемым обучением.
  • Усиление обучения - использование имитируемой или реальной среды, в которой алгоритм машинного обучения получает ввод и разреженные вознаграждения для построения модели для прогнозирования действий. Усиление обучения использовалось для обучения виртуальных роботов, чтобы сбалансировать себя и победить в играх, предназначенных для людей .
  • Регрессия . Метод машинного обучения, используемый для прогнозирования непрерывных значений. Линейная регрессия - один из самых популярных алгоритмов регрессии.
  • Классификация - метод машинного обучения, используемый для прогнозирования дискретных значений. Логистическая регрессия - один из самых популярных алгоритмов классификации.
  • Обучение правилу ассоциации - метод машинного обучения на основе правил для обнаружения интересных связей между переменными в больших базах данных.
f: x -> y 
 
 Here 'f' is a function that takes 'x' as input and produces 'y' as output. 
 
 If the output value 'y' is a real number / continous value then the function 
 is a regression technique. 
 
 If the output value 'y' is a discrete / categorical value then the function is a classification technique. 
  • Кластеризация - группировка немаркированных данных. Определение шаблонов с использованием статистики.

  • Уменьшение размерности. Уменьшение числа случайных величин в данных для получения более точных прогнозов.

  • Случайные леса. Случайные леса или леса с произвольным решением являются методом обучения ансамблем для классификации, регрессии и других задач, которые работают путем построения множества деревьев решений во время обучения и вывода класса, который является режимом классов или средним предсказанием отдельные деревья. - Байесовские сети. Байесовская сеть представляет собой вероятностную графическую модель, которая связывает набор случайных величин со своими условными независимыми функциями через ориентированный ациклический граф (DAG). Простым образом он связывает случайную переменную с их условными независимыми значениями для предсказания события. Она играет решающую роль в связи с ключом к делу. - Компромисс смещения смещения - смещение полезно, потому что оно помогает нам определить среднюю разницу в прогнозируемых значениях и фактических значениях, тогда как дисперсия помогает нам определить, как разные предикаты одного набора данных отличаются друг от друга. Если смещение увеличивается, то модель имеет высокую погрешность в прогнозах, что делает модель недооцененной. Высокая дисперсия делает модель переоценкой, поскольку модель постоянно движется только по данному набору данных и плохо выполняет данные, которые она еще не увидела. Поиск баланса между смещением и дисперсией является ключом к созданию хорошей модели.

Дополнительная информация: