freeCodeCamp/guide/russian/machine-learning/principles/its-generalization-that-counts/index.md

16 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

---
title: Its Generalization That Counts
localeTitle: Его обобщение, которое подсчитывает
---
## Его обобщение, которое подсчитывает
Сила машинного обучения связана с необходимостью не жесткого кода или явно определить параметры, которые описывают ваши данные обучения и невидимые данные. Это основная цель машинного обучения: обобщить выводы учащегося.
Чтобы проверить обобщенность учащегося, вам понадобятся отдельные тестовые данные который никоим образом не используется при обучении учащегося. Это может быть создано либо разбивая все данные тренировки на тренировочный и тестовый набор, либо просто собрать больше данных. Если ученик должен был использовать данные, найденные в тесте набора данных, это создало бы своего рода предвзятость в вашем ученике, чтобы сделать лучше, чем в реальность.
Один из способов получить представление о том, как ваш ученик будет выполнять набор тестовых данных, - это выполнить так называемую **перекрестную проверку** . Это случайное разбиение данные обучения в заданное количество подмножеств (например, десять подмножеств) и оставляет одно подмножество, а ученик тренируется на остальном. Затем ученик был обучен, для тестирования используется оставленный набор данных. Эта обучение, оставляя одно подмножество, и тестирование повторяется при повороте подмножества.
#### Дополнительная информация:
* [Несколько полезных вещей, которые нужно знать о механическом обучении](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)
* [«Как вы используете набор тестовых данных после перекрестной проверки»](https://stats.stackexchange.com/a/153058/132399)