16 lines
2.7 KiB
Markdown
16 lines
2.7 KiB
Markdown
---
|
||
title: Its Generalization That Counts
|
||
localeTitle: Его обобщение, которое подсчитывает
|
||
---
|
||
## Его обобщение, которое подсчитывает
|
||
|
||
Сила машинного обучения связана с необходимостью не жесткого кода или явно определить параметры, которые описывают ваши данные обучения и невидимые данные. Это основная цель машинного обучения: обобщить выводы учащегося.
|
||
|
||
Чтобы проверить обобщенность учащегося, вам понадобятся отдельные тестовые данные который никоим образом не используется при обучении учащегося. Это может быть создано либо разбивая все данные тренировки на тренировочный и тестовый набор, либо просто собрать больше данных. Если ученик должен был использовать данные, найденные в тесте набора данных, это создало бы своего рода предвзятость в вашем ученике, чтобы сделать лучше, чем в реальность.
|
||
|
||
Один из способов получить представление о том, как ваш ученик будет выполнять набор тестовых данных, - это выполнить так называемую **перекрестную проверку** . Это случайное разбиение данные обучения в заданное количество подмножеств (например, десять подмножеств) и оставляет одно подмножество, а ученик тренируется на остальном. Затем ученик был обучен, для тестирования используется оставленный набор данных. Эта обучение, оставляя одно подмножество, и тестирование повторяется при повороте подмножества.
|
||
|
||
#### Дополнительная информация:
|
||
|
||
* [Несколько полезных вещей, которые нужно знать о механическом обучении](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)
|
||
* [«Как вы используете набор тестовых данных после перекрестной проверки»](https://stats.stackexchange.com/a/153058/132399) |