--- title: Data Alone Is not Enough localeTitle: Одних данных недостаточно --- ## Одних данных недостаточно Без учета изменения алгоритмов машинного обучения или других аспектов обучение модели, только данных недостаточно, чтобы помочь вашему ученику сделать лучше. > Каждый ученик должен воплощать некоторые знания или предположения за пределами данных, которые он дано для того, чтобы обобщить его (Домингос, 2012). По сути, это утверждение говорит о том, что если вы слепо выбираете только потому, что вы слышали, что это хорошо, сбор большего количества данных не будет обязательно помогут вам в ваших задачах машинного обучения. Например, скажем, у вас есть данные, зависящие от времени (например, данные временных рядов) и вы хотите использовать двоичный классификатор (например, логистическая регрессия). сбор больше данных временных рядов может быть не лучшим, чтобы помочь вашему ученику. Это потому что бинарный классификатор не предназначен для временных рядов. Это не означает, что, как только вы выбрали лучший алгоритм машинного обучения основанный на вашей проблеме, что добавление большего количества данных вам не подходит. В этом случае это поможет вам. > Машиноведение не волшебство; он ничего не может получить из ничего. Что это действительно получает больше от меньше ... Ученики сочетают знания с данными для роста программ (Домингос, 2012). #### Дополнительная информация: * [Несколько полезных вещей, которые нужно знать о механическом обучении](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf) * [В машинном обучении, что лучше: больше данных или лучшие алгоритмы?](http://www.kdnuggets.com/2015/06/machine-learning-more-data-better-algorithms.html) * [В компьютерном обучении больше данных всегда лучше лучших алгоритмов?](https://www.quora.com/In-machine-learning-is-more-data-always-better-than-better-algorithms/answer/Xavier-Amatriain?srid=Tds3)