23 lines
3.1 KiB
Markdown
23 lines
3.1 KiB
Markdown
|
---
|
|||
|
title: Data Alone Is not Enough
|
|||
|
localeTitle: Одних данных недостаточно
|
|||
|
---
|
|||
|
## Одних данных недостаточно
|
|||
|
|
|||
|
Без учета изменения алгоритмов машинного обучения или других аспектов обучение модели, только данных недостаточно, чтобы помочь вашему ученику сделать лучше.
|
|||
|
|
|||
|
> Каждый ученик должен воплощать некоторые знания или предположения за пределами данных, которые он дано для того, чтобы обобщить его (Домингос, 2012).
|
|||
|
|
|||
|
По сути, это утверждение говорит о том, что если вы слепо выбираете только потому, что вы слышали, что это хорошо, сбор большего количества данных не будет обязательно помогут вам в ваших задачах машинного обучения.
|
|||
|
|
|||
|
Например, скажем, у вас есть данные, зависящие от времени (например, данные временных рядов) и вы хотите использовать двоичный классификатор (например, логистическая регрессия). сбор больше данных временных рядов может быть не лучшим, чтобы помочь вашему ученику. Это потому что бинарный классификатор не предназначен для временных рядов.
|
|||
|
|
|||
|
Это не означает, что, как только вы выбрали лучший алгоритм машинного обучения основанный на вашей проблеме, что добавление большего количества данных вам не подходит. В этом случае это поможет вам.
|
|||
|
|
|||
|
> Машиноведение не волшебство; он ничего не может получить из ничего. Что это действительно получает больше от меньше ... Ученики сочетают знания с данными для роста программ (Домингос, 2012).
|
|||
|
|
|||
|
#### Дополнительная информация:
|
|||
|
|
|||
|
* [Несколько полезных вещей, которые нужно знать о механическом обучении](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)
|
|||
|
* [В машинном обучении, что лучше: больше данных или лучшие алгоритмы?](http://www.kdnuggets.com/2015/06/machine-learning-more-data-better-algorithms.html)
|
|||
|
* [В компьютерном обучении больше данных всегда лучше лучших алгоритмов?](https://www.quora.com/In-machine-learning-is-more-data-always-better-than-better-algorithms/answer/Xavier-Amatriain?srid=Tds3)
|