23 lines
1.6 KiB
Markdown
23 lines
1.6 KiB
Markdown
---
|
||
title: Data Alone Is not Enough
|
||
localeTitle: 单独的数据还不够
|
||
---
|
||
## 单独的数据还不够
|
||
|
||
不考虑改变机器学习算法或其他方面 训练模型,单靠数据不足以帮助学习者做得更好。
|
||
|
||
> 每个学习者都必须在数据之外体现一些知识或假设 为了超越它而给出(Domingos,2012)。
|
||
|
||
这句话基本上是说,如果你盲目地选择一个 学习者只是因为你听说它做得好,收集更多的数据不会 必然会帮助您实现机器学习目标。
|
||
|
||
例如,假设您有依赖于时间的数据(例如时间序列数据) 并且您想使用二元分类器(例如逻辑回归)。搜集 更多时间序列数据可能不是最好的帮助您的学习者。这是 因为二进制分类器不是为时间序列设计的。
|
||
|
||
这并不是说一旦你选择了最好的机器学习算法 根据您的问题,添加更多数据对您没有好处。在这种情况下,它 会帮助你。
|
||
|
||
> 机器学习并不神奇;它无法从无到有。什么 确实是从更少的人那里获得更多...学习者将知识与数据结合起来 计划(多明戈斯,2012年)。
|
||
|
||
#### 更多信息:
|
||
|
||
* [关于机器学习的一些有用的事情](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)
|
||
* [在机器学习中,什么是更好的:更多数据或更好的算法?](http://www.kdnuggets.com/2015/06/machine-learning-more-data-better-algorithms.html)
|
||
* [在机器学习中,更多数据总是优于更好的算法吗?](https://www.quora.com/In-machine-learning-is-more-data-always-better-than-better-algorithms/answer/Xavier-Amatriain?srid=Tds3) |