freeCodeCamp/guide/chinese/machine-learning/principles/data-alone-is-not-enough/index.md

23 lines
1.6 KiB
Markdown
Raw Normal View History

---
title: Data Alone Is not Enough
localeTitle: 单独的数据还不够
---
## 单独的数据还不够
不考虑改变机器学习算法或其他方面 训练模型,单靠数据不足以帮助学习者做得更好。
> 每个学习者都必须在数据之外体现一些知识或假设 为了超越它而给出Domingos2012
这句话基本上是说,如果你盲目地选择一个 学习者只是因为你听说它做得好,收集更多的数据不会 必然会帮助您实现机器学习目标。
例如,假设您有依赖于时间的数据(例如时间序列数据) 并且您想使用二元分类器(例如逻辑回归)。搜集 更多时间序列数据可能不是最好的帮助您的学习者。这是 因为二进制分类器不是为时间序列设计的。
这并不是说一旦你选择了最好的机器学习算法 根据您的问题,添加更多数据对您没有好处。在这种情况下,它 会帮助你。
> 机器学习并不神奇;它无法从无到有。什么 确实是从更少的人那里获得更多...学习者将知识与数据结合起来 计划多明戈斯2012年
#### 更多信息:
* [关于机器学习的一些有用的事情](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)
* [在机器学习中,什么是更好的:更多数据或更好的算法?](http://www.kdnuggets.com/2015/06/machine-learning-more-data-better-algorithms.html)
* [在机器学习中,更多数据总是优于更好的算法吗?](https://www.quora.com/In-machine-learning-is-more-data-always-better-than-better-algorithms/answer/Xavier-Amatriain?srid=Tds3)