freeCodeCamp/guide/chinese/machine-learning/principles/data-alone-is-not-enough/index.md

23 lines
1.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

---
title: Data Alone Is not Enough
localeTitle: 单独的数据还不够
---
## 单独的数据还不够
不考虑改变机器学习算法或其他方面 训练模型,单靠数据不足以帮助学习者做得更好。
> 每个学习者都必须在数据之外体现一些知识或假设 为了超越它而给出Domingos2012
这句话基本上是说,如果你盲目地选择一个 学习者只是因为你听说它做得好,收集更多的数据不会 必然会帮助您实现机器学习目标。
例如,假设您有依赖于时间的数据(例如时间序列数据) 并且您想使用二元分类器(例如逻辑回归)。搜集 更多时间序列数据可能不是最好的帮助您的学习者。这是 因为二进制分类器不是为时间序列设计的。
这并不是说一旦你选择了最好的机器学习算法 根据您的问题,添加更多数据对您没有好处。在这种情况下,它 会帮助你。
> 机器学习并不神奇;它无法从无到有。什么 确实是从更少的人那里获得更多...学习者将知识与数据结合起来 计划多明戈斯2012年
#### 更多信息:
* [关于机器学习的一些有用的事情](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf)
* [在机器学习中,什么是更好的:更多数据或更好的算法?](http://www.kdnuggets.com/2015/06/machine-learning-more-data-better-algorithms.html)
* [在机器学习中,更多数据总是优于更好的算法吗?](https://www.quora.com/In-machine-learning-is-more-data-always-better-than-better-algorithms/answer/Xavier-Amatriain?srid=Tds3)