--- title: Data Alone Is not Enough localeTitle: 单独的数据还不够 --- ## 单独的数据还不够 不考虑改变机器学习算法或其他方面 训练模型,单靠数据不足以帮助学习者做得更好。 > 每个学习者都必须在数据之外体现一些知识或假设 为了超越它而给出(Domingos,2012)。 这句话基本上是说,如果你盲目地选择一个 学习者只是因为你听说它做得好,收集更多的数据不会 必然会帮助您实现机器学习目标。 例如,假设您有依赖于时间的数据(例如时间序列数据) 并且您想使用二元分类器(例如逻辑回归)。搜集 更多时间序列数据可能不是最好的帮助您的学习者。这是 因为二进制分类器不是为时间序列设计的。 这并不是说一旦你选择了最好的机器学习算法 根据您的问题,添加更多数据对您没有好处。在这种情况下,它 会帮助你。 > 机器学习并不神奇;它无法从无到有。什么 确实是从更少的人那里获得更多...学习者将知识与数据结合起来 计划(多明戈斯,2012年)。 #### 更多信息: * [关于机器学习的一些有用的事情](https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf) * [在机器学习中,什么是更好的:更多数据或更好的算法?](http://www.kdnuggets.com/2015/06/machine-learning-more-data-better-algorithms.html) * [在机器学习中,更多数据总是优于更好的算法吗?](https://www.quora.com/In-machine-learning-is-more-data-always-better-than-better-algorithms/answer/Xavier-Amatriain?srid=Tds3)