freeCodeCamp/guide/chinese/machine-learning/principles/data-alone-is-not-enough/index.md

1.6 KiB
Raw Blame History

title localeTitle
Data Alone Is not Enough 单独的数据还不够

单独的数据还不够

不考虑改变机器学习算法或其他方面 训练模型,单靠数据不足以帮助学习者做得更好。

每个学习者都必须在数据之外体现一些知识或假设 为了超越它而给出Domingos2012

这句话基本上是说,如果你盲目地选择一个 学习者只是因为你听说它做得好,收集更多的数据不会 必然会帮助您实现机器学习目标。

例如,假设您有依赖于时间的数据(例如时间序列数据) 并且您想使用二元分类器(例如逻辑回归)。搜集 更多时间序列数据可能不是最好的帮助您的学习者。这是 因为二进制分类器不是为时间序列设计的。

这并不是说一旦你选择了最好的机器学习算法 根据您的问题,添加更多数据对您没有好处。在这种情况下,它 会帮助你。

机器学习并不神奇;它无法从无到有。什么 确实是从更少的人那里获得更多...学习者将知识与数据结合起来 计划多明戈斯2012年

更多信息: