freeCodeCamp/guide/chinese/machine-learning/principles/its-generalization-that-counts/index.md

1.2 KiB

title localeTitle
Its Generalization That Counts 它的概括

它的概括

机器学习的力量来自于不必硬编码或明确 定义描述训练数据和看不见的数据的参数。这是 机器学习的基本目标:概括学习者的发现。

要测试学习者的普遍性,您需要拥有单独的测试数据 设置不用于培训学习者的任何方式。这可以通过创建 将整个训练数据集分成训练和测试集,或者 只收集更多数据。如果学习者要使用测试中找到的数据 数据集,这会在学习者中产生一种偏见,而不是在 现实。

了解学习者如何对测试数据集进行操作的一种方法是 执行所谓的交叉验证 。这会随机分裂你的 将数据训练到给定数量的子集(例如,十个子集)和 当学习者训练其余时,留下一个子集。然后一次 学习者已经过训练,剩下的数据集用于测试。这个 训练,留下一个子集,并在旋转时重复测试 子集。

更多信息: