--- title: Glossary localeTitle: 词汇表 --- ## 词汇表 快速描述常用术语的一两句话。查看各个页面 更多细节。 * **机器学习** - 统计与计算机科学的交叉 命令教导计算机执行任务而不明确编程。 * **深度学习** - 基于学习数据表示的机器学习方法的总称,而不是基于完成给定任务的算法。它包括深层神经网络,深信念网络和递归神经网络等架构。 * **神经进化** - 基于通过网络的随机突变通过权重,偏差和架构生成神经网络的机器学习方法的总称。神经进化的最常见形式是增强拓扑的神经进化( [NEAT](https://en.wikipedia.org/wiki/Neuroevolution_of_augmenting_topologies) )和交互式约束的神经进化( [ICONE](http://ikw.uni-osnabrueck.de/~neurokybernetik/media/pdf/2012-1.pdf) )。 * **统计学习** - 以机器学习为目标 统计推断,由此得出数据的结论而不是 专注于预测准确性 * **监督学习** - 使用历史数据预测未来。示例:使用房屋销售价格的历史数据来预测房屋的售价。回归和分类受到有监督的学习。 * **无监督学习** - 在未标记数据中查找模式。示例:按购买行为对客户进行分组。聚类受无人监督学习。 * **强化学习** - 使用模拟或真实环境,其中给予机器学习算法输入和稀疏奖励以构建模型以预测动作。强化学习已被用于[训练虚拟机器人以平衡自己](https://blog.openai.com/competitive-self-play/)并[击败为人类设计的游戏](https://blog.openai.com/openai-baselines-dqn/) 。 * **回归** - 用于预测连续值的机器学习技术。线性回归是最流行的回归算法之一。 * **分类** - 用于预测离散值的机器学习技术。 Logistic回归是最流行的分类算法之一。 * **关联规则学习** - 一种基于规则的机器学习方法,用于发现大型数据库中变量之间的有趣关系。 ``` f: x -> y Here 'f' is a function that takes 'x' as input and produces 'y' as output. If the output value 'y' is a real number / continous value then the function is a regression technique. If the output value 'y' is a discrete / categorical value then the function is a classification technique. ``` * **聚类** - 未标记数据的分组。使用统计信息识别模式。 * **降维** - 减少数据中随机变量的数量,以获得更准确的预测。 * **随机森林** - 随机森林或随机决策森林是用于分类,回归和其他任务的集成学习方法,其通过在训练时构建多个决策树并输出作为类的模式或平均预测的类来操作。个别树木。 - **贝叶斯网络** - 贝叶斯网络是概率图形模型,其通过有向无环图(DAG)将一组随机变量与其条件独立性相关联。它以一种简单的方式将随机变量与其事件预测的条件独立性联系起来。它在线索与事物关系中起着至关重要的作用。 - **偏差 - 方差权衡** - 偏差是有帮助的,因为它有助于我们确定预测值和实际值的平均差异,而方差有助于我们确定同一数据集上不同预测的差异。如果偏差增加,则模型在预测中具有高误差,这使得模型不足。高变化使得模型过度拟合,因为模型仅在给定数据集处连续训练自身,并且对尚未看到的数据执行不良。找到偏差和方差之间的平衡是建立良好模型的关键。 ### 更多信息: * [术语表 - 机器人](http://robotics.stanford.edu/~ronnyk/glossary.html) * [术语表 - 机器学习,统计学和数据科学](https://www.analyticsvidhya.com/glossary-of-common-statistics-and-machine-learning-terms/)