搜 索

统计学习及监督学习概论

  • 141阅读
  • 2023年04月24日
  • 0评论
首页 / AI / 正文

统计学习的定义:统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。

统计学习的三要素:统计学习方法由模型、策略、算法三部分组成。其中,模型假设数据生成的随机过程,策略描述如何进行模型选择,算法包括具体的学习方法和算法实现。

监督学习、无监督学习、半监督学习和强化学习:监督学习是利用带有标记信息的数据来训练模型,无监督学习是利用未带有标记信息的数据训练模型,半监督学习是同时利用带有和未带有标记信息的数据训练模型,强化学习则是根据环境反馈来学习如何进行决策。

统计学习的流程:统计学习的流程包括数据预处理、模型选择与评估、模型调参和模型应用四个步骤。

泛化能力和过拟合:泛化能力是指模型对未知数据的预测能力,过拟合是指模型在训练数据上表现很好,但在测试数据上表现不佳的现象。为了提高模型的泛化能力,需要进行正则化等方法来避免过拟合现象。

损失函数和风险函数:损失函数是衡量模型预测结果与真实结果的不一致程度,风险函数是衡量模型预测结果与真实结果不一致的期望。为了降低风险函数,需要通过最小化损失函数来选择最优模型。

评价指标:评价指标用于评价模型的性能,如分类问题中的准确率、召回率和F1值等指标。

参考资料

《统计学习方法》第一章

评论区
暂无评论
avatar