跳转至

Data modeling and analysis

数据建模与分析的笔记,由 Gemini-2.5 (都用了当时最新的模型版本)结合课程 slides 生成,可能存在错误。

Info
  • 成绩组成 :
    • 课后作业(20%)
      • 每周五 10:00 前,学在浙大平台
    • 编程大作业(15%)
    • 读书报告(15%)
      • 论文阅读报告
    • 期末考试(50%)

关于历年卷

  • 2020 - 2021
    • 平衡 kd 树(绘制、使用,例 3.2
    • 朴素贝叶斯(分类器构建,例 4.1
    • 决策树(信息增益、剪枝)
    • 熵(定义、比较)
    • 支持向量机(概念辨析、对偶问题,求解)
    • 层次聚类(聚合聚类,例 14.1
    • 奇异值分解(奇异值存在、求解过程、唯一性判断)
    • 主成分分析(求解过程)
    • 马尔可夫链(概率转移矩阵、平稳分布,例 19.3
  • 2021 - 2022
    • k 近邻模型(概念、构造、使用)
    • 决策树(信息增益、基尼指数)
    • 支持向量机(概念、对偶问题、求解)
    • 简述感知机,Adaboost,朴素贝叶斯法,logistic 模型的学习策略和算法(例 8.2
    • K 均值聚类(使用,例 14.2
    • 奇异值分解(求解、说明)
    • 主成分分析(求解、证明
    • MCMC(蒙特卡洛积分、平稳分布,例 19.7
  • 2022 - 2023
    • 简答题
      • 感知机(策略、唯一性)
      • k 近邻 & k 均值聚类(概念、k 选取)
      • 朴素贝叶斯
      • 决策树(过程)
    • 最大熵模型
    • 支持向量机(对偶、求解、核方法)
    • 谱聚类(证明)
    • 奇异值分解(求解、说明)
    • 主成分分析(求解、证明)
    • 马尔科夫链(可逆性)
  • 2023-2024 年题型
    • 六道大题:四个计算,两个证明
    • 第七题问答题,8 个,每个 5
    • 概论(最大后验估计 = 结构风险最小)
    • 朴素贝叶斯
    • 支持向量机
    • EM
    • 谱聚类
  • 2024-2025 年题型
    • 简答题与计算题为主,大概一个证明题
      • 近年开始有简答题, Adaboost 等也需要进行考虑了?
    • 不携带计算器,数据会告知

评论