Data modeling and analysis¶
数据建模与分析的笔记,由 Gemini-2.5 (都用了当时最新的模型版本)结合课程 slides 生成,可能存在错误。
Info
- 成绩组成 :
- 课后作业(20%)
- 每周五 10:00 前,学在浙大平台
- 编程大作业(15%)
- 读书报告(15%)
- 论文阅读报告
- 期末考试(50%)
- 课后作业(20%)
关于历年卷 ¶
- 2020 - 2021
- 平衡 kd 树(绘制、使用,例 3.2)
- 朴素贝叶斯(分类器构建,例 4.1)
- 决策树(信息增益、剪枝)
- 熵(定义、比较)
- 支持向量机(概念辨析、对偶问题,求解)
- 层次聚类(聚合聚类,例 14.1)
- 奇异值分解(奇异值存在、求解过程、唯一性判断)
- 主成分分析(求解过程)
- 马尔可夫链(概率转移矩阵、平稳分布,例 19.3)
- 2021 - 2022、
- k 近邻模型(概念、构造、使用)
- 决策树(信息增益、基尼指数)
- 支持向量机(概念、对偶问题、求解)
- 简述感知机,Adaboost,朴素贝叶斯法,logistic 模型的学习策略和算法(例 8.2)
- K 均值聚类(使用,例 14.2)
- 奇异值分解(求解、说明)
- 主成分分析(求解、证明
? ) - MCMC(蒙特卡洛积分、平稳分布,例 19.7)
- 2022 - 2023
- 简答题
- 感知机(策略、唯一性)
- k 近邻 & k 均值聚类(概念、k 选取)
- 朴素贝叶斯
- 决策树(过程)
- 最大熵模型
- 支持向量机(对偶、求解、核方法)
- 谱聚类(证明)
- 奇异值分解(求解、说明)
- 主成分分析(求解、证明)
- 马尔科夫链(可逆性)
- 简答题
- 2023-2024 年题型
- 六道大题:四个计算,两个证明
- 第七题问答题,8 个,每个 5 分
- 概论(最大后验估计 = 结构风险最小)
- 朴素贝叶斯
- 支持向量机
- EM
- 谱聚类
- 2024-2025 年题型
- 简答题与计算题为主,大概一个证明题
- 近年开始有简答题, Adaboost 等也需要进行考虑了?
- 不携带计算器,数据会告知
- 简答题与计算题为主,大概一个证明题