机器学习-2025-2026-1(2)
授课教师:230551
总学时:34
课程教材:《机器学习(Python+sklearn+TensorFlow 2.0)》是2020年清华大学出版社出版的图书,作者是王衡军 ISBN: 9787302559283
先修课程:《高等数学》《线性代数》《概率统计》
主要参考书目:
《机器学习》,周志华,清华大学出版社,出版时间:2016-01-01,ISBN:9787302423287
[1]. 《Introduction to Data Mining》Pang-Ning Tan著, Pearson Education Limited,出版时间:2019-05-31,ISBN编号:9780273769224。
[2]. 《Mining Massive Datasets》, Anand Rajaraman, Jeff Ullman, and Jure Leskovec,Cambridge University Press,出版时间:October 2011, 出版时间:9781107077232
课程内容简介(中文):本课程内容包括数据处理,经典机器学习模型和流行深度学习模型三大块,旨在使学生掌握经典且应用广泛的机器学习方法,并结合实际问题进行分析和解读,更好地满足现实中利用数据进行分类和预测等需求。对于数据处理,课程将从数据格式讲起,随后介绍数据相似度及距离度量方法,还有数据降维方法。特别地,对于数据降维方法,本课程将围绕SVD分解具有的一系列性质进行导入,让学生对降维背后的数理知识具备更好的理解。 对于经典机器学习模型,课程将划分为无监督学习,有监督学习以及强化学习三大块。无监督学习包括k均值聚类方法,层次聚类方法以及DBSCAN基于密度的聚类方法。有监督学习包括线性回归,逻辑回归,k近邻分类,决策树,支持向量机,朴素贝叶斯,神经网络等。最后对于强化学习,本课程将简述其近几年在各个场景所取得的代表性突破。随后采用迷宫突围的例子做为引入,介绍Q-learning的方法,在此基础上引入DQN即深度Q学习的介绍。对于当下流行的深度学习模型,本课程择取了图卷积神经网络以及编码器解码器等模型进行讲解。 本课程在介绍模型方法时讲以其背后的数理知识为重点,着重培养学生的理解能力,为学生以后从事机器学习研究领域或者开发相关应用打下坚实基础。
课程内容简介(英文):