在github上叉

数据分析和机器学习应用程序

  • 课程:物理398毫升
  • 讲师:马克·诺瓦尔教授,msn@illinois.edu
  • 讲座:星期一从222个Loomis物理实验室开始的3-4:50 PM
  • 需要帮忙?
    • 吉特
      • 它向不活跃在房间里的人发送信息摘要,因此即使没有人在周围也要问一个问题。
      • 请不要发布有关课程中的所有学生都可以查看帖子的消息,以提供有关家庭作业问题的答案。
    • 浏览并创建问题
    • 工作时间
      • Neubauer教授:星期四下午4-5点以上飞涨

课程描述

欢迎您参加数据分析和机器学习应用程序(物理学家)课程!

在本课程中,您将学习如何分析和解释科学数据,并将现代机器学习工具和技术应用于物理研究中常见的问题,例如分类和回归。鉴于数据科学和人工智能的迅速发展和快速发展,本课程非常及时。每天都有将机器学习在物理科学上的新应用,这些方式正在推动我们对自然知识的了解。

本课程旨在互动和协作,同时发展自己的技能和知识。我从我们生活在以数据为中心的世界中生活的观点从2018年开始了这项课程,人们和机器都从大量数据中学习。从来没有一段时间,像您这样的早期职业物理学家将从科学数据分析,数据驱动的推理和机器学习以及对现代数据科学的最重要工具和技术的工作知识中的基础上的扎实理解中受益比今天。

这是课程的第三次产品。我欢迎您在课程的任何方面反馈,以便我可以改善课程。

先决条件

培训班

硬件

  • 您需要一台笔记本电脑。假定您有一台运行MACOS,Linux或Windows的笔记本电脑,可用于班级内外。

软件

  • 对Python的一些知识优先,但不需要。您确实需要了解计算机编程的基础知识。

配置

  • 课程讲座的工作簿和评估将是主持人Priairearn使用其工作区功能。这提供了您与课程笔记本互动所需的一切。您还可以选择在本地为课程环境运行Docker容器,这将比PL工作区更快,因为课程容器相当大。请参阅使用Phys398MLA Docker容器的说明这里

课程大纲

涵盖的主题包括:

  • 笔记本和数字Python
  • 处理和可视化数据
  • 在数据中找到结构
  • 测量和降低维度
  • 将线性方法适应非线性问题
  • 估计概率密度
  • 概率理论
  • 统计方法
  • 贝叶斯统计
  • 马尔可夫链蒙特卡洛实践
  • 随机过程和马尔可夫链理论
  • 变分推断
  • 优化
  • 计算图和概率编程
  • 贝叶斯模型选择
  • 在概率环境中学习
  • Scikit-Learn的监督学习
  • 交叉验证
  • 神经网络
  • 深度学习

主题将通过juypter笔记本中的现场代码示例/幻灯片在课堂上展示。

课堂参与

讲座将包括物理学和数据科学教学法,通过jupyter笔记本中的现场示例证明,您将在课堂上进行。您必须使用笔记本电脑和工作环境参加每次演讲。出席会议。

家庭作业

作业是本课程的重要组成部分,您将有机会将学习的技术应用于与科学数据分析相关的问题。所有作业都在课程大纲并通过大草原分发。您将通过Privae GitHub存储库提交作业。

项目

大约在课程的一半,您将有机会根据开放的科学数据从一组项目中进行选择,并应用您在课程中学到的知识。您将被要求回答有关数据的某些问题,并由您的分析支持并在jupyter笔记本中写成,您将提交。您的笔记本还将包括有关如何生成数据,其科学相关性和您的方法论的背景信息。

等级

  • 课堂参与〜20%
  • 家庭作业〜45%
  • 研究项目〜35%

课程大纲

[1月17日]没有演讲(MLK日)

[1月24日]LEC 01介绍

目标

  • 获取课程的概述,包括阅读列表和作业作业
  • 设置您的环境

讲座笔记本

家庭作业

  • 完成设置环境,以便您可以启动和执行笔记本

需要阅读

补充阅读

  • 没有任何

[1月31日]LEC 02数据科学

目标

  • 熟悉Jupyter笔记本和数字Python
  • 了解处理和描述数据

讲座笔记本

家庭作业

[2月7日]LEC 03可视化和查找数据中的结构

目标

  • 了解可视化数据
  • 了解物理中聚类数据的重要性
  • 了解如何在数据(聚类)中找到结构
    • Kmeans,光谱聚类,DBSCAN

讲座笔记本

家庭作业

  • 作业1:数字Python和数据处理
    • 2月7日星期一通过PraireRearn发行
    • 到期下午3:00 CDT2月14日星期一

补充阅读

[2月14日]LEC 04维度和线性

目标

  • 测量和降低维度
  • 将线性模型适应非线性问题

讲座笔记本

家庭作业

  • 作业2:可视化,协方差和相关性
    • 2月14日星期一通过PraireRearn发行
    • 到期下午3:00 CDT2月21日星期一

补充阅读

[2月21日]LEC 05内核功能和概率理论

目标

  • 了解内核功能
  • 了解概率理论

讲座笔记本

家庭作业

  • 作业3:期望最大化算法,K-均值,原理分析
    • 2月21日星期一通过PraireRearn发行
    • 到期下午3:00 CDT2月28日星期一

补充阅读

[2月28日]LEC 06概率密度估计和统计

目标

  • 估计概率密度
  • 了解统计方法

讲座笔记本

家庭作业

  • 作业4:概率
    • 2月28日星期一通过PraireRearn发行
    • 到期下午3:00 CDT3月7日星期一

补充阅读

[3月7日]LEC 07贝叶斯统计和马尔可夫链蒙特卡洛

目标

家庭作业

  • 作业5:内核密度估计
    • 3月7日星期一通过PraireRearn发行
    • 到期下午3:00 CDT3月21日星期一

补充阅读

[3月14日]没有演讲(春假)

[3月21日]LEC 08随机过程,马尔可夫链和变异推理

目标

  • 了解数据科学领域中的随机过程
  • 了解马尔可夫链理论
  • 了解变异推理方法

讲座笔记本

家庭作业

  • 作业6:贝叶斯统计和马尔可夫链蒙特卡洛
    • 3月21日星期一通过Priairearn发行
    • 到期下午3:00 CDT3月28日星期一

补充阅读

[3月28日]LEC 09优化,计算。图和概率。prog。

目标

  • 了解优化和随机梯度下降
  • 了解计算图的框架
  • 了解概率编程方法

讲座笔记本

家庭作业

  • 作业7:马尔可夫连锁店
    • 3月28日星期一通过Priairearn发行
    • 到期下午3:00 CDT4月18日星期一

补充阅读

[4月4日]LEC 10贝叶斯模型和概率学习

目标

讲座笔记本

家庭作业

  • 没有任何

补充阅读

[4月11日]LEC 11监督学习与交叉验证

目标

  • 了解交叉验证

讲座笔记本

家庭作业

  • 没有任何

补充阅读

[4月18日]LEC 12人工神经网络

目标

  • 使用神经网络学习和推理

讲座笔记本

家庭作业

  • 作业8:交叉验证和人工神经网络
    • 4月18日星期一通过PraireRearn发行
    • 到期下午3:00 CDT4月25日星期一

补充阅读

[4月25日]LEC 13深度学习

目标

  • 了解深度学习

讲座笔记本

家庭作业

  • 没有任何

[5月2日]LEC 14深度学习

目标

讲座笔记本

  • 深度学习

家庭作业

  • 没有任何

资源

参考

工具

gitgithub

Anaconda康达

jupyter项目

致谢

我想承认大卫·柯比(David Kirby)在加利福尼亚大学欧文分校的本课程基础的材料和设置以及我们进行的有用讨论。我想要感谢马修·费克特(Matthew Feickert)杜旺·恩为他们的指导和对课程的贡献。我也承认该课程github.com/advanced-js为此,使用课程表模板。

_________________

a伊利诺伊大学课程由物理部

内容保持在github并分布在BSD3许可证

执照NBViewer