萧萧发自凹非寺

  量子位报道公众号 QbitAI

  斯坦福最经典的计算机视觉课程 CS231n——全称是面向视觉识别的卷积神经网络。

  今天更新啦。

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

  作为计算机视觉和深度学习领域的经典课程,CS231n 由李飞飞团队打造,从课程设计到内容选择,都以入门为导向。

  然而,自从 2017 年后,这门课程的录制版就没再更新过,在李飞飞的社交媒体下面,不时能听见网友吐槽的声音:

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

我们很喜欢您的课程,但这个领域发展得非常快,为什么 2017 年后的视频课就不再上传了?

  现在,这门课程的录制视频终于更新了,想要入门计算机视觉的小伙伴,可以收藏学习~(文末附视频链接)

  那么,CS231n 课程都讲了些什么?

  22 节课,入门计算机视觉

  CS231n 是斯坦福开设的一门视觉识别课程,在了解计算机视觉的基础上,理解深度学习在这个行业的应用。

  作为一门研究机器人如何「看」的领域,计算机视觉的应用范围非常广泛,像自动驾驶汽车识别行人、图像搜索引擎自动分类等等。

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

  而深度学习的出现,极大地提高了计算机视觉的应用效果。

  这门课从理论到实践一键通,学习后,不仅能实现、训练和调试神经网络,还能掌握计算机视觉的前沿研究。

  课程的重点在于解决图像识别的问题,为了达成这个目标,将会讲授反向传播算法、训练和微调神经网络的实用技巧。

  这次更新的录制课,在内容和形式上都紧跟 AI 领域新潮流。

  从模式到内容紧跟潮流

  从 2017 年的录制课视频来看,一共只有 16 讲的内容。

  这次「升级版」的 22 讲内容,不仅细化了目前比较热门的生成模型(如 GAN)的介绍课程,将它从一课时变成了两课时,而且还更新了Transformers、3D、视频处理等近年兴起的行业热门。

  例如,在 17 课的 3D 视觉课程中,就介绍了将神经网络应用于 3D 结构的方法。

  在这门课程里,不仅有关于 3D 数据的不同表示形式的讨论,还有对深度图、隐函数、点云等理论知识的介绍。

  除此之外,对于 3D 形状这个新领域,神经网络好坏的度量标准也有所体现。

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

  △ 3D 视觉课程 PPT

  至于第 18 课的视频处理,课时则主要介绍了 CNN 在视频分类中的应用方法,以及视频识别中的通用技术等。

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

  △ 视频处理课程 PPT

  不仅如此,这次的录制视频也更贴合在线课程的形式。

  2017 年的录制版 CS231n 课程,只有 PPT 界面显示、或是偶尔出现教授讲课的界面:

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

  虽然也有 PPT 和音频同步,但如果想找某个想看的部分,就只能在滚动条上反复拖拉。

  更新后的视频课,具体画风是这样的:

李飞飞团队最经典计算机视觉课更新!斯坦福出品,深度学习入门必备-冯金伟博客园

  不仅更有现场代入感了,而且在导师讲课时,也能通过他的手势跟上知识点所在的位置。

  每一节课、每一页的 PPT 都会呈现在视频下方,具体对某个知识点感兴趣、或是想要听哪一节的 PPT,都可以直接点击视频观看。

  是不是已经有些跃跃欲试、准备好投身知识的海洋了?

  来看看下面的课程表吧。

  课程一览

  CS231n 更新后的课程表如下,对里面的部分知识点感兴趣的话,可以戳下方传送门进行学习~

课时1:课程介绍
课时2:图像分类
课时3:线性分类器
课时4:优化算法
课时5:神经网络
课时6:反向传播
课时7:卷积结构
课时8:卷积神经网络(CNN)架构
课时9:硬件/软件知识
课时 10:训练神经网络(1)
课时 11:训练神经网络(2)
课时 12:循环神经网络
课时 13:注意力机制
嘉宾讲座:对抗性机器学习
课时 14:可视化和理解
课时 15:目标检测
课时 16:图像分割
课时 17:3D 视觉
课时 18:视频处理
课时 19:生成模型(1)
课时 20:生成模型(2)
课时 21:强化学习
课时 22:回顾/总结

  传送门:

  网课链接:

  http://leccap.engin.umich.edu/leccap/site/jhygcph151x25gjj1f0

  PPT 下载:

  https://www.youtube.com/playlist?list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r