《智能计算系统》

全面贯穿人工智能整个软硬件技术栈

以应用驱动,形成智能领域的系统思维

前沿研究与技术实践结合,快速提升智能领域的系统能力

课程简介

智能计算系统是智能的核心物质载体,每年全球要制造数以十亿计的智能计算系统(包括智能手机、智能服务器、智能可穿戴设备等),需要大量的智能计算系统的设计者和开发者。智能计算系统人才的培养直接关系到我国智能产业的核心竞争力。因此,对智能计算系统的认识和理解是智能时代计算机类专业学生培养方案中不可或缺的重要组成部分,是计算机类专业学生的核心竞争力。
本课程采用“应用驱动,全栈贯通”的思想,以一个图像迁移风格的驱动范例带动,重点围绕智能计算系统的设计理论、方法、关键技术等展开讨论,从基本概念开始,由浅入深帮助学生建立智能计算系统设计及应用的知识体系,培养智能时代急需的芯片设计、软件开发、算法研发等各个层次的人才。

课程教材

  • 购买教材
  • 由深度学习处理器芯片研究的开拓者陈云霁,带领中科院计算所、软件所的专家学者,结合其多年丰富的工程实践经验、专业教学经验以及实验室研究成果,倾心写就。
    国际首部完整讲授当代深度学习计算系统软硬件技术栈的书。
    由于教材的封面是由图像风格迁移算法生成的梵高风格的星空图片,全书以该风格迁移应用作为驱动范例,贯穿始终,来介绍在面向深度学习的智能计算系统中从算法到编程再到芯片是如何工作的,因此又被称作“星空书”。

研究员、博导,现为中国科学院计算技术研究所所务委员、智能处理器研究中心主任,中国科学院大学岗位教授,教育部高等学校计算机类专业教学指导委员会计算机系统专委会委员。他带领团队研制了国际上首个深度学习处理器芯片“寒武纪1号”。他的研究成果已经实现了规模化应用。他的学术论文多次获得计算机体系结构顶级国际会议最佳论文奖,受到上百个国际知名机构跟踪引用。因此,他被Science杂志刊文评价为深度学习处理器研究的“先驱”和“引领者”。

他曾获国家杰出青年科学基金、中国青年五四奖章、中国青年科技奖、全国创新争先奖、教育部“青年长江学者”、国家自然科学基金委“优秀青年基金”、国家万人计划“青年拔尖人才”,并被《MIT科技评论》评为全球35位杰出青年创新者(2015年度)。他还是北京智源人工智能研究院智能体系结构与芯片方向首席科学家。


中科院软件所研究员、博导,CCF高级会员。研究方向为智能计算及视频处理。在相关领域发表多篇CCF A类的期刊和会议论文,获得了CCF A类会议MICRO’14的最佳论文奖(该会议五十年来唯一一次美国以外国家获此奖)。作为负责人主持过多项国家自然科学基金项目、国家重点研发计划课题等。

中科院计算所副研究员。研究方向为高性能智能计算系统设计技术,先后参与了多项国家重点研发计划项目、国家科技重大专项项目、863项目、中科院国际合作项目等。作为核心成员参与了多款深度学习处理器的研发,发表或录用学术论文近30篇,申请专利近20项。

中科院计算所研究员。长期从事智能计算系统相关研究。在ISCA、MICRO、HPCA、IJCAI等国际会议及ACM/IEEE汇刊上发表学术论文多篇。授权发明专利多项,曾入选国家知识产权局“百件优秀中国专利”。先后入选中国科协首届“青年人才托举工程”、中科院青年创新促进会、国家“万人计划”青年拔尖人才。

中科院计算所副研究员。长期从事人工智能和计算机体系结构交叉研究,他在深度学习处理器方向做出了多项有国际影响力的研究成果。他在中国计算机学会认定的顶级会议/期刊(CCF A类)上发表了近20篇论文,曾获得ASPLOS’14最佳论文奖(这是亚洲机构首次获计算机体系结构领域顶级国际会议最佳论文奖),入选IEEE Micro杂志评选的国际计算机体系结构领域年度十佳论文。

智能计算系统课程的实验设计以风格迁移作为驱动
结合各章节的重难点与课程理论章节1:1匹配
介绍算法、编程框架、智能编程语言和智能处理器等方面的分阶段实验
以不同领域的综合实验将软硬件栈的知识点贯穿起来
让学生真正掌握智能计算系统的部署与优化
另外,课程团队联手希冀平台为课程打造配套的自动评测平台
学生可以在截止日期前多次提交成绩
也可以减轻老师在教学考核中的执行压力,轻松上手。

  • 第二章实验:神经网络设计 展开
    • 2.1 基于三层神经网络实现手写数字分类
    • 2.2 基于DLP平台实现手写数字分类
  • 第三章实验:深度学习设计 展开
    • 3.1 基于VGG19实现图像分类
    • 3.2 基于DLP平台实现图像分类
    • 3.3 非实时图像风格迁移
  • 第四章实验:编程框架 展开
    • 4.1 基于VGG19实现图像分类
    • 4.2 实时风格迁移
    • 4.3 实时风格迁移的训练
    • 4.4 自定义TensorFlow CPU算子
  • 第五章实验:智能编程语言 展开
    • 5.1 智能编程语言算子开发与集成实验
    • 5.2 智能编程语言性能优化实验
  • 第六章实验:深度学习处理器运算部件设计* 展开
    • 6.1 串行内积运算器设计
    • 6.2 并行内积运算器设计
    • 6.3 矩阵运算子单元设计
  • 第七章实验:综合实验 展开
    • 7.1 目标检测-YOLOv3
    • 7.2 文本识别OCR-EAST
    • 7.3 自然语言处理-BERT

  • 第一章:概述 展开
    • 1.1 人工智能
    • 1.2 智能计算系统
    • 1.3 驱动范例
  • 第二章:神经网络基础 展开
    • 2.1 从机器学习到神经网络
    • 2.2 神经网络训练
    • 2.3 神经网络设计原则
    • 2.4 过拟合与正则化
    • 2.5 交叉验证
  • 第三章:深度学习 展开
    • 3.1 适合图像处理的卷积神经网络
    • 3.2 基于卷积神经网络的图像分类算法
    • 3.3 基于卷积神经网络的图像目标检测算法
    • 3.4 序列模型:循环神经网络
    • 3.5 生成对抗网络GAN
    • 3.6驱动范例
  • 第四章:编程框架使用 展开
    • 4.1 为什么需要编程框架
    • 4.2 编程框架概述
    • 4.3 TensorFlow编程模型及基本用法
    • 4.4 基于TensorFlow实现深度学习预测
    • 4.5 基于TensorFlow实现深度学习训练
  • 第五章:编程框架机理 展开
    • 5.1 TensorFlow的设计原则
    • 5.2 TensorFlow计算图机制
    • 5.3 TensorFlow系统实现
    • 5.4 编程框架对比
  • 第六章:深度学习处理器原理 展开
    • 6.1 深度学习处理器概述
    • 6.2 目标算法分析
    • 6.3 深度学习处理器DLP结构
    • 6.4 优化设计
    • 6.5 性能评价
    • 6.6 其他加速器
  • 第七章:深度学习处理器架构 展开
    • 7.1 单核深度学习处理器
    • 7.2 多核深度学习处理器
  • 第八章:智能编程语言 展开
    • 8.1 为什么需要智能编程语言
    • 8.2 智能计算系统抽象架构
    • 8.3 智能编程模型
    • 8.4 智能编程语言基础
    • 8.5 智能应用编程接口
    • 8.6 智能应用功能调试
    • 8.7 智能应用性能调优
    • 8.8 基于智能编程语言的系统开发
  • 第九章:实验 展开
    • 9.1 基础实验:图像风格迁移
    • 9.2 拓展实验:物体检测
  • 前序课程 展开
    • 线性代数
    • 概率论与数理统计
    • 计算机组成原理
    • 机器学习
    • 算法导论
  • 教材及参考书 展开
    • 陈云霁, 李玲, 李威, 郭崎, 杜子东, “智能计算系统”,机械工业出版社,2020.
    • Ian Goodfellow, Yoshua Bengio, Aaron Courville, “Deep learning”, MIT Press, 2016.
    • 周志华, “机器学习”, 清华大学出版社, 2016.
    • Tianshi Chen, Zidong Du, Ninghui Sun, Jia Wang, Chengyong Wu, Yunji Chen, and Olivier Temam, “DianNao: A Small-Footprint High-Throughput Accelerator for Ubiquitous Machine-Learning”, in Proceedings of the 19th ACM International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS), 2014
    • Yunji Chen, Tao Luo, Shaoli Liu, Shijin Zhang, Liqiang He, Jia Wang, Ling Li, Tianshi Chen, Zhiwei Xu, Ninghui Sun, and Olivier Temam, “DaDianNao: A Machine-Learning Supercomputer”, in Proceedings of the 47th IEEE/ACM International Symposium on Microarchitecture (MICRO), 2014.
    • Daofu Liu, Tianshi Chen, Shaoli Liu, Jinhong Zhou, Shengyuan Zhou, Olivier Temam, Xiaobing Feng, Xuehai Zhou, and Yunji Chen, “PuDianNao: A Polyvalent Machine Learning Accelerator”, in Proceedings of the 20th ACM International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS), 2015.
    • TensorFlow官网, https:/tensorflow.google.cn/.
    • Leon A Gatys , Alexander S Ecker, and Matthias Bethge, “Image style transfer using convolutional neural networks”, in Proceedings of the IEEE conference on Computer Vision and Pattern Recognition (CVPR), 2016.
    • Justin Johnson, Alexandre Alahi, and Fei-Fei Li, “Perceptual losses for real-time style transfer and super-resolution”, in Proceedings of the European Conference on Computer Vision (ECCV), 2016
    • BANG官网.http://forum.cambricon.com/list-100-1.html

原则上课程采用全实验考核,最终依据各学校教务政策有所调整。

通常情况下,课程为40个学时2个学分,但依据各学校政策有所不同,课时数会有32、40、48、60等具体情况,学分也在2-3个之间有所不同。

目前开设年级大三和研究生一年级居多。开设学院涵盖了计算机、微电子、软件、通信工程、物联网、自动化、人工智能等众多相关学院。

《智能计算系统》课程的实验环境和实验设备目前由寒武纪公司提供支持,课程需要使用云平台资源和寒武纪智能处理卡。实验评测平台由希冀团队提供。

学生最好具备线性代数、概率论与数理统计、计算机组成原理、机器学习、人工智能等相关课程基础。

课程的讨论区请点击 http://forum.cambricon.com/list-7-1.html 。大家将获得课程学习、实验指导、申请实验环境。