强化学习(Reinforcement Learning),AlphaGo背后的神秘力量!
RL本质上是可用于序列决策的一种工具,最初源于增强学习及神经网络的结合,并因深度学习时代而复兴!
得益于大数据的普及、计算能力的提升及新的算法技术,我们正见证着强化学习的诸多突破性进展及其在人工智能领域具有革命性的全新架构及应用——包括深度 Q 网络、可微分神经计算机、异步方法、对抗网络架构、价值迭代网络、用于机器翻译的双学习、口语对话系统、信息提取、 引导性策略搜索、 生成对抗模仿学习、非监督的强化及辅助学习及神经架构设计等。
本课程为炼数成金【强化学习系列】开山之作,将从一篇CVPR2019满分文章的解读开始。这篇精彩绝伦而且可能代表人工智能未来风向标的技术,很遗憾作者并没有提供其开源代码!课程将结合其算法思想、算法设计与实现步骤等细节,引导学员逐步实现强化学习与机器视觉的结合,并尝试与自然语言处理的进一步融合(作者实现的部分)。课程规划主要分为算法原理讲解和工程技术实战两个部分,通俗易懂,分级探索工程应用。
1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。
2、 学习作业:每课均有布置课后作业,学员完成书面作业后则可进入下一课学习。
3、 老师辅导:通过论坛站内信及邮件等多种方式与老师进行一对一互动。
4、 完成课程:最后一课作业交纳后,老师完成作业批改,即可完成课程并取回相应剩余的逆向学费。
GMT+8, 2024-9-7 23:42 , Processed in 0.070667 second(s), 31 queries .