百度推出AI入门必修课系列 7日打卡拿下强化学习

时间：2020-07-24 16:25:43 来源：互联网编辑：星辉 发表评论无障碍通道

风靡一时的《Flappy Bird》也算是虐遍人类玩家。游戏规则很简单，玩家在游戏时只需保持小鸟的飞行状态，并时刻躲避障碍物防止撞到即可。这个似乎“有些傻瓜”的游戏却让全球玩家欲罢不能，甚至不少玩家为此“爆肝”还难以通关，简直憋屈到火冒三丈。然而掌握了技术流的玩家成功借助AI实现“反虐”，开辟了N种分分钟通关路径。这里用到的正是强化学习技术——机器具备自动纠偏学习进步的能力!

/var/folders/1d/6yyxw8v903n8gj_69ph6s7k00000gn/T/com.microsoft.Word/WebArchiveCopyPasteTempFiles/640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1

(图：欲罢不能通关太难的游戏《Flappy Bird》)

AI是靠什么“打败”人类的?

强化学习(Reinforcement Learning)!这是一种基于与环境互动的目标导向的机器学习。在强化学习中，算法要自行作出决策，它并不需要依靠历史数据，只需要理解当前场景就足够。通过与当前场景互动，算法所做出的决策的相关性会逐渐增强，就像一个人一步步经历其各个学习阶段不断成长一样，这便是它的“过人之处”——没有懒惰与懈怠，在算法下可以在环境中持之以恒的学习，完美演绎“学霸”的一生。

(图：强化学习与人工智能、深度学习等的关系)

在强化学习中，算法被称为智能体Agent，Agent从环境中获取状态(state)，并决定自己要做出的动作(action)，环境会根据自身的逻辑给Agent予以奖励(reward)，奖励有正向和反向之分。比如在游戏中，击中一个敌人就是正向的奖励，而掉血或者游戏结束就是反向的奖励，强化学习会根据试错带来的结果，为下一步的动作做出决策。其设计灵感源于心理学中的行为主义理论：有机体如何在环境给予的奖励或惩罚刺激下，逐步形成对刺激的预期，从而产生能获得最大利益的习惯性行为——而这也是人类的自然学习路径。

(图：强化学习结构)

“强化学习最有魅力的地方就在于它可以自己学习。”百度飞桨6月推出的《强化学习7日打卡营-世界冠军带你从零实践》入门强化学习的公开课中，主讲师科科介绍说：“由于强化学习可直接与环境交互、从中学习，而非使用人类给的样本数据，因此它没有AI其他学习方式的天花板。或许由此让它找到比人类更好的方案，在游戏中打败了人类。”

不过，此时此刻强化学习虽让机器拥有了“智能”并在某些领域中打败了人类，但仍旧离“超越人类”非常遥远;而我们不能忽视的是，它能为人类创造的价值与服务切实地近在眼前。

(图：百度飞桨推出入门强化学习公开课《强化学习7日打卡营-世界冠军带你从零实践》)

强化学习当下正在为人类解决着什么问题?

强化学习正在快速发展。那么强化学习到底能为我们做点什么呢?科科老师作为百度飞桨强化学习PARL团队核心成员，所在团队曾两度夺得NeurIPS强化学习赛事世界冠军以及百度最高奖，她在课程中介绍了一系列强化学习“大有可为”的应用领域，同时也指出了此项技术应用的门槛，但是如果企业能够掌握强化学习这项特技，势必带来“护城河”般的核心竞争力。

例如，网站或APP的个性化定制中，去中心化的“预测”便可用强化学习实现。在这之中，智能体(Agent)是APP本身，环境(Environment)是用户可看见的信息列表与有着复杂主观喜好的用户。APP从信息列表中获得按照一定顺序排列或推荐的状态(state)并随着用户点击的正向反馈(+reward)与跳过、离开的负向反馈(-reward)中学习，给出更符合用户喜好的“智能排序”(action)。

(图：强化学习应用于网站或APP的个性化推荐)

又如交通治理中对于堵车情况的计算预判，与调度疏通;以及在电商营销中对价格与供求变化的敏感捕捉与快速分析并给出决策;甚至是股票市场、无人驾驶等等领域中，强化学习对复杂与未来不确定性所呈现出的探索与学习能力，或许会比人类更强。

(图：强化学习的应用)

极具吸引力的应用前景也引发了强化学习的学习热度。然而相关课程资源却很短缺，入门课程偏重理论，技术门槛太高。所以，兼具理论和应用实践讲解的《强化学习7日打卡营-世界冠军带你从零实践》一经推出就吸引了大批AI学习者。上线几天内就在B站全站学习类直播人气飙升至Top5;课程用到的强化学习框架PARL的GitHub账户Star快速增长一倍以上，成为耀眼的千星项目。PARL随即登上GitHub全球增长趋势榜。课程吸引了来自美国、新加坡、德国、日本等8个海外国家华人开发者，以及宾夕法尼亚大学、佛罗里达大学、加州大学伯克利分校、南安普顿大学、早稻田等全球顶级名校的学生，还包括不少跨学科的初学者。

强化学习的入门与学习路径是什么?

“面向有基础的同学，可以抛开技术背景直接讲结论，但是如果针对零基础同学打磨这门课，很多时候需要有很强的代入感，从他们的角度去考虑内容是否好接受，是否过于理论或过于脱离理论。”科科老师在课程设计时带入了自己初学强化学习的心理过程与探索方式，让很多初次接触强化学习的同学也能快速入门。

58岁已退休的人才管理专家及企业教练郭崇华先生因为一直关注强化学习而开启了此次课程的学习。他在结课后分享自己的学习经历，也给出了一条具有参考性的进阶路径。从0到快速跟上强化学习的课程，郭崇华将过往学习经历整体分为三段。第一个阶段针对“不确定性科学”学习方法论，可从概率学开始;第二阶段加强统计学与分析学的理解应用;而第三阶段则是接触机器学习的基础知识，对飞桨深度学习框架有了一定了解后此次跟随《强化学习7日打卡营》便快速入门了强化学习。在完全出于兴趣，惯于保持学习的郭崇华看来，这门课程的学习如行云流水般享受其中。“事实上，不仅是强化学习，国内很多AI教育从理论到coding其实是有断层的。但这门课的科科老师很好地达到了理论和实践中间的桥梁作用。”郭崇华如是分享到。

未来的可能性正越来越多的被掌握技术的人所优先把握。而与此同时，媒体不止一次地指出，当前中国紧缺500万AI人才。为了应对这一点，百度这样的AI头雁企业提供了越来越丰富而实用的AI学习内容和路径，尤显意义重大。学习说到底还是个人的事儿，只要想要学习，那便是乾坤尚未定，你我皆黑马!

百度搜索AI Studio进入官网访问《强化学习7日打卡营-世界冠军带你从零实践》公开课及更多AI课程。课程链接：https://aistudio.baidu.com/aistudio/course/introduce/1335

12月16日，讯飞AI录音笔旗舰新品S8离线版重磅上市。该款产品为完全隔绝外界网络转文字AI录音设备，其所有功能均在本地实现，为对安全性有严格要求的用户群提供了新工具。数据泄露事件频发，信息保护需求凸显数字世界以网络连接为基础，以数据流动释放价值。在数字化浪潮

核心亮点：解锁电竞未来： ROG将于CES 2025 ROG新品发布会推出多项创新技术，彰显电竞实力超强产品阵容：探索为顶级性能释放和极致使用体验而打造的全新ROG新品笔记本终极性能：全新ROG枪神系列、ROG魔霸系列、ROG幻Air系列及幻X笔记本登场，为极致性能、便携性及潮流设

近日，以“科技赋能家电产业转型升级”为主题的2024中国家电科技年会在湖北武汉召开，海信空调受邀参加“家电噪声技术专题研讨会”，并作主题汇报。同时，“第三届全国轻工适老创新产品及智能健康解决方案大赛”结果隆重揭晓，海信空调以柔风、送风、智能等显著优势一举

时至十二月，又是一年终末。伴随着12.12的来临，厂商们纷纷开启了新一轮的促销优惠。作为年末备受期待的好物节，声势浩大的促销无疑是大家挑选心仪好物的好机会。如果你想在近期为自己选购一款智能手表来激励运动监测健康，不妨尝试一下最新的三星Galaxy Watch7和三星Ga

2024年进入尾声，国补政策即将在12月31日结束，还尚未使用笔记本国补资格的消费者朋友们不妨关注高颜值游戏本华硕天选5Pro锐龙版，其搭载GeForce RTX 4070笔记本电脑GPU，NVIDIA GeForce RTX™ 和 NVIDIA RTX™ GPU 专为 AI 时代打造。RTX GPU 由业界领先的 NVIDIA GPU

《使命召唤：黑色行动6》是由Treyarch和Raven Software联合开发，并由动视发行的第一人称射击游戏，于2024年10月25日正式发布。游戏上线Steam后，获得了广大玩家的好评。动视官方也宣称，《使命召唤：黑色行动6》成为《使命召唤》系列中首发最成功的作。在游戏正式发布

由GSC Game World开发并发行的《潜行者2:切尔诺贝利之心》已在STEAM正式上线,这是一款探索冒险题材的第一人称射击游戏。游戏以2006年第二次核反应堆爆炸事件为背景,玩家将化身为一名“潜行者”,面对一场史诗级的危险战斗。游戏首发即支持NVIDIA DLSS 3技术,搭载耕升 GeF

ROG游戏手机9系列自上市以来，赢得了不少信仰玩家的喜爱与支持，其凭借着出色的性能释放、独一档的185Hz屏幕刷新率，成为了手游爱好者们绝佳的上分利器。全新的矩阵式液冷散热架构9.0此次更是获得了酷冷风扇X Pro、ROG冰川液冷壳等全新配件的加持，使ROG 9系列获得了更

自12月2日掠夺者电竞大赛2025中国区挑战赛招募贴发布以来，受到了来自全国范围内游戏玩家及无畏契约战队的广泛关注，在不到一周的时间内，百余支战队积极报名。本届掠夺者电竞大赛不仅秉持公平公正的赛事精神，更是在战队筛选中推出了平等化社交媒体化的全新规则，在#宏

近日,2024年得力数码打印新品推介会在湖南长沙隆重举行。新品推介会以“善印起航,智绘新篇”为主题,得力集团副总裁张磊、设备事业部行业部总监薛峰、数码打印产品部总监丁启等众多公司领导共同出席活动,与专业渠道客户、行业渠道客户、B2B平台总部负责人等近百位经销商

在2024年12月6日至7日于北京举行的 “2024 T-EDGE全球创新大会”上，众多科技界精英齐聚一堂。大会期间，备受瞩目的「2024 EDGE AWARDS 全球创新评选」揭晓了年度各大奖项，其中，北京智爱未来科技有限公司旗下的AISON爱畅新一代便携式智能K歌音箱凭借“搭载了优质的扬

随着双12脚步的日益临近，2024年最后一场盛大的的购物狂欢节即将拉开帷幕。在这个专属于消费者的节日里，各大手机厂商也为消费者带来了诸多福利政策，给想要手机换新的朋友带来更多选择。作为潮流科技单品的代表，三星Galaxy Z Flip6集时尚设计、实用外屏、出众影像和尖

近年来，随着科技的迅猛发展和人们生活方式的变化，可穿戴设备的市场呈现出蓬勃发展的趋势。近日，国货品牌西普尼重磅发布首款搭载华为智能机芯的珠宝级智能女表，打破传统智能腕表的设计边界，为年末智能穿戴设备市场带来一场视觉与科技的双重盛宴。在外观设计上，它采

作为全球范围内显示技术的一个极其重要的分支，量子点这项在2023年获得诺贝尔奖的尖端技术，近年来引起了越来越多包括TCL、三星、索尼等在内的电视龙头企业关注，其中作为全球量子点显示技术先行者的TCL，近期在该领域再次取得了新突破，推出了量子点Pro 2025技术，并且

冷冬渐至，北风低吟，随着寒潮席卷国内多地，冬季也正式拉开序幕。骤然变冷的天气不仅容易诱发感冒等季节性疾病，同时也打乱了不少朋友们的生活节奏与运动规律。而如果想要在冬季追求健康生活，一款能够监测运动与身体健康情况的三星Galaxy Watch智能手表就成了非常不错

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.