Epic 喜加二:《Arranger: A Role-Puzzling Adventure》《Trash Goblin》免费领
纯净之家 5 月 8 日最新消息,Epic 商城本周 “喜加二” 福利如期而至,即日起至 5 月 14 日,玩家可限时免费领取《Arranger: A Role-Puzzling Adventure》与《Trash Goblin》两款游戏,入库后可永久保留。
更新日期:2022-07-23
来源:纯净之家
谷歌 AI 宣布,在多任务学习上取得了巨大进展:他们搞出一个会玩 41 款雅达利游戏的 AI,而且采用的新训练方法比起其他算法,训练效率大大提升!

此前会玩星际争霸的 CherryPi 和火出圈的 AlphaGo 都属于单游戏智能体(Agent),也就是说,一个 AI 只会玩一种游戏。多游戏智能体这边,现有的训练算法屈指可数:主要包括时间差分学习算法(Temporal Difference Learning,TD)和行为克隆(Behavioral Cloning,BC)等。
不过为了让一个智能体同时学会玩多款游戏,之前的这些方法的训练过程都很漫长。
现在,谷歌采用了一个新决策 Transformer 架构来训练智能体,能够在少量的新游戏数据上迅速进行微调,使训练速度变得更快,而且训练效果也是杠杠的 —— 该多游戏智能体玩 41 款游戏的表现综合得分,是 DQN 等其他多游戏智能体的 2 倍左右,甚至可以和只在单个游戏上训练的智能体媲美。

△ 100% 表示每款游戏的人类平均水平,灰色条代表单游戏智能体,蓝色条代表多游戏智能体
下面就来看看这个性能优秀的多游戏智能体。
新决策 Transformer 三大亮点
这个处理多款游戏学习的 Transformer,采用了一个将强化学习(Reinforcement Learning,RL)问题视为条件序列建模的架构,它根据智能体和环境之间过去的互动以及预期收益,来指导智能体的下一步活动。
说到强化学习,其讨论的主要问题是:在训练过程中,一个面对复杂环境的智能体,如何通过在每个 Time Step 里感知当前状态和 Reward 来指导下一步动作,以最终最大化累计收益(Return)。

传统的深度 RL 智能体(如 DQN、SimPLe、Dreamer 等)会学习一个策略梯度(Policy Gradient),让高 Reward 的轨迹出现概率变大,低 Reward 的轨迹出现概率变小。
这就导致它出现一些问题:即需要手动定义一个信息量很大的标量值范围,包含针对于每个特定游戏的适当信息。这是个相当浩大的工程,而且拓展性较差。
为了解决这个问题,谷歌团队提出了一个新方法。
训练纳入数据更多样化
谷歌的这个新决策 Transformer,把从入门玩家到高级玩家的经验数据都映射到相应的收益量级(Return Magnitude)中。开发者们认为,这样可以让 AI 模型更全面地“了解”游戏,从而让其更稳定并提高其玩游戏的水平。
他们根据智能体在训练期间与环境的互动,建立了一个收益的大小分布模型。在这个智能体玩游戏时,只需添加一个优化偏差来提升高 Reward 出现的概率。
此外,为了在训练期间更全面地捕捉智能体与环境互动的时空模式,开发者还将输入的全局图像改成了像素块,这样模型就可以关注局部动态,以掌握游戏相关的更多细节信息。

△ 决策 Transformer 基本架构示意图
可视化智能体训练过程
此外,开发者们还别出心裁地将智能体的行为可视化。然后他们发现,这个多游戏决策智能体一直都在关注着包含关键环境特征等重要信息的区域,而且它还可以“一心多用”:即同时关注多个重点。

△ 红色越亮表示智能体对那块像素的关注度越高
这种多样化注意力分配也提高了模型的性能。
拓展性更好
如今规模已成为许多机器学习相关突破的重要驱动力之一,而规模拓展一般是通过增加 Transformer 模型中的参数数量来实现的。研究者发现,这个多游戏决策 Transformer 也是类似的:随着规模扩大,和其他模型相比,其性能提升显著。

Facebook 也在研究决策 Transformer
谷歌 AI 使用决策 Transformer 不仅提高了 AI 玩多个游戏的水平,还提升了多游戏智能体的扩展性。
除此之外,据谷歌大脑、加州大学伯克利分校和 Facebook AI Research 合作的一篇论文介绍,决策 Transformer 架构在强化学习研究平台 OpenAI Gym 和 Key-to-Door 任务上也表现出色。

或许决策 Transformer 正是通用人工智能(AGI)发展的关键因素之一。
对了,谷歌 AI 表示,相关代码和 Checkpoint 会在 GitHub 上陆续开源,感兴趣的小伙伴们可以去看看~
传送门:
https://github.com/google-research/google-research/tree/master/multi_game_dt
参考链接:
[1]https://twitter.com/GoogleAI/status/1550260410686644224
[2]https://ai.googleblog.com/2022/07/training-generalist-agents-with-multi.html
[3]https://arxiv.org/abs/2106.01345
[4]https://zhuanlan.zhihu.com/p/354618420
Epic 喜加二:《Arranger: A Role-Puzzling Adventure》《Trash Goblin》免费领
纯净之家 5 月 8 日最新消息,Epic 商城本周 “喜加二” 福利如期而至,即日起至 5 月 14 日,玩家可限时免费领取《Arranger: A Role-Puzzling Adventure》与《Trash Goblin》两款游戏,入库后可永久保留。
Epic 喜加一:《The Stone of Madness》免费领取
纯净之家 4 月 17 日最新消息,Epic 商城本周喜加一福利上线了,本周送出的游戏是《The Stone of Madness》(中文译名《疯狂之石》)领取时间为 4 月 16 日至 4 月 23 日,入库后永久保留。
Epic 喜加一:《道具相扑》免费领取
纯净之家 4 月 10 日最新消息,Epic 游戏商城每周都有免费游戏,本周送出的游戏是《道具相扑》,领取时间为 4 月 9 日至 4 月 16 日,玩家登录 Epic 账号即可 0 元入库、永久保留。下周送出的游戏是《疯狂之石》,4 月 16 日开始领取。
Epic 喜加二!《克隆机器人大乱斗》《TOMAK:拯救地球 重生》免费领
纯净之家 4 月 2 日最新消息,Epic 平台本周再度开启福利放送,喜加二重磅来袭!玩家可免费领取两款经典游戏 ——《克隆机器人大乱斗》与《TOMAK:拯救地球 重生》,无需额外付费。下周送出的游戏是《道具相扑》。
Epic 喜加一:《TOMAK : Save the Earth Regeneration》免费领取
纯净之家 4 月 2 日最新消息,Epic 平台本周喜加一正式更新,《TOMAK : Save the Earth Regeneration》现已开启限时免费领取。这款怀旧风格的养成游戏主打奇幻剧情与趣味互动玩法,玩家可直接在平台免费添加至游戏库,限时领取切勿错过。
Epic 喜加二!《大头菜小子抢银行》《遗忘国度之闲置冠军》免费领
纯净之家 3 月 6 日最新消息,Epic 本周喜加二福利准时上线,玩家可免费领取 《大头菜小子抢银行》与《遗忘国度之闲置冠军》两款风格各异的游戏。这两款游戏均支持中文,领取后永久入库,喜欢休闲与放置玩法的玩家不要错过。
微软 2026 年 Win11 游戏硬件指南发布!分档推荐更清晰
纯净之家 12 月 16 日最新消息,微软正式发布《Win11 游戏硬件优化指南》,为玩家量身打造 2026 年游戏 PC 的配置参考标准。这份指南以游戏分辨率为核心划分入门、中端、高端三个级别,详细列出了面向 2026 年的入门至高端游戏配置建议。
微软 11 月可选更新 KB5070311 修复任务栏崩溃与游戏卡顿
纯净之家 12 月 4 日最新消息,微软已为 Win11 用户推送 11 月可选更新 KB5070311。此次更新修复了任务栏及文件资源管理器崩溃、高分辨率显示器下游戏或应用启动时卡顿两大顽疾。
Epic 喜加一:手绘风格科幻冒险游戏《出售宇宙》免费领取
纯净之家 11 月 28 日最新消息,Epic 本周喜加一福利如期而至!手绘风格科幻冒险游戏《出售宇宙》开启限时免费领取,领取时间从 11 月 28 日 0 点持续至 12 月 5 日 0 点,玩家登录平台即可永久入库。另外,下周送出的是派对游戏《杰克盒子的派对游戏包 4》和像素风点击冒险游戏《黑暗侦探 》。
索尼公布PS5 Access控制器进一步信息,为无障碍游戏体验迈出一小步
【本站】05月20日消息,索尼在全球无障碍意识日之前透露了与PS5 Access控制器有关的进一步信息。这款控制器,早在今年1月份的莱昂纳多项目中首次公开亮相,现在终于揭开了更多神秘的面纱。这一消息使索尼迈出了迎头赶上微软的一小步,微软在2018年发布了Xbox
助力游戏无障碍,八位堂(8BitDo)确认参加第五届科技无障碍发展大会
第五届科技无障碍发展大会Technology Accessible Development Conference (以下简称TADC)将于5月29日在北京举行。科技无障碍发展大会是由深圳市信息无障碍研究会打造的信息无障碍行业年度高峰盛会,致力于关注行业发展、技术创新、成果分享、趋势研讨等多维度风向,促进
全新影驰RTX 4060/4060Ti系列显卡正式发布,DLSS 3为游戏提供超级动力
RTX 40家族再扩容,今天,NVIDIA正式公布了GeForce RTX 4060 Ti 8GB、GeForce RTX 4060 Ti 16GB和GeForce RTX 4060三款全新GPU。全新核心全新体验,为玩家开启升级换代之旅。NVIDIA RTX 4060 Ti和RTX 4060旨在为主流游戏玩家和创作者提供令人难以置信的1080p性能,首次
甜品狂潮,升级首选!耕升RTX 4060全系列GPU今日正式发布,DLSS 3为游戏提供超级动力
耕升 GeForce RTX 40系列一直以来作为高性能装机游玩和生产力开发的不二之选,现如今受到广大玩家的喜爱。作为NVIDIA 核心AIC 合作伙伴之一的耕升,此次也将在2023年5月18日21点整,给玩家发布多款耕升 GeForce RTX 40系列全新家族成员,其中包括:耕升 GeForce RTX 406
微软动视暴雪收购获欧盟委员会通过 游戏市场竞争前景激动人心
【本站】05月16日消息,微软对动视暴雪的大规模收购计划在欧洲迎来了一项重要进展。欧盟委员会已经批准了微软价值687亿美元的收购提议,并对该交易对游戏行业和竞争市场的影响进行了调查和评估。据本站了解,欧盟委员会表示,即使微软决定将动视暴
腾讯游戏发布《舞动极光》:创新体感健身产品震撼登场
【本站】5月16日消息,腾讯游戏年度发布会上,腾讯推出了其首款体感健身产品《舞动极光》,并开始接受预约。这款产品不需要额外的外部设备,只需一台智能电视和一部带摄像头的安卓手机(iOS版本正在开发中)即可使用。据本站了解,《舞动极光》为用户