索尼公布PS5 Access控制器进一步信息,为无障碍游戏体验迈出一小步
【本站】05月20日消息,索尼在全球无障碍意识日之前透露了与PS5 Access控制器有关的进一步信息。这款控制器,早在今年1月份的莱昂纳多项目中首次公开亮相,现在终于揭开了更多神秘的面纱。这一消息使索尼迈出了迎头赶上微软的一小步,微软在2018年发布了Xbox
更新日期:2022-07-23
来源:纯净之家
谷歌 AI 宣布,在多任务学习上取得了巨大进展:他们搞出一个会玩 41 款雅达利游戏的 AI,而且采用的新训练方法比起其他算法,训练效率大大提升!

此前会玩星际争霸的 CherryPi 和火出圈的 AlphaGo 都属于单游戏智能体(Agent),也就是说,一个 AI 只会玩一种游戏。多游戏智能体这边,现有的训练算法屈指可数:主要包括时间差分学习算法(Temporal Difference Learning,TD)和行为克隆(Behavioral Cloning,BC)等。
不过为了让一个智能体同时学会玩多款游戏,之前的这些方法的训练过程都很漫长。
现在,谷歌采用了一个新决策 Transformer 架构来训练智能体,能够在少量的新游戏数据上迅速进行微调,使训练速度变得更快,而且训练效果也是杠杠的 —— 该多游戏智能体玩 41 款游戏的表现综合得分,是 DQN 等其他多游戏智能体的 2 倍左右,甚至可以和只在单个游戏上训练的智能体媲美。

△ 100% 表示每款游戏的人类平均水平,灰色条代表单游戏智能体,蓝色条代表多游戏智能体
下面就来看看这个性能优秀的多游戏智能体。
新决策 Transformer 三大亮点
这个处理多款游戏学习的 Transformer,采用了一个将强化学习(Reinforcement Learning,RL)问题视为条件序列建模的架构,它根据智能体和环境之间过去的互动以及预期收益,来指导智能体的下一步活动。
说到强化学习,其讨论的主要问题是:在训练过程中,一个面对复杂环境的智能体,如何通过在每个 Time Step 里感知当前状态和 Reward 来指导下一步动作,以最终最大化累计收益(Return)。

传统的深度 RL 智能体(如 DQN、SimPLe、Dreamer 等)会学习一个策略梯度(Policy Gradient),让高 Reward 的轨迹出现概率变大,低 Reward 的轨迹出现概率变小。
这就导致它出现一些问题:即需要手动定义一个信息量很大的标量值范围,包含针对于每个特定游戏的适当信息。这是个相当浩大的工程,而且拓展性较差。
为了解决这个问题,谷歌团队提出了一个新方法。
训练纳入数据更多样化
谷歌的这个新决策 Transformer,把从入门玩家到高级玩家的经验数据都映射到相应的收益量级(Return Magnitude)中。开发者们认为,这样可以让 AI 模型更全面地“了解”游戏,从而让其更稳定并提高其玩游戏的水平。
他们根据智能体在训练期间与环境的互动,建立了一个收益的大小分布模型。在这个智能体玩游戏时,只需添加一个优化偏差来提升高 Reward 出现的概率。
此外,为了在训练期间更全面地捕捉智能体与环境互动的时空模式,开发者还将输入的全局图像改成了像素块,这样模型就可以关注局部动态,以掌握游戏相关的更多细节信息。

△ 决策 Transformer 基本架构示意图
可视化智能体训练过程
此外,开发者们还别出心裁地将智能体的行为可视化。然后他们发现,这个多游戏决策智能体一直都在关注着包含关键环境特征等重要信息的区域,而且它还可以“一心多用”:即同时关注多个重点。

△ 红色越亮表示智能体对那块像素的关注度越高
这种多样化注意力分配也提高了模型的性能。
拓展性更好
如今规模已成为许多机器学习相关突破的重要驱动力之一,而规模拓展一般是通过增加 Transformer 模型中的参数数量来实现的。研究者发现,这个多游戏决策 Transformer 也是类似的:随着规模扩大,和其他模型相比,其性能提升显著。

Facebook 也在研究决策 Transformer
谷歌 AI 使用决策 Transformer 不仅提高了 AI 玩多个游戏的水平,还提升了多游戏智能体的扩展性。
除此之外,据谷歌大脑、加州大学伯克利分校和 Facebook AI Research 合作的一篇论文介绍,决策 Transformer 架构在强化学习研究平台 OpenAI Gym 和 Key-to-Door 任务上也表现出色。

或许决策 Transformer 正是通用人工智能(AGI)发展的关键因素之一。
对了,谷歌 AI 表示,相关代码和 Checkpoint 会在 GitHub 上陆续开源,感兴趣的小伙伴们可以去看看~
传送门:
https://github.com/google-research/google-research/tree/master/multi_game_dt
参考链接:
[1]https://twitter.com/GoogleAI/status/1550260410686644224
[2]https://ai.googleblog.com/2022/07/training-generalist-agents-with-multi.html
[3]https://arxiv.org/abs/2106.01345
[4]https://zhuanlan.zhihu.com/p/354618420
索尼公布PS5 Access控制器进一步信息,为无障碍游戏体验迈出一小步
【本站】05月20日消息,索尼在全球无障碍意识日之前透露了与PS5 Access控制器有关的进一步信息。这款控制器,早在今年1月份的莱昂纳多项目中首次公开亮相,现在终于揭开了更多神秘的面纱。这一消息使索尼迈出了迎头赶上微软的一小步,微软在2018年发布了Xbox
助力游戏无障碍,八位堂(8BitDo)确认参加第五届科技无障碍发展大会
第五届科技无障碍发展大会Technology Accessible Development Conference (以下简称TADC)将于5月29日在北京举行。科技无障碍发展大会是由深圳市信息无障碍研究会打造的信息无障碍行业年度高峰盛会,致力于关注行业发展、技术创新、成果分享、趋势研讨等多维度风向,促进
全新影驰RTX 4060/4060Ti系列显卡正式发布,DLSS 3为游戏提供超级动力
RTX 40家族再扩容,今天,NVIDIA正式公布了GeForce RTX 4060 Ti 8GB、GeForce RTX 4060 Ti 16GB和GeForce RTX 4060三款全新GPU。全新核心全新体验,为玩家开启升级换代之旅。NVIDIA RTX 4060 Ti和RTX 4060旨在为主流游戏玩家和创作者提供令人难以置信的1080p性能,首次
甜品狂潮,升级首选!耕升RTX 4060全系列GPU今日正式发布,DLSS 3为游戏提供超级动力
耕升 GeForce RTX 40系列一直以来作为高性能装机游玩和生产力开发的不二之选,现如今受到广大玩家的喜爱。作为NVIDIA 核心AIC 合作伙伴之一的耕升,此次也将在2023年5月18日21点整,给玩家发布多款耕升 GeForce RTX 40系列全新家族成员,其中包括:耕升 GeForce RTX 406
微软动视暴雪收购获欧盟委员会通过 游戏市场竞争前景激动人心
【本站】05月16日消息,微软对动视暴雪的大规模收购计划在欧洲迎来了一项重要进展。欧盟委员会已经批准了微软价值687亿美元的收购提议,并对该交易对游戏行业和竞争市场的影响进行了调查和评估。据本站了解,欧盟委员会表示,即使微软决定将动视暴
腾讯游戏发布《舞动极光》:创新体感健身产品震撼登场
【本站】5月16日消息,腾讯游戏年度发布会上,腾讯推出了其首款体感健身产品《舞动极光》,并开始接受预约。这款产品不需要额外的外部设备,只需一台智能电视和一部带摄像头的安卓手机(iOS版本正在开发中)即可使用。据本站了解,《舞动极光》为用户
游戏改编电影《超级马力欧兄弟大电影》:打破票房记录的冒险之旅
【本站】05月15日消息,《超级马力欧兄弟大电影》在全球范围内的票房成绩持续攀升,已经突破12.1亿美元大关。这部由照明娱乐公司与任天堂共同制作的电影成为有史以来票房第四高的动画电影,仅次于《冰雪奇缘2》、《冰雪奇缘》和《超人总动员2》,也成为了游戏
硬实力+高颜值,华硕天选X2023玩出自我游戏态度
随着各类网络游戏的盛行,电竞玩家的精神需求不断提升,游戏账号、游戏皮肤、电竞装备等,让不少玩家为之心动买单。尤其是对电竞主机的需求,更是占据玩家心中的C位。要想畅快玩游戏,首先就是要拥有一台好用、稳定且高颜值的电脑。对此,全新华硕天选X 2023高性能台式
6K档买140W满血功耗RTX4060游戏本?吾空山灵K7 S63可以!
近日,吾空推出了一款极具性价比的17.3英寸40系大屏游戏本——山灵 K7 S63,搭载140W满血功耗RTX4060,支持独显直连,预售活动价低至6499元。吾空山灵 K7 S63配备一块17.3英寸高规格电竞屏,拥有2.5K分辨率和165Hz高刷新率,有效降低残影和图像撕裂,动态画面丝滑流畅,
高通推出骁龙GSR技术,手机游戏画质提升至4K
【本站】4月27日消息,手机游戏的高画质和流畅性能一直是用户所追求的,近日,高通推出了骁龙GSR(Snapdragon Game Super Resolution骁龙超分辨率技术),不仅可以让游戏从1080p变成4K游戏,还能将游戏性能翻倍提升。骁龙GSR超分辨率技术是由高通内部的骁龙游戏
13代酷睿HX处理器游戏本7999元开卖:吾空山灵K7 PLUS电竞版上新
吾空笔记本【山灵K7 PLUS】继推出了搭载英特尔13代酷睿i9-13900HX的旗舰版之后,又马不停蹄的推出了更适合游戏玩家的电竞版,搭载13代i5-13500HX处理器和RTX 4060独显。屏幕使用的是17.3英寸2.5K 165Hz的高刷电竞屏,再加上100%sRGB广色域,画面观感高清,游戏画面亦是
2023年游戏投影仪怎么选?4000元左右首选当贝D5X Pro
马上就是五一小长假了,与其在外面人挤人,不如宅家用投影仪大屏玩游戏。毕竟相比手机、电脑或者电视来说,投影仪画面更大,玩游戏更沉浸,而且漫反射成像对眼睛的伤害也比较小。那么,2023年游戏投影仪该怎么选?预算4000元左右,哪款游戏投影仪值得买?下面就一起来看
强悍散热能力 让游戏畅快运行 雷神冰翼散热背夹全新推出
【本站】4月25日消息,雷神冰翼散热背夹全新上市,手游玩家的神器冷静开黑售价仅为129元。据介绍,该散热背夹采用星际蓝纳米图层喷涂,耐磨且不怕污渍。同时,独特风道设计和20W高功TEC制冷晶片以及9叶高速风扇,能够提供强悍的散热能力,让游戏畅快运行。为
重磅来袭!拯救者Y7000P 2023游戏本细节曝光,下周一发布
【本站】4月23日消息,联想将于下周一推出拯救者 Y7000P 2023 游戏本,该款游戏本搭载 i5-13500H 或 i7-13700H 处理器,配备 RTX 4050 或 RTX 4060 显卡,可提供强大的性能表现。据官方预览图显示,该款游戏本还拥有 16 英寸 16:10 屏幕,2.5K 分辨率,165Hz
米哈游新作《崩坏:星穹铁道》公测即将开启,游戏继承崩坏IP经典元素!
【本站】4月23日消息,米哈游新作《崩坏:星穹铁道》预下载现已开启,1.0 版本「通往群星的轨道」将于4月26日10:00登陆PC和手机平台开启公测。据报道,《崩坏:星穹铁道》全平台预约超过2000万,海外预约量突破1000万。这款游戏继承了经典的崩坏IP,拥有庞大