2017CJ|阿里云九卿：硬件+人工智能的结合

4399手机游戏网讯，2017ChinaJoy将于7月27日至30日在上海新国际博览中心隆重举行，其同期会议——国际智能娱乐硬件展览会及会议(eSMART)也于7月27日在上海举行。此次大会以“同行十五载，共享泛娱乐”为主题，邀请并吸引了众多业内人士前来参与。会上，阿里云ET游戏大脑总架构师九卿先生发表了主题演讲。

2017ChinaJoy专题爆料>>>

阿里云

▍以下为演讲实录

九卿：大家上午好，我是九卿，现在我简单跟大家分享一下阿里云在游戏偏智能硬件，人工智能这块的一些技术和应用场景。其实，回到我们原始的一个出发点，阿尔法狗这块的理解，我是从2015年开始，他已经战胜了欧洲冠军，在我当时看来，这已经是一次突破性的飞跃了，其实从机器的视觉来看，欧洲冠军和世界冠军的差别不大。1997年的时候，是深蓝战胜卡斯特罗夫，当时的搜索空间相对来说比较有限，而且在一些评估网络说也是一些浅层的神经网络，当时主要是依赖于强计算的能力。而到2015年就不一样了，围棋的空间远大于国际象棋，在解决这个问题的时候，原来的传统方法就不可用了，需要一些新的学习能力，2017年的时候，他自学习的时候能力更强了，战胜了世界冠军。柯洁也输的不冤，这个机器的学习能力比柯洁的训练样本大的多。从原来的专家知识到现在的机器学习的迭代过程已经凸显了人工智能的能力。这个背后有一个问题，围棋和国际象棋都是有规则的，约定了赢或者不赢，阿尔法狗就是说，我今天的赢的概率多大，从人类的视角来说只赢了一半目，确定可以百分之百赢，这是不一样的判断趋势他也更稳定，不会说因为堵车带来影响不好带来的判断误差。今天其实有个问题，在确定性的规则下是这么一个玩法，如果不确定性的话我们怎么做，什么是不确定的场景，比如我今天走路，我今天做施工场地的施工，比如我今天打王者荣耀，我选哪五个英雄，选哪个地图，每个开局怎么开，这些都是不确定的，哪怕这五个人在有限的那个地图上，我们王者峡谷上，下一秒可能发生的动作都是不确定的，而且根据当时的环境，技能的冷却等等，各种方式判断。另外一个是模仿人类，机器人这部分，什么是走路，有些时候越简单的事情可能越复杂，比如走路开一个门的动作，对机器是非常困难的，我要走几步到那个门，我会不会遇到什么坎坷，这对人是自然的，对机器是很不自然的，你会知道这是一个机器，不是人。这是不确定的规则，类似其他的规则在我们生活当中，比如送外卖，这也是不确定性的，你点了哪家外卖，点了什么，什么时候送过来，送的过程中会不会遇到堵塞，到你的小区或者办公园区以后会遇到保安的阻拦等等，这都是不确定的，我们需要在这个不确定的随机中找到确定因素，辅助机器学习，做好下一步的判断。这里面的非结构化的数据和场景可以帮助我们，包括视觉计算、语音、文本处理，包括环境数据，还有运动控制，这些结合起来解决智能场景下的问题。

我们看一下阿里的能力，第一个是机器视觉，现在已经大量运用到一些领域，比如体育娱乐，打篮球的时候，说今天NBA一场比赛结束了，做什么，大家很快会发一篇资讯稿，这时候大部分已经写完了，就是把其中的一些数据填进去，这里面会解释一些问题，谁投篮了，命中率如何，这个里面我们解决的问题是一个人在旁边不断的看不断的数，我们现在通过机器可以知道什么是投篮动作，有没有成功，这是视频流当中对动作进行解析，标注出一些元素，降低在应用和解读资讯稿的成本。第二块是大量的图片识别和素材的标注，其实在我们游戏和娱乐这个领域，大量的是素材，对这些素材的采集和运用成本比较高，需要一些人工的标注，比如这是花，这是背景，这是贴图，我们需要从图象中识别出我们需要的人、物品，打说标签，这些标注的文本就是我们学习的样本，这个样本可以帮助我们做更多有趣的事情。当然你在找这些样本的过程中，你会遇到以图搜图，淘宝会有一个功能是拍立淘，我在商场看到一个比较好的，我想比价，我们拍一下上传，这个过程就是对色彩、材质、纹理等等特征进行检测和提取，进行一些相似和相关性的计算，找到推荐信息和结果呈现，目前我们用到了淘宝、拍立淘，还有人脸识别，还有一些交通场景。跟我们游戏相关的在这后面。

第一是虚拟场景的植入，我们打游戏，或者之前做谷歌的街景，这个街景是以前比较好的技术，这里面比较有意思的一点，我们可以在里面进行植入，比如你看到路边，比如上中国海外滩，可以把这个外滩的屏幕换为我们的广告或者视频，你可以场景化的植入。我在四年前的时候就已经做过这部分。其中会包含一些实际的扫描和建模的能力。还有一个是智能素材的生成，这个比较有意思，我们今天做游戏开发的时候，有几个步骤，第一个是买一个IP，第二个是搞一套游戏的引擎，第三是进行开发，第四是进行核心素材的一些设计，这个核心素材比如说我是哪几个BOSS或者是主要的NPC，以及主要的布景和地图，但是背后有大量的海量的普通的NPC，或者是一些普通的BOSS、角色，是需要进行市场上找外包公司设计的，这一部分设计的成本大概是2000块钱一天，一般的设计NPC需要两周左右，这部分会有大量的时间和财务成本的支出，今天我们能不能做一个事情，今天王者荣耀下面，能不能快速的量产，或者说批量的更有效率的开发一些我希望的英雄的皮肤，比如拿这个露娜来讲，我可以不断上新，而且上新不同的风格，我可能今天需要一个二次元的，可爱的露娜的皮肤，能不能给我一个样本，以前我需要大量图片的标注、检索、找素材，想什么是二次元的定义，这是一个二次元的杯子，那是一个二次元的三脚架等等，什么是二次元的衣服，我学习一下，对二次元定义的那些纹理、颜色，比如偏粉色，纹理是偏圆角，这些学习以后自主生成一套新的皮肤。

我们现在比较讨厌的是固定的语音答复和问题，我们已经在我们的淘宝的小秘，包括支付宝的一些应用中大量应用到这个技术，让你感觉不到这是一个机器在回答，我们也在尝试性的规避和测试这些问题，在90%的场景下我们可以用机器替代人，让你无感知的回答问题。其中有一个最关键的技术是上下文感知和多轮对话，我们围绕着上下文的主题构建整个的上下文的沟通场景，这个场景是说我能不能深挖你可能会说的话，这跟下围棋有点类似，下句话会让你愉悦，或者你回答上来的概率多大，这是我构建话题的概率，共同构建了一轮，而不是一句对话体系。第三个是传感和iOT的技术，我们和一些厂商合作，我们分析这样一个动作，是不是合理的游戏动作，或者作出更好的击打感，比如王者荣耀里面，有一些用起来不是很顺，因为没有流畅的肢体的设计，我们要的是击打感，或者是拟人化的场景，最重要的是这个体验，感同要身受。我们阿里云会做很多的传感器，在人体上进行布控，采集到这些信息，结合运动控制的理论和计算框架，判断这样的动作是否更合理，帮助我们在一些客户服务的时候，设计出更好的动作。当然里面会包括三个最关键的部分，反馈、调解和控制。

我简单总结一下对智能硬件未来发展的预测，很多时候有一个关键的数字是7，人均设备数基本上，能够管理起来的不会超过7个，我们认为这需要一个管理的统一入口，这个已经逐步出现了，比如一些智能音响，或者车载系统，都是一个统一的入口。第二个是软硬件分离，智能程度取决于算法，我们这对这块的理解，一句话，智能在端，智慧在云。第三块，用户使用的场景需要联动多款的硬件设备，这个地方，其实要涉及到一个关键性的因素，就是群供和协同，这也是呼应三天堑发布的国家人工智能发展规划，就是群控协同，如何协同多款智能硬件设备和装备，达到更好的运转状态。第三块，场景化的销售模式是未来智能硬件的销售场景，这个的是服务，而不是产品，或者是商品。

硬件+人工智能的结合，我们可以看到这么一个场景，这是“西部世界”，在那里面可以看到大量的材料制作出来的人，这些对人的设计是通过视觉、语音、文本这些，让他可以感受到意识的是机器学习，或者类似于阿尔法狗，我们不希望这些人可以感知到他们自己是谁，我们希望更好的融入游戏和体验感，场景感，这才是我们的目标，谢谢大家。

更多2017ChinaJoy专题爆料，尽在4399手机游戏网！

2017CJ|阿里云九卿：硬件+人工智能的结合

看过本文的用户还看过

关注4399手机游戏网公众号

人物观点

2017DEAS|刘天成：怎么构建更加真实的VR

2017DEAS|黄璜：基金对文化产业未来趋势的判断

2017DEAS|陈奕新：优格资本期待成为数字娱乐的生态投资者

2017DEAS|邓宇：当前时代是跨媒体内容的时代

深度分析

行业数据