身价4000万的汪仔火了后,我们来聊聊人工智能技术

  • 时间:
  • 浏览:0
  • 来源:大发快3_快3app官网_大发快3app官网

原标题:权威详解:《一站到底》里的AI汪仔,到底靠什么技术碾压人类

来源:量子位

春天来了,又到了人机交战的季节。

七年前的二月,IBM人工智能计算机Watson在答题节目《Jeopardy!(危险边缘)》中称王,击败了这俩 节目历史上最强大的两位人类高手。这俩 二月,搜狗人工智能机器人汪仔在答题节目《一站到底》中登场,击败了站到最后的人类选手。

在《jeopardy!》里,最强的人类选手最后不得不写下名句,俯首称臣;而在《一站到底》的赛场上,汪仔也表现出碾压般的优势。同样是答题节目,同样是人工智能,七年时间过去,现在的汪仔和当年的Watson,到底有何不同?

而号称历时9 个月,耗资1500 万打造的汪仔,身旁到底是什么核心技术,研发过程又有什么挑战?未来人工智能技术又会如可发展?

△ 图左为许静芳,图右为刘明荣

搜狗搜索技术负责人许静芳,以及搜狗搜索总监刘明荣,把上述种种什么的什么的问题的答案抽丝剥茧告诉量子位。下面是.我都 的权威详解:

汪仔和当年的Watson有什么不同?

1、输入措施不同

Watson是特殊接口文本输入,输入内容准确无误。

而《一站到底》是主持人念题加题板展示题目(本身来源总要逐字出题),汪仔通过搜狗的语音识别和图像识别技术,利用语音和图像本身措施获取,再转打上去文字。语音识别、图像识别总要AI的关键技术,一块儿识别的错误会进一步提升答题的难度。

2、题目设置不同

《jeopardy!》的题目有显示类别和相应的奖金数,类别对于答题有帮助,也能将答案限定在特定范围内。而《一站到底》中的题目这么给出类别,也能汪仔通过算法识别什么的什么的问题的类别,增大了答题的难度。

当然《jeopardy!》中题目的奖金不同,最后以获得的奖金数定输赢也带来了新的什么的什么的问题,这点是一站到底所这么的形态学 。

3、赛制不同

《jeopardy!》也能主持人把题目完整版念出后选手也能抢答,而《一站到底》是在现在开始念题后任意时间都也能抢答,答对所有人得分,答错对方加分。

某些在高水平的选手有少量的题目总要在题目尚未完整版时就作答,汪仔同样有很强的抢答,即根据题干片段去预测什么的什么的问题并作答的能力,这是Watson所不具备的能力。

4、知识获取措施不同

Watson是另另另一个封闭系统,不联网,利用其离线的知识库答题。而汪仔通过联网,对全网信息及搜狗知识图谱进行在线答题,在利用更大范围信息的一块儿也对答题下行速率 提出挑战。

5、某些

汪仔除了能回答知识什么的什么的问题,还有聊天功能,也能和主持人进行自然语言交流。

汪仔主要基于什么技术?

汪仔身旁核心技术主要包括:语音识别、OCR、自然语言理解、数据挖掘、信息检索、知识图谱和文本计算等,什么技术是当今人工智能领域最新发展的集中体现。

其中语音识别、OCR技术代表了机器学习和厚度学习的最高水平,自然语言理解是未来人工智能发展也能进一步防止的重要核心什么的什么的问题,代表了未来发展的重要趋势。

关于这套系统的架构,量子位还得到了一组图形化的说明。就列在下面(点击看大图)

有哪几个软件工程师支持汪仔?

长期投入的核心开发人员在十人左右,此外还有支持项目的各类工程师约十人。

量子位补充某些相关信息:搜狗CEO王小川此前透露,汪仔由搜狗和清华天工研究院联合开发,耗时9 个月,耗资1500 万。

研发过程中,最大的困难是什么?

《一站到底》有个非常特殊的规则:现在开始读题后,任哪天间都也能作答。

答对得分,答错对方加分。全都答题下行速率 非常关键,这里不仅仅是听到完整版题目能也能在极短时间内答题,更重要的什么的什么的问题是也能根据部分题目就预测什么的什么的问题并作答,实际上顶尖的人类选手也很大比例在题目不完整版情况汇报下答题。

答题下行速率 上.我都 做了两大类式情:第一是从接收到语音、图像现在开始,语音识别、图像识别、搜索、答案抽取这整个系统总要下行速率 上追求极致。在过去哪几个月里后台的防止下行速率 较刚现在开始提升了10 倍,无论是识别还是转打上去文字后的问答,在下行速率 上都做到极致。

第二类什么的什么的问题是推理,即根据部分信息预测什么的什么的问题并作答。.我都 根据学习历史上的题目,建立一套推理机制,使得机器人也能根据部分信息推理,类式 当前什么的什么的问题是“处于XXX的”,.我都 通过“处于”这俩 词就也能推导出什么的什么的问题答案是另另另一个“地理位置”。

又类式什么的什么的问题中提到了“千湖之国”,则很有由于答案是“芬兰”(芬兰的别称是千湖之国),什么的什么的问题中提到了“穆斯林的葬礼”,则很有由于是问其作者“霍达”,什么信息是.我都 基于海量知识文本分析挖掘、学习得到的。

目前汪仔回答题目的150%都能在题目不完整版时通过推理回答,较最初的版本有了质的飞跃。

汪仔和所有人工智能产品有何不同?

汪仔是一款自然语言问答类产品,产品功能定位决定它也能具备感知语音信号输入,并可进行认知推理的能力。

目前市面上的人工智能产品大多数仅具备感知能力,什么产品在特定领域也能辅助.我都 高效完成任务,比如语音识别类产品,也能帮助.我都 快速方便地输入文字,人脸识别类产品也能提供便捷准确的安防服务。具备认知能力的人工智能产品目前还比较少。

在自然语言理解领域,汪仔代表的智能问答就属于认知类产品,它除了具备识别人类语言文字原来的感知能力,还也能理解文字身旁的含义,也某些理解人的需求,在理解需求的基础上,进一步通过推理计算获得满足用户需求的精准答案。也某些说,汪仔拥有认知推理能力。

从问答和对话领域的人工智能产品来看,和汪仔产品形态学 相对比较接近的包括聊天机器人和智能客服两类当前比较热门的产品。其中聊天机器人主要向用户提供生活服务、娱乐资讯等,通常以逗乐用户、打发闲暇时间为主,无须能为用户防止实际什么的什么的问题。

和汪仔类式,目前某些公司提供的智能客服类产品,也属于智能问答产品,一块儿具备感知和认知能力,某些什么产品也能回答的什么的什么的问题领域非常有限,基本局限在与公司产品服务密切相关的什么的什么的问题,而汪仔是一款通用问答类产品,它也能回答各类知识什么的什么的问题,不受领域限制,某些它的受众面更加广泛,能力更强。

句子来说,汪仔是具备感知和认知推理能力的通用型知识问答类产品。

汪仔对搜狗AI未来发展有何影响?

人工智能未来的发展方向是认知智能,包括推理和决策能力,而智能问答是认知智能水平的重要体现,本身具有重要的产业价值和社会意义。

汪仔的成功表明搜狗在这方面具有较强的研发能力,具有里程碑意义。未来搜狗由于在智能问答领域加大投入,逐步提升自动回答各类自然语言什么的什么的问题的能力,成为代表智能问答领先水平的国内外知名人工智能公司。

“搜索的未来将走向问答机器人。用户的搜索行为会从输入另另另一个关键词,变成表达另另另一个完整版的句子,让机器找出其中的含义,一块儿,搜索引擎返回的内容,也将从简单的10 条链接转向直接给出答案由于是建议”,王小川曾多次在公开场合原来表示。

搜狗汪仔无疑是“问答机器人”这俩 理念的具象形态学 。其身旁的核心技术立知便是搜狗在智能问答领域的一项重要创举。 王小川曾表示,搜索未来向问答这俩 演进形式将对大众的习惯形成新的挑战,甚至引发重大的变革。

未来,.我都 我过多 再为了适应机器而刻意改变所有人的沟通措施,.我都 也能用更自然流畅的问答、交谈与机器进行互动,技术与人文关怀也能通过搜狗人工智能技术实现完美的均衡。

回看当年Watson

△ Watson在《jeopardy!》里获胜

Watson身旁是一套厚度问答(DeepQA)系统。问答系统一般包括另另另一个主要组成部分:什么的什么的问题分析、信息检索和答案抽取。

此前的媒体报道中,有过类式的示例:

面对什么的什么的问题:谁导演了《星球大战》?人类选手会根据知识积累,给出“卢卡斯”这俩 答案,但对于Watson,这俩 过程要比较复杂得多。

它会通过摄像头把这俩 什么的什么的问题“扫描”进大脑里。先分析这俩 问的是人,某些再细化到是一位导演。接着分析《星球大战》,会找到全都文章。它要定位某篇文章,其中把星球大战的导演那一段找出来,某些对这俩 段做厚度分析。

比如找到句子,这句话里说到这是某人在哪一年执导(direct)的,但这么提导演(director)这俩 词。实际上还也能找到全都类式的词,它就也能过滤,它先会找人名,比如斯皮尔伯格、卢卡斯等,什么总要潜在答案。

针对什么答案它要找相关的证据去支持。它会再把“星球大战”和“斯皮尔伯格”一块儿搜索,由于是和“卢卡斯”搜索,结果发现“星球大战”和“斯皮尔伯格”一块儿出現在同一篇文章中比较少,而“卢卡斯”比较多。

这某些Watson工作过程中的一部分。据介绍这套系统综合了1150 多种算法。在参与答题节目的过程中,当时的Watson会在3 秒内完成计算并给出答案。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户.我都 ,发现稿件处于不实报道,欢迎读者反馈、纠正、举报什么的什么的问题(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及由于处于的风险,任何后果均由读者自行承担。