媒体开放日,探秘百分点认知智能战略!

2009年7月1日,数据智能技术公司百分点正式成立,今年正好是第10个年头。

百分点公司新址

10年间,百分点经过多次转型,逐步形成了目前的企业级(To B)、政府级(To G)和SaaS服务三大业务体系,服务着国内、外上万家企业。2017年,百分点实现盈利,过去三年中保持着高质量、规模化增长。

10年间,百分点完成了5轮融资,总金额超过10亿元人民币,E轮融资的完成,意味着百分点数据智能头部企业地位的确立。

而这一切的背后,离不开技术硬核的支撑。作为技术型企业,百分点在技术上投入重资,并且坚持自主创新,一直走在技术和应用最前沿,拥有过百项大数据及人工智能领域软著与专利、国内最大的行业应用模型库及行业知识图谱库。

如果仔细研究百分点的产品和解决方案,除了大数据外,出现频率最高的一个词则是“认知智能”技术,可能很多人都知道人工智能,听过深度学习和神经网络,但 “认知智能”是个什么?百分点为何要重资投入这项技术,并且还上升到了技术战略层面,还为此成立了认知智能实验室?

近日,百分点成立十周年&乔迁新址媒体开放日活动在百分点公司数据智能展厅举办,这让笔者有机会一探百分点的认知智能战略。

智能进化三部曲:感知、认知、决策

百分点首席算法科学家苏海波

百分点首席算法科学家苏海波表示,人工智能有三个阶段,分别是感知智能、认知智能、决策智能。

目前,认知智能并没有标准化的定义,百分点认为,认知是对信息(尤其是语言)的认知,智能是指智能的分析和决策,具体是从海量的非结构化数据中挖掘出有价值的信息,洞察信息之间的关系,辅助用户进行分析和决策。目前感知方面的技术和应用都已经成熟,下一个十年是认知智能发展的黄金十年,百分点去年年底成立认知智能实验室也是为了把握这个重要的发展机遇,为客户提供业界领先的认知智能技术和产品服务。

感知智能三大里程碑

这些年,人工智能技术发展非常迅猛,但怎样让机器拥有人一样的智能,如何衡量机器的智能化水平呢? 拿感知智能来举例,就必须要提到感知智能技术领域的三大里程碑事件。

第一个里程碑,自然图像识别,2011年,当时的自然图像识别率还只能达到74.8%,而人对自然图像识别率可以达到95%,因此,当时技术来做这个事情是没法用的,但随着深度学习技术的出现,机器对自然图像的识别率超过了96%,也就是说,超越了人。

第二个里程碑,人脸识别,2013年,机器对人脸的识别率只能达到96.3%,而人对人脸的识别率可以达到99.1%,同样是因为深度学习技术,机器对人脸的识别超过了99.7%,也一举超过了人,这是第二个里程碑。

第三个里程碑,语音识别,到2016年底,微软、谷歌等公司都宣称其语音识别技术的错误率已经低于4%,而专业速记员的错误率是5.9%。

三大里程碑表明,机器在感知智能方面已经全面超越了人,我们看到,感知智能方面的应用也越来越普及,如火车站、酒店的人脸身份验证等。人工智能因此将从第一阶段感知智能,进入到第二阶段的认知智能。

认知智能的困境和方向

说完了感知,那么如何来衡量机器认知语言的智能化水平呢,这件事比感知的衡量要复杂很多,苏海波说。为此,他还举例子进行了说明,比如说,“某手机厂商2019年推出某款新手机,它没有广告宣传的好,在变焦拍照时需要支架支持”,这句话在人理解起来比较容易,很清楚的知道“它”指的是“某手机厂商”还是“手机”,但机器理解这句话却不容易。人类在读一句话时,会结合句子中每个词的常识和经验来理解整句话的含义,机器读到这句话只是接收了一系列符号,并不知道每个词背后的语义信息的,所以这就是为什么机器认知语言这么难,也没有像感知一样存在标准化的测试任务,能表明机器的感知水平是否超过了人类,目前只能用一系列的自然语言测试任务,从各个角度来刻画机器的认知语言水平。例如通过舆情分析来判断内容的整体情感、口碑分析识别出手机的防抖功能差、阅读理解回答句子中的“它”具体指的是什么……这些语言认知任务对于机器来说,一个比一个难,即使把这些问题解决了,也不能说明机器拥有人类一样的认知智能水平,所以目前很难给认知智能下一个具体量化的定义。

为了更好地理解认知智能,首先需要弄清楚,人类的认知是从哪里来的?

对于这个问题的研究,目前业界有三大流派:

第一个流派是符号主义,本质是实现人的思维和知识,该学派认为人类的知识和思维过程可以用某种符号来进行描述,核心是找到知识的符号表示和计算方式,知识图谱和专家系统就是符号主义的代表作。

第二个流派是连接主义,它把人的智能归结为人脑的高层活动的结果,强调智能活动是由大量简单的单元通过复杂的相互连接后并行运行的结果,其中人工神经网络和深度学习就是其典型代表性技术。

第三个流派是行为主义,源自于控制论,是一种基于“感知-行动”的行为智能模拟方法,它认为人类的智能是通过后天与环境不断的交互过程中学习得到的,强化学习和机器人是行为主义中的代表性技术。

对于这三个流派,每个流派都有对应的优点,但同样存在缺陷和不足,例如连接主义中的深度学习,达到了很好的预测精度,但是它缺乏可解释性,而且需要大量的标注样本,而符号主义则有良好的可解释性,行为主义则不需要标注样本,所以这三个流派中的单独任意一个流派都难以让机器达到人类的认知水平,未来最有可能的一条实现路线就是将这三个流派进行融合,目前业界大的技术方向也是按照这个路线在发展。

三类可行的融合

那么,这3个流派的技术该如何融合呢?苏海波表示,目前有如下几种典型融合方式。

第一种融合,深度学习+迁移学习;

深度学习需要依赖大量的标注样本,才能训练出好的结果。但在实际遇到的问题中,标注数据往往是不足的,而且标注工作的代价高,这时就可以把深度学习和迁移学习相融合,把领域A的知识迁移到领域B。比如百分点认知智能实验室研发的舆情情感分析系统,对比采用传统的深度学习模型,需要标注10000样本,才能达到80%左右的分类效果,但百分点采用了深度迁移学习,只需要1000个样本,就能达到80%左右的分类效果。

第二种融合,深度学习+知识图谱;

深度学习结合知识图谱代表着联接主义和符号主义流派的融合,它的基本思路是:从知识图谱中学习到知识表示,这些知识可以融入深度学习模型中,实现对自然语言的更好理解,这是深度学习模型与知识图谱不断互相促进的过程,如果知识图谱的规模越大、质量越高,就会有越来越好用的自然语言理解模型,它们是共同发展的,认知智能实验室在具体的实践方面,已经在探索实践如何将自然语言处理与快消零售、公安的知识图谱相结合,提高这两个领域的语言认知水平。在联接主义和符号主义流派的融合方面,还有目前特别热门的图神经网络,也就是GNN技术,它为深度学习模型赋予了一定的因果推理能力,弥补了深度学习模型的软肋。

第三种融合,深度学习+强化学习;

深度学习结合强化学习,代表着联接主义和行为主义流派的融合,深度学习和强化学习分别于2013年和2017年被《麻省理工学院科技评论》评选为十项突破性技术之一,它们的结合会在通向强人工智能的道路上发挥关键作用,AlphaGo就是深度学习结合强化学习技术的产物。

目前在智能对话中,深度学习结合强化学习被应用的比较多,通过用户模拟器和机器人对话,给出对话的反馈信号,通过深度学习模块进行意图识别和任务中的槽位信息提取,再通过强化学习模块对模拟器产生的大量样本进行模型训练。深度强化学习的优势在于无需标注样本,可以大大节省人工标注的人力投入,目前百分点认知智能实验室的自主研发的智能对话机器人产品也在重点研发该项技术。

认知智能的业务战略

百分点的认知智能业务战略可以用一句话来描述,基于NLP、知识图谱和智能交互等认知智能技术,辅助提升企业的市场化决策和政府的公共安全决策效率。在具体的认知智能应用产品上,百分点通过智能舆情分析系统和DeepQuest,帮助企业客户提高市场化决策水平,另外,通过DeepFinder和DeepInsight,帮忙政府公安客户提高公共安全决策水平。除此之外,百分点也推出了众多认知智能通用型产品,比如智能校对、机器翻译、智能对话机器人和智能商业分析系统等。

写在最后

以上,就是百分点为什么会在认知智能技术和产品上投入重资并上升到战略层面的原因。

据了解,虽然该实验室是2018年才成立,但目前已经有了不少具体的技术探索成果,例如深度迁移学习,深度强化学习,以及深度学习和知识图谱的融合等。

目前,百分点基于认知智能技术打造出的两款主打产品DeepQuest、DeepFinder,目前正在不少客户中落地,DeepQuest今年已经发布2.0版本,荣获“2019星河奖·优秀大数据产品奖”。DeepFinder荣获 “2017-2018中国人工智能市场年度创新产品”,百分点去年底发布了DeepFinder 2.0,今年升级到3.0版本。

Image placeholder
Kong_Go
未设置
  48人点赞

没有讨论,发表一下自己的看法吧

推荐文章
百分点万亿级大数据平台的建设实践

从互联网、移动互联网到物联网,数据量之巨大已突破想象边界。与此同时,实时数据分析的需求日益增长,那么,当数据量达到亿级、百亿级甚至万亿级规模,实时数据分析如何来做?尤其在ToB/G来说,大多数企业和政

华为云存储All-Flash战略打造全新智能数据底座

华为全球产业展望报告显示,全球年数据增量将从2018年的32.5ZB快速增长到2025年的180ZB,但目前企业数据利用率只有10%,数据价值没有得到充分释放。面对海量数据爆炸式的增长和发掘数据内在价

耗时6年生成代码1.6亿行,农业银行大数据平台打造攻略!

摘要: 耗时6年,135个项目,8000页需求,累计投入11000多人月,生成的代码行1.6亿行,支持了8大业务领域,33条业务线,120多个应用场景,这就是中国农业银行大数据平台。近日,中国人民银行

走近科学,探究阿里闲鱼团队通过数据提升Flutter体验的真相

背景闲鱼客户端的Flutter页面已经服务上亿级用户,因此用户体验尤其重要,完善Flutter性能稳定性监控体系,以便及早发现线上性能问题,也可以作为用户体验提升的衡量标准。那么Flutter的性能到

Google 21 岁生日,一文回顾 Google 发展史

9月27日,谷歌在Google搜索引擎首页庆祝自己21岁生日。 在涂鸦存档上,谷歌发布了一封庆祝信: 21年前,两位斯坦福大学博士生谢尔盖·布林和拉里·佩奇发表了一篇有关启动“大型搜索引擎”原

探秘K1 Power:如何打造一台坚若磐石的高性能小型机?

熟悉服务器领域的朋友,必然对浪潮K1小型机或多或少有所了解。在当年关键业务主机市场寡头垄断的格局下,浪潮400多位工程师耗费4年时间,于2010年成功研制出了K1小型机,为市场注入一股新的血液。使得中

探秘苏宁金融升级版秒杀系统

红包系统的技术挑战红包,升级版的秒杀系统,红包系统应当具备秒杀系统所具备的特性。大量用户抢红包带来了系统的高并发压力;大量用户抢同一红包带来了数据一致性问题:红包不能超发,漏发,重复发;而由于红包涉及

欧洲最大MySQL用户之一,Booking.com数据库构架探秘!

吴鑫Booking.com数据库工程师TeamLead2015年加入总部位于阿姆斯特丹的Booking.com数据团队,现任数据库工程师团队负责人,主要是负责Booking.com里MySQL相关的运

探秘ASC19:首次设置的“超级团队对抗赛”究竟是什么?

4月21日,2019ASC世界大学生超级计算机竞赛(ASC19)总决赛在大连理工大学正式拉开帷幕。根据赛程,在4月23日正式竞赛之前,所有参赛队伍的主要任务是完成竞赛系统的搭建与调试,力求在3000瓦

Java字节码增强探秘

大家好,美美今天给大家推荐一篇Java字节码增强技术的文章,在实际工作中有很多应用场景。美团点评技术团队平日积累了很多这类技术原理解析和实战类的文章,未来我们会选取精华,陆续发布,敬请期待。1.字节码

MongoDB与阿里云达成战略合作,云将是数据库最佳载体

摘要:开源数据库厂商与云服务供应商两大阵营之间存在争议是事实,MongoDB与阿里云达成战略合作,背后意味着什么?对MongoDB,对阿里云分别意味着什么?对整个数据库产业又意味着什么?MongoDB

Gartner:2020年十大战略技术趋势

技术变革的步伐正在迅速加快,IT专业人员需要研究的因素,他们以前从未处理过的事情(例如超级自动化、多重体验和人员扩充)都将对企业产生重大的影响。Gartner高级研究副总裁ValSribar说:“自从

软件定义IT基础架构,如何看待深信服的产品战略布局?

在很多人的潜意识里,深信服是一家令人尊敬的企业,技术支撑能力强,产品种类多,功能全面,后劲足,是少数能和华为、新华三同台竞技的企业之一。但有时候,深信服也会被这些优势所累,比如经常会被问道:你们和华为

SACC2019:爱奇艺的大数据中台战略(附演讲实录)

  孙斌爱奇艺高级总监主要负责爱奇艺的大数据中台、商业智能、内容智能制作等业务。在互联网产品设计和研发方面有十多年经验,曾就职于微软、hulu、雅虎等公司。摘要:爱奇艺的业务已经从单一的视频业务发展为

​中台战略:业务中台的8个设计原则

业务中台是一个充满生命力的个体,它承载业务逻辑、沉淀业务数据、产生业务价值,并随着业务不断发展进化。它的设计遵循如下图所示的8个原则。业务中台设计的8大原则01 服务松耦合原则(1)面向接口实现这是服

中信银行信用卡业务数据库实现国产替换,湖北银行新核心系统项目正式验收,阿里云与MongoDB达成战略合作

中信银行信用卡业务数据库实现国产替换10月31日,由IT168旗下ChinaUnix社区主办的第十一届中国系统架构师大会(SACC2019)在北京召开。会上,中信银行软件开发中心/技术平台开发处副处长

如何理解腾讯云数据库战略升级?

近日,腾讯云数据库在京正式启动战略升级,宣布未来将聚焦云原生、自治、超融合三大战略方向,以用户为中心,联接未来。并在现场面向全球用户同步发布五大战略级新品,包括数据库智能管家DBbrain、云数据库T

社交媒体登录认证提供者大全 —— Socialite Providers,支持微博、微信、QQ等

社交媒体登录认证提供者大全——SocialiteProviders,支持微博、微信、QQ等 1、简介 SocialiteProviders是一个扩展自LaravelSocialite的OAuth1&

Ubuntu 中使用 Nginx+rtmp 搭建流媒体直播服务.md

一、背景本篇文章是继上一篇文章《Ubuntu中使用Nginx+rtmp模块搭建流媒体视频点播服务》文章而写,在上一篇文章中我们搭建了一个点播服务器,在此基础上我们再搭建一个直播服务器,二、配置rtmp

“小应用”背后的“大改变” 爱奇艺赋能流媒体播放服务

热门视频里,“弹幕盖脸”几乎是必然事件,然而有一个地方看视频,你会发现密密麻麻的弹幕都绕开主角飘过,这个地方就是爱奇艺。对于大家观看视频时喜闻乐见的弹幕,爱奇艺提供了蒙版弹幕服务,可以让用户实现“弹幕

css Media媒体查询深入介绍

媒介类型在CSS2中,媒体查询只使用于和标签中,以media属性存在media属性用于为不同的媒介类型规定不同的样式screen计算机屏幕(默认值)tty电传打字机以及使用等宽字符网格的类似媒介tv电

RTSP、RTMP网络摄像头互联网无插件直播视频流媒体服务器EasyNVR在windows上无法启动问题排查

背景需求随着雪亮工程、明厨亮灶、手机看店、智慧幼儿园监控等行业开始将传统的安防摄像头进行互联网、微信直播,我们知道摄像头直播的春天了。将安防摄像头或NVR上的视频流转成互联网直播常用的RTSP、RTM

安防摄像头网页无插件直播流媒体服务器EasyNVR在IE浏览器下的 pointer-events- none前端兼容性调试

背景说明由于互联网的飞速发展,传统安防摄像头的视频监控直播与互联网直播相结合是大势所趋。传统安防的直播大多在一个局域网内,在播放的客户端上也是有所限制,一般都需要OCXWeb插件进行直播。对于安防监控

视频流媒体服务器对接宇视摄像机OCX插件出现error code 14001错误分析

背景需求随着雪亮工程、明厨亮灶、手机看店、智慧幼儿园监控等行业开始将传统的安防摄像头进行互联网、微信直播,我们知道摄像头直播的春天了。将安防摄像头或NVR上的视频流转成互联网直播常用的RTMP、HTT

RTSP-ONVIF协议安防视频监控流媒体服务解决方案EasyNVR在Windows重启时提示“进程意外终止”问题解析

什么是ONVIFOpenNetworkVideoInterfaceForum,开放型网络视频接口论坛,以公开、开放的原则共同制定开放性行业标准。是一个提供开放网络视频接口的论坛组织。ONVIF规范描述