2019年度总结:支付宝为何多次亮相各大国际顶会

2019年,是人工智能与机器学习技术快速发展的一年。对于蚂蚁金服而言,过去一年的人工智能技术、产品、解决方案及研究成果已经在 NeurIPS、KDD、ICML、SIGMOD、SIGIR 等各大国际顶会上陆续亮相,为学界带来了诸多来自实际业务场景的创新研究和应用分享。

正如《哈佛商业评论》2020一月刊里文章提到:蚂蚁金服所服务的客户数量是美国最大银行的10倍多,员工数量却不到其十分之一。不同于传统金融机构,蚂蚁金服所提供的消费信贷、货币基金、财富管理、医疗保险、信用评级,甚至是蚂蚁森林等各种各样的服务,其关键路径均是“无人工”的模式,从而使得业务能够实现快速增长与突破,而这主要得益于背后的人工智能技术与海量的支付宝数据,“AI runs the show”。

紧抓核心技术能力 持续沉淀基础研究应用成果

在人工智能领域,过去一年蚂蚁金服相继在 NeurIPS、ICML、ICLR、AAAI、IJCAI、SIGIR、NAACL、VLDB、ACM T-IST、KDD、CVPR 等全球顶级学术会议和期刊发表多篇论文成果,涵盖计算机视觉、NLP、机器学习等领域,并在大型分布式机器学习、强化学习、图机器学习、无监督学习、数据挖掘等方向均取得突破,这些技术在解决金融场景复杂动态网络、对抗性、鲁棒性、安全性、外部性风险与信息不完备性、实时性等问题上均发挥了重要作用。

比如在2019年6月的 ICML 会议(International Conference on Machine Learning,即国际机器学习大会)上,支付宝AI技术团队即贡献了多篇前沿论文研究成果。包括提出了用生成对抗用户模型来解决强化学习小样本的问题,并将此方法用于优化推荐系统;提出粒子流贝叶斯定理(particle flow Bayes'Rule)算法,实现对高维贝叶斯推理的精确度和计算效率的提升优化等等。

在支付宝业务资金链路和运力优化等场景会涉及组合优化和整数规划问题,车辆路径规划作为该类问题的经典场景,支付宝AI团队提出一套新的 CVRP 算法进行求解(ICLR2020),能够有效发挥机器学习和传统运筹优化各自长处,对比 Google OR-tools提升了10%,并优于 FAIR,Google 以及各种AI顶会的结果。

为了提升AI模型在金融业务场景的安全性和鲁棒性,支付宝AI团队通过深度对抗学习等相关技术打造了体系化的解决方案。例如借助于动态网络中可解释的分层信道选择,显式地将网络决策路径可视化,并提出了一种对抗性实例检测算法(AAAI 2019),该方法能够获得更高的预测精度,并显著提高多个攻击的检测率。而面对支付金融场景对模型鲁棒性的要求,首创了三种可显著降低一些图神经网络模型效果的攻击手段(ICML 2018):基于层次强化学习的攻击、基于遗传算法的攻击和基于梯度的攻击。并提出针对性的对抗训练方法,从而提升模型的鲁棒性和安全性。

同时,为了更高效提取特征,支付宝AI团队开发了 SAFE: Scalable Automatic Feature Engineering Framework for Industrial Tasks (ICDE 2020),从而满足金融场景下对高适用性、分布式计算与实时推理的强需求。

由于金融市场天然具备的外部性风险与信息不完备性,蚂蚁金服在博弈论与多智能体等前沿技术上也在持续投入研究与应用探索。包括提出了 Double Neural Counterfactual Regret Minimization 计算框架(ICLR 2020,以第一单位论文发表),使得CFR可求解超大规模非完全信息博弈IIG问题,同时提出了 mini-batch robust sampling 算法,使得 Monte Carlo CFR 算法收敛速度大幅提升,在双人非限制性德州扑克游戏中,该算法可以收敛到与传统 CFR 算法相似的结果,而存储空间却不到其200分之一;另外还提出了一种比 Discounted CFR 更快收敛的CFR算法,在非限制性德州扑克中,该算法比 DeepStack 中的 Hybrid CFR 算法收敛速度快两倍。

金融市场通常面临复杂动态网络里的多智能体问题,蚂蚁金服创新性提出 value propagation 算法用以解决多智能体问题。具体而言,该算法去中心化训练和去中心化执行场景中 multi-agent reinforcement learning 的值函数传播问题。该方法可用于解决目前多智能体问题面临的诸多挑战:比如多个 agent 如何在只观测到自己奖励函数的情况下学会合作,以及 multi-agent reinforcement learning 算法的收敛性等。在资金优化和交通控制等业务场景中该算法有着广阔的应用场景。

深度学习面临的一大挑战是如何在理解的基础上做推理。在 NLP 里的推理问题上,近日蚂蚁金服的一项工作超越其他科技公司登顶数字离散推理 DROP 榜单。DROP 与传统 MRC 数据集的主要区别在于需要根据问题和上下文做数字逻辑推理才能得出正确答案。主要方法是通过构建数字、日期等常识符号图谱,并基于 GCN 建图,使用 Hard-EM 算法对推理表达式的隐变量进行迭代学习。此外,如何处理海量信息、提升服务效率也已成为国际顶会重点关注话题,在展示信息检索领域 SIGIR 2019 顶会上,支付宝AI团队提出利用强化学习预测用户意图,实现“未问先答”的功能。

这些智能服务背后,少不了蚂蚁金服自主研发的金融级分布式关系数据库 OceanBase 的支撑。在2019年最新发布的 TPC-C 测试排行榜中,OceanBase 超越 Oracle 荣登榜首。目前,除了支持蚂蚁金服自有业务、阿里巴巴集团双十一的流量考验以外,还支持着数十家金融机构的业务。

可以说,国际顶会上诸多基础研究与应用创新成果分享,让蚂蚁金服成为全球学界和工业界不可忽视的力量。而基于蚂蚁金服十五年演进并全面对外开放的“BASIC”技术体系,更多基础研究应用成果因为也将逐渐在产业应用中落地。

提高AI落地服务水平 以技术创新推动普惠金融

实际上,顶级学术会议交流的火热,一方面可推进基础技术最前沿研究的发展,将学术研究与应用相结合,另一方面可推进前沿技术在实际应用中落地,为用户带来价值。正如此前蚂蚁金服副总裁及首席AI科学家漆远所表示的,“发展和使用人工智能技术,我们能够为蚂蚁金服全球超过12亿的用户解决真正的问题,提供真正有意义的服务。”

比如早在2005年,支付宝便率先推出“你敢付,我敢赔”,承诺如果账户被盗全额赔付。2019年,支付宝又将其升级为“秒赔”+“先赔”:用户的投诉如果经AI确定,赔付能秒到账;如果案件存疑,也会先赔再说。在此背后,正是支付宝安全团队在 KDD CUP 2019 大赛上获得全球第一的AI应用能力。

基于丰富的人工智能技术应用场景,目前蚂蚁金服已经沉淀了业界领先的分布式机器学习平台支持大规模深度图算法、在线学习、共享学习、强化学习等能力,以及金融视觉、金融知识图谱、机器人平台、NLP平台等通用能力。

以大规模深度图算法的应用实践为例,面对金融场景可解释性的要求,蚂蚁金服在 AAAI 2019 的多篇论文中介绍了如何在图机器学习过程中引入了 attention 机制来学习不同广度/深度邻居的重要性,以及异质信息的重要性。这些算法不仅为不同类型图数据提供更强大的表达学习能力,同时也提供不同层次的可解释性,目前已应用于智能营销、信用风险、安全风控等多个支付金融场景,极大降低了产品运营成本和欺诈资损从而提高业务收入。

而在2019年关于机器学习和计算神经科学的国际会议——NeurIPS(全称神经信息处理系统大会)上,蚂蚁金服也有多篇论文入选,聚焦 GAN、GNN、深度强化学习等课题。在 NeurIPS 2019 展台现场还展出了基于图像识别、环保知识图谱等技术的智能垃圾分类小程序和智能回收箱视频,观众可通过手机拍照轻松识别垃圾物品和对应的垃圾类别,现场体验来自东方的“生活小助手”。目前,这套图像识别技术已逐步开放给行业伙伴。利用支付宝的海量用户覆盖能力和城市服务的便民心智,结合 AI+IoT 技术,实现人工智能识别垃圾和分类,用科技推动个人与企业单位参与垃圾分类回收的积极性和处理效能。

此外,蚂蚁金服在声纹技术方面部分工作发表在国际语音顶会 IEEE ASRU 2019。在获得同行评审专家的高度认可的同时,该创新技术已经在支付宝 APP 无线端声纹业务落地,有效提高了安全性和用户体验。

随着研究发展、顶会的大热,AI、区块链、计算系统等原本看起来“只可远观”的技术已不断获得突破,实实在在地为我们的生活服务带来改变。2019年已经翻篇,蚂蚁金服AI研究的步伐也逐渐加快,AI技术落地服务水平迅速提高,通过技术创新和科技开放更好地推动普惠金融发展,带来更加美好的智能生活。

Image placeholder
belmmet
未设置
  73人点赞

没有讨论,发表一下自己的看法吧

推荐文章
多次问鼎 NuerIPS、MRQA 等国际顶级比赛,百度 NLP 技术到底有多强?

人工智能技术的发展尤其是深度学习技术的成功运用,推动自然语言处理(NLP)进入了高速发展阶段。NLP目前也是应用范围最广的人工智能技术之一,已在智能搜索、智能客服、智能助手、智能推荐等方面得到了大规模

2019年度IT168技术卓越奖名单:网络安全类

临近岁末,又要到和一年说再见的时候了。对于网络安全领域来讲,即将成为过去的2019年是网络安全市场快速增长的一年。有数据显示,“十三五”以来我国网络安全产业保持了高速增长,2019年产业规模预计超过6

2019年度IT168技术卓越奖名单:数据中心类

光阴如梭,一年的工作转瞬又将成为历史,2019年即将过去,崭新的2020年即将来临。新的一年意味着新的起点新的机遇新的挑战,众多企业“决心再接再厉,更上一层楼”,努力打开新局面。作为读者们的老朋友,2

2019年度IT168技术卓越奖名单:数据库类

岁末年关,一年一度的IT168技术卓越奖评选如约而至。在数据智能时代,数据是生产资料是富含价值的新石油,海量数据的并发以及实时性要求,对于向下攫取硬件性能向上承载应用的数据库而言是挑战更是机遇,国内数

2019年度IT168技术卓越奖名单:大数据类

随着对数据价值的不断挖掘,以及全球各地区政府的政策支持,大数据市场呈现出一片欣欣向荣的发展态势。IDC在其几个月前发布的报告中曾预测,2019年全球大数据与商业分析解决方案市场的整体收益将达到1896

2019年度IT168技术卓越奖名单:云计算类

时光飞逝,转眼已是2019年最后一个月,又到了盘点、总结进行时!纵观各大云厂商动态,似乎并没有停止征战与厮杀的任何迹象。在过去一年里,不管AWS、微软Azure还是国内的阿里云、腾讯云、百度云、华为云

2019年度IT168技术卓越奖名单:网络产品类

当时间的指针快速划至2019年末,企业网络市场仍在变革中砥砺前行。在这充满机遇与挑战的一年里,工信部正式发放了5G商用牌照;Wi-Fi联盟启动Wi-Fi6认证计划;全球43亿个IPv4地址完全耗尽;S

2019年度IT168技术卓越奖名单:存储类

2019年,大数据、人工智能、物联网、5G等技术的发展驶入了快车道,创新数字化应用如雨后春笋般涌现,数据量的增长愈演愈烈。愈发多样化的业务应用对底层IT数据存储架构提出了更高的需求,企业需要更加现代化

2019年度IT168技术卓越奖名单:技术开发类

与边缘计算、人工智能、量子计算、区块链等高大的技术不同,以ERP、CRM、BI等为代表的应用类软件正在以更创新、更接地气的方式,深入到各个行业。所以,PaaS正在成为云时代的主角。基于PaaS,Saa

2019年度IT168技术卓越奖名单:服务器类

光阴如梭,一年的工作转瞬又将成为历史,2019年即将过去,崭新的2020年即将来临。新的一年意味着新的起点新的机遇新的挑战,众多企业“决心再接再厉,更上一层楼”,努力打开新局面。作为读者们的老朋友,2

2019年度IT168技术卓越奖名单:办公投影类

时光荏苒,岁月如梭,难忘的2019年即将过去了。这一年间,办公和投影市场,发生了不少的新的变化,有机遇有挑战,也有彷徨有失落,也是时候好好坐下来回顾一番了。IT168技术卓越奖评选,自2004年创立至

回顾2019年度京东集团10件大事:不忘初心,坚定前行

岁月不居,时节如流。2019,京东不忘初心,风雨兼程。在“以零售为基础的技术与服务企业”定位的指引下,京东各项业务有序发展,经营业绩屡创新高,技术转型成果显著,服务水平全面提升。感谢有你,给予我们信赖

支付中台的几个面向:支付业务、资金核算、面向风控等切面

手哥架构宝典之支付系统1.0发布后,很多架构师朋友表示受益匪浅,询问支付系统2.0版本什么时候放出来,今天刊发出《架构宝典》支付系统2.0版本,以飨读者。00 概述在1.0的支付系统中,我们遇到了诸多

远程工作第三年:2019年总结

去年,我35岁,一不小心就达到这个尴尬的年龄。这一年,是我远程工作的第三年,也是我在OpenRestyInc.工作的第二年。去年,儿子开始上小学,正式受教育。远程工作继2018年我退掉共享办公的工位之

嗨!你的 2019 晒好封存了吗?快来看程序老兵的 2019 吧!

时间过得真是太快快快了,2019还剩下最后几个小时了。回望即将过去的这一年,老兵哥做了不少事情,有计划内的,也有计划外的,当然还有不少事情没做。赶在最后时刻晒一晒我的2019年,希望从成绩荣誉中获得一

GitHub 2019 年度报告都说了什么?

4000万开发者在365天里能做什么?就在昨天,全球最大开发者社区GitHub重磅发布2019年度报告,透露了一个数据:GitHub目前在全球已有超过4000万开发者用户,其中80%来自美国之外的地区

面试题总结:可能是全网最好的MySQL重要知识点

作者:Snailclimb 整理编辑:SegmentFault本文原载于SegmentFault专栏JavaGuide,如侵删。标题有点标题党的意思,但希望你在看了文章之后不会有这个想法——这篇文章是

2019年世界5G大会热点

  2019年世界5G大会热点,5G时代的开局元年,在北京举行5G大会吸引了众多行业领导者参与其中。5G融合大数据、人工智能、区块链等通用技术,将全面构建我国数字经济的关键基础设施。5G与人工智能之间

2019年 度中国测试行业问卷调研来啦! (有奖问卷)

2019年度中国测试行业问卷调研(有奖问卷)开始TesterHome在2018年的时候,发起了一次全中国的软件测试行业的问卷调查,当时反响很不错,收集到了2000多的用户数据,通过这些数据我们看到了其

2019年-我的编程元年

12月,年末。我从事计算机软件维护工作3年,接触了不少的程序猿,认识了一些主流编程语言及其擅长领域。综合自己的实际情况,自己后期向往服务器运维领域或者网络安全工作,坚信能够通过1年的努力开发出自己的运

2019年8月数据库流行度排行:双星闪耀 MySQL 成月度最大赢家

炎炎夏日,DB-Engines的8月榜单已经发布,本月积分MySQL获得了最显著的增长,较上月增加了24分,Oracle获得了18分的增长,Oracle公司的两个王牌产品,闪耀8月。以下是前10名的榜

Eclipse发布:2019年物联网开发者调查

如果你想了解一项重要技术的未来,那么先看开发人员在做什么。考虑到这一点,在EclipseFoundation对 1700 多名物 联 网开 发 人 员 (pdf) 进行的一项新调查中,可以获得对整个物

2019年,数据中台为什么火了?

2019年,“数据中台”火了!一方面,过去一年BATJ、TMD等新老互联网巨头前后脚地发布重大消息,称集团层面正在推动以搭建中台为目标的组织架构变革,其中数据中台将是重要一环。而远在2015年就提出“

Gartner:2019年PaaS四大趋势

云计算发展正热火朝天,作为云计算产业的重要领域,PaaS已经成为各大企业角逐未来的重要阵营。由于IaaS和SaaS已经实现了商品化,云环境中众多应用软件都实现了标准化,用户都需要充分利用PaaS带来的

2019年第一季度企业WLAN市场同比增长7.1%

2019年第一季度(1Q19),消费者和企业全球无线局域网(WLAN)市场份额同比增长6.9%,达到24亿美元。根据IDC发布的全球季度WLAN追踪结果显示,企业级WLAN市场在1Q19同比增长7.1