TensorFlow技术主管Peter Wardan:机器学习的未来是小而美

大数据文摘授权转载自OReillyAIPete Wardan任谷歌TensorFlow移动和嵌入式团队的leader,在O’Reilly AI Conference 2019的Keynote演讲环节,他对机器学习的未来进行了深度剖析。他认为机器学习的未来就是以小为美。未来,微处理器将如何与机器学习共同合作?能否在技术上取得突破?这些问题值得深思。

想象一下这样一个世界:数千亿台设备不仅收集数据,而且会将数据转化为可操作的意见,而这些意见可以改善数十亿人的生活。

而要做到这一点,我们需要机器学习。但是一般来说,机器学习会消耗大量的系统资源。因此,低功耗,低成本的机器学习是目前需要探索并寻求突破的。

与此同时,深度神经网络也越来越多地被应用于改进很多东西,从广告系统到自动驾驶汽车原型,因此,它们也注定要改造微型计算机(即微控制器)。

因此,Pete在演讲中指出,微型处理器、内嵌处理器是机器学习的未来。

微处理器已无处不在

Pete首先用Alexa做了一个小演示,展示了基于网络的机器学习模型如何在小型的、内嵌式的处理器上去运行的,以及它可以持续几周的时间。

之所以选择用Alexa演示,是因为这台设备没有联网,也没有Wi-Fi和蓝牙,它只是在20KB的模型上运行,这个微型处理器也只有几百KB的内存。而这个模型仅仅靠钮扣电池供电,就能独立运行数周的时间。

这一点非常重要。因为全世界有2500亿个微处理器,每年出货量达到了 400亿,每年都有20%的增幅,平均成本不到50美分。这样的产品已经非常便宜而且无处不在。

此外,CPU如今也已经很便宜了,几乎都是免费的。但是我们把处理器安装到设备上之后,却要专门接电线为其供电,比如在机场,这个供电系统可能就要花几千美金。

除了布线问题,还在于,某些场合,比如手术室、工厂车间,可能并没有合适的地方去增加电源插座等设备。所以说,这非常不合理。能源供应问题成了很多设备的限制因素。

手机需频繁充电的首要原因——高能耗

以我们现在每天都离不开的手机为例。虽然手机不需要连接外部的电源,但它每天都需要充电。如果你有几十个甚至几百个电子设备需要进行打理的话,那可能你所有的时间都花在充电上了。所以很多设备,我们只好采取即插即用的办法来供电。

智能手机的能耗情况如何,为什么总要频繁充电?请参考以下数据:

  • 显示器大约使用400毫瓦
  • 有源蜂窝无线电大约使用800毫瓦
  • 蓝牙大约使用100毫瓦
  • 加速度计使用21毫瓦
  • 陀螺仪消耗130毫瓦
  • GPS消耗176毫瓦

如果我们把手机的能耗降到1毫瓦以下,那么仅仅一枚钮扣电池就能支持手机运行一个月。我们需要在这样的能耗限制下进行设计,才能保证无所不在的微处理计算和人工智能技术相得益彰。

传感器数据被浪费的原因——传输能耗太大

现有的CPU做计算本身是基本没有功耗的,它可以把功耗降到几百微瓦的水平,传感器也是如此。比如,麦克风的功耗也非常低,还有图形传感器。麦克风可能是几百微瓦的水平,传感器也是可以降到1毫瓦的水平。

因此,微处理器和传感器可以把功耗降到非常低的程度。低功耗的解决方案大大提升了传感器收集数据的能力,它们能够更频繁地查看需要的信息。

然而,虽然传感器能够以很低的功耗获得巨量的数据,但是这些却没有得到充分的应用。

比如,几年前,一家卫星公司,能够拍摄很多高清晰度的图片。但是因为带宽的问题,每个小时只能下载几百MB的数据,所以卫星和地面的通讯成本太高了,最终我们能得到的图片只是很少的一部分。

此外,比如在工厂里面的温度计,它们可以获取很多的数据。但是工厂并没有那么多的电力把这些数据上传到云端,所以很多数据也都被浪费了。

深度学习与微处理器的完美配合

对于现有的这些问题,技术应该发挥什么样的作用?如何能够把大量的传感器的数据利用起来,把它的价值发挥出来?能否降低设备能耗?

Pete认为还有很大的市场等待科技去解锁

机器学习在这方面就可以发挥非常重要的作用,具体来说,是深度学习。因为深度学习才能够最有效地把这些混沌的、非结构性质的数据利用起来。

深度学习可以处理大量未标记的数据

很少有人意识到深度学习和微处理器(MCU)的匹配程度。深度学习实际上是基于计算,而不是依靠通讯或者数据读取来运行的。因此,我们不需要很大的内存,也不需要大量访问内存。这恰好也符合微处理器的设计,它只有几百KB的内存,同时每秒可以运行几千万甚至上亿次的指令。

所以我们可以用很低的功耗来满足它的学习或者训练目的。如果我们知道对于一个给定的神经网络系统,它需要5皮焦(pJ)的能耗来执行一个操作,如果用最小的图象识别,它需要2200万的浮点计算,那么它将共需要5皮焦*22,000,000=110微焦(µJ)的能量来执行这个操作。如果每秒分析一帧,那只需要110微瓦,如此,用钮扣电池就能供一年的电量,而且不需要对现有的硬件改进。

谷歌的团队曾在2014年开发了一个13KB的模型来进行语音识别,而苹果也在做类似的研发工作。所以这些语音识别团队,就可以在非联网的微型处理器上来进行机器学习和训练。

TensorFlow Lite——赋予移动终端机器学习的能力

2017年,谷歌在Google I/O大会推出TensorFlow Lite,是专门针对移动设备上可运行的深度网络模型简单版。但当时只是开发者预览版,未推出正式版。

2019年3月,TensorFlow Lite嵌入式平台发布了第一个实验原型。这是由SparkFun构建的开发板的原型,它有一个Cortex M4处理器,具有384KB的RAM和1MB的闪存存储。该处理器功率极低,在许多情况下功耗不到1毫瓦,因此它可以仅凭小型纽扣电池运行很多天。

Pete在安卓开发峰会上介绍TensorFlow Lite

它完全在本地嵌入式芯片上运行,无需任何互联网连接,因此最好将其作为语音接口系统的一部分。该模型本身占用的存储空间不到20KB,TensorFlow Lite代码的占用空间仅为25KB的Flash,而且只需要 30KB的RAM即可运行。

TensorFlow Lite 的目标便是移动和嵌入式设备,它赋予了这些设备在终端本地运行机器学习模型的能力,从而不再需要向云端服务器发送数据。这样一来,不但节省了网络流量、减少了时间开销,而且还充分帮助用户保护自己的隐私和敏感信息。

Tensorflow Lite被用来解决了移动设备的图像分类、物体检测、智能聊天的问题。

深度学习未来的应用

深度学习最关键的在于,它特别适合把传感器的数据转化为非常有价值的资产。

全语音界面

深度学习的一个「杀手」应用,也许在不久的将来就会实现,那便是:全语音的界面。这样的界面用50美分的芯片就可以实现,同时,用一个钮扣电池就可以维持一年的运行。如此一来,我们可以只用语音操控,而不再需要开关或者是按纽了。所有的机器、设备都可以使用语音通讯的界面。

这种便宜的芯片还可以用于农业的用途,比如通过图形识别可以用很低的成本来识别有害杂草,农业工作者便可以精准地施用农药。

预维护模式

另外,还有预测式维护。我们可以预先知道哪些机器可以出故障。比如针对汽车故障,人不可能到汽车里面去看发动机哪出了什么问题,或者听出马达的声音出现了问题,但是我们可以对模型进行训练,把这些设备直接插到系统里面,不需要做新的布线或联网,这个设备就可以直接告诉你:系统好像出问题了,设备需要及时维护、维修。当然,这个模型并不需要持续上网发出设备信息,只是当要发生重大事故或者隐患的时候才会发出通讯。

深度学习未来的应用

未来的世界有更多的可能性,现在人工智能对于我们,就像八十年代的电脑一样。我们不知道它会发展成什么样子,但是我们可以想象一下我们目前面对的各种问题和挑战,在工作中面临的困难。如何用小小的芯片进行机器学习?这方面我们可以有新的角度去探索,也有新的研究成果去发挥作用。

关于Pete Warden

Pete Warden是谷歌TensorFlow Mobile团队的技术主管,曾担任 Jetpac 的首席技术官,该公司于 2014 年被谷歌收购,因其深度学习技术优化,可在移动和嵌入式设备上运行。他之前曾在Apple从事 GPU 优化图像处理工作。

Image placeholder
wyj
未设置
  48人点赞

没有讨论,发表一下自己的看法吧

推荐文章
2019机器学习框架之争:与Tensorflow竞争白热化,进击的PyTorch赢在哪里?

大数据文摘出品来源:thegradient编译:张大笔茹、曹培信、刘俊寰、牛婉扬、Andy2019年,机器学习框架之争进入了新阶段:PyTorch与TensorFlow成为最后两大玩家,PyTorch

如何使用TensorFlow机器学习对图像进行分类?

本文将介绍如何使用迁移学习使用TensorFlow机器学习平台对图像进行分类。在机器学习环境中,迁移学习是一种技术,使我们能够重用已经训练的模型并将其用于另一个任务。图像分类是将图像作为输入并为其分配

云数据管理会成为DataOps的未来吗?

如今,现代化的数据管理平台正在成为企业的首先,而传统的数据运维应用平台则逐渐被边缘化。尤其在AI和机器学习技术的推动下,企业数据正在走向以云为核心的数字化征程。根据思科的一份数据显示:到2021年,企

为什么说无服务器是云计算的未来?

无服务器计算是一种由云提供商完全管理代码执行的体系结构,而不是传统的将开发应用程序部署到服务器上的方式。这意味着开发人员在部署代码时不必担心管理、采购和维护服务器。以前,开发人员必须考虑部署前需要多少

TensorFlow与PyTorch之争,哪个框架最适合深度学习

谷歌的Tensorflow与Facebook的PyTorch一直是颇受社区欢迎的两种深度学习框架。那么究竟哪种框架最适宜自己手边的深度学习项目呢?本文作者从这两种框架各自的功能效果、优缺点以及安装、版

入门 | Tensorflow实战讲解神经网络搭建详细过程

作者| AI小昕编辑| 磐石出品| 磐创AI技术团队【磐创AI导读】:本文详细介绍了神经网络在实战过程中的构建与调节方式。之前我们讲了神经网络的起源、单层神经网络、多层神经网络的搭建过程、搭建时要注意

10分钟,用TensorFlow.js库,训练一个没有感情的“剪刀石头布”识别器

大数据文摘出品编译:Luciana、小七、宁静“剪刀石头布”是我们小时候经常玩的游戏,日常生活中做一些纠结的决策,有时候也常常使用这种规则得出最后的选择,我们人眼能很轻松地认知这些手势,“石头”呈握拳

TensorFlow 2.0 代码实战专栏开篇

作者|  AymericDamien编辑 | 奇予纪出品| 磐创AI团队原项目|  https://github.com/aymericdamien/TensorFlow-Examples/ 写在前面

Python 教程-机器学习

Python有着海量的可用于数据分析、统计以及机器学习的库,这使得Python成为很多数据科学家所选择的语言。 下面我们列出了一些被广泛使用的机器学习及其他数据科学应用的Python包。

制定机器学习训练数据策略的6个技巧

人工智能(AI)和机器学习(ML)如今已经十分常见。AI指的是机器模仿人类进行认知的概念,ML是一种用于构建AI的方法。如果AI是指计算机可以根据指令执行一组任务,那么ML就是机器从数据中摄取、解析和

从关系型数据库到分布式机器学习,揭秘腾讯大数据十年发展历程

大数据技术在过去10多年中极大改变了企业对数据的存储、处理和分析方式。如今,大数据技术逐渐成熟,涵盖了计算、存储、数仓、数据集成、可视化、NOSQL、OLAP分析、机器学习等丰富领域。在未来,大数据技

做机器学习项目数据不够?这里有5个不错的解决办法

许多开展人工智能项目的公司都具有出色的业务理念,但是当企业AI团队发现自己没有足够多的数据时,就会慢慢变得十分沮丧……不过,这个问题的解决方案还是有的。本文将简要介绍其中一些经笔者实践证明确实有效的办

甜过初恋!浙大博士用200个西瓜130页论文,教你用机器学习科学挑瓜

大数据文摘出品作者:易琬玉刚刚送走了最热七月,转眼就迎来了最热八月。2019年是人类有气象纪录以来最热的几个年份之一,虽然这个夏天还没结束,但气象学家们已经有十足把握做出这个判断。为了应付热,人们想出

Adobe又逆天!不用机器学习,用13.5M软件把《长安十二时辰》变成水墨动画

大数据文摘出品作者:曹培信用过修图软件的同学们应该都知道,利用强大的GAN,已经可以实现一键转换照片风格的功能,比如将你拍的风景照转换成一副印象派的画作。现在,轻松转换视频风格的软件也诞生了!Secr

为什么IoT需要机器学习才能蓬勃发展?

人们一直在热烈讨论大数据和人工智能等技术的机遇和威胁,并对它们的未来表示担忧。与此同时,公司希望通过安装越来越多的传感器,来提高效率降低成本。然而,InData实验室的机器学习顾问表示,如果没有适当的

一份关于机器学习“模型再训练”的终极指南

机器学习模型的训练,通常是通过学习某一组输入特征与输出目标之间的映射来进行的。一般来说,对于映射的学习是通过优化某些成本函数,来使预测的误差最小化。在训练出最佳模型之后,将其正式发布上线,再根据未来生

机器学习在高德用户反馈信息处理中的实践

1.背景作为国内领先的出行大数据公司,高德地图拥有众多的用户和合作厂商,这为高德带来了海量的出行数据,同时通过各个渠道,这些用户也在主动地为我们提供大量的反馈信息,这些信息是需要我们深入挖掘并作用于产

机器学习——单变量线性回归

机器学习之单变量线性回归modelrepresentation模型表示引言 给定房屋面积和房屋价格的数据,然后以房屋面积为横坐标,房屋价格为纵坐标,绘制数据点。通过绘制曲线,获得房屋房价的模型,根据房

Hyperf 权限管理组件 hyperf-permission 发布

本人正在申请版主,还望各位多评论,收藏,点赞GITHUB:https://github.com/donjan-deng/hyperf-perm...欢迎star,欢迎pr.Hyperf权限管理组件sp

技术大牛创业失败,原来是缺少这套思考框架

2016年以前,大众媒体对技术人创业的报道可以总结为一句话:“为何技术人创业更容易成功?”,2018年后,这个总结变成了“一个程序员创业的血泪史”。这样的转变令人哭笑不得。最近几年,技术创业者多到让

Peloton:优步开源的统一资源调度器

Peloton最初是在2018年11月份引入的,并在2019年3月份正式开源。Peloton是为像优步这样拥有数百万个容器和数万个节点的规模公司设计的,它提供了高级的资源管理特性,比如弹性资源共享、层

Stack Overflow 上最火的一个问题:什么是 NullPointerException

在逛StackOverflow的时候,发现最火的问题竟然是:什么是NullPointerException(java.lang.NullPointerException),它是由什么原因导致的,有没有

Stack Overflow上188万浏览量的提问:Java 到底是值传递还是引用传递?

在逛StackOverflow的时候,发现了一些访问量像阿尔卑斯山一样高的问题,比如说这个:Java到底是值传递还是引用传递?访问量足足有188万+,这不得了啊!说明有很多很多的程序员被这个问题困扰过

Stack Overflow 上 370万浏览量的一个问题:如何比较 Java 的字符串?

在逛StackOverflow的时候,发现了一些访问量像喜马拉雅山一样高的问题,比如说这个:如何比较Java的字符串?访问量足足有370万+,这不得了啊!说明有很多很多的程序员被这个问题困扰过。PS:

深圳流水线工厂,我差点和主管打了起来 | 十年系列

01.写在前面十年前,我还是象牙塔中数学系的一名普通的大三学生。九年前,我是富士康流水线工厂的一名工人。六年前,我包里揣着3000元RMB来北漂。三年前,我在一家互联网金融公司做到了技术负责人。两年前