一键“脱”衣应用DeepNude迅速下线,来看看它涉及的图像修复技术

大数据文摘出品

来源:Github

发布者:yuanxiaosc

上周,又一AI偏门应用DeepNude爆出,一键直接“脱掉”女性的衣服,火爆全球。

应用也很容易上手,只需要给它一张照片,即可借助神经网络技术,自动“脱掉”衣服。原理虽然理解门槛高,但是应用起来却毫不费力,因为对于使用者来说,无需任何技术知识,一键即可获取。

据发布者表示,研发团队是个很小的团队,相关技术显然也还很不成熟,多数照片(尤其是低分辨率照片)经过DeepNude处理后,得出的图像会有人工痕迹;而输入卡通人物照片,得出的图像是完全扭曲的,大多数图像和低分辨率图像会产生一些视觉伪像。

当然,目标“图片”还是各种女性,较早曝光这一应用的科技媒体Motherboard表示,他们通过几十张的照片测试,发现如果输入《体育画报泳装特辑》(Sports Illustrated Swimsuit)的照片,得到的裸体照片最为逼真。

海外媒体Motherboard测试图片

这一应用瞬间引发了社区的各类声讨,表示是对AI利用的反例。

连吴恩达也出面发声,声讨这一项目。

该应用在一片讨伐声中很快下线,但是,余震犹存。

尤其是对这一应用背后技术的探讨还一直在持续。

本周,一个名为“研究DeepNude使用的图像生成和图像修复相关的技术和论文“的GitHub升至一周热榜,获得了不少星标。

项目创始人显然对于这一项目背后的技术很有研究,提出了其生成需要的一系列技术框架,以及哪些技术可能有更好的实现效果。文摘菌在此进行转载,希望各位极客在满足技术好奇心的同时,也可以正确使用自己手中的技术力量。

以下为原文内容和来源链接:

https://github.com/yuanxiaosc/DeepNude-an-Image-to-Image-technology

接下来我会开源一些image/text/random-to-image的神经网络模型,仅供学习交流之用,也欢迎分享你的技术解决方案。

Image-to-Image Demo图像到图像demo

DeepNude软件主要使用Image Inpainting for Irregular Holes Using Partial Convolutions 中提出的Image-to-Image技术,该技术有很多其它的应用,比如把黑白的简笔画转换成色彩丰富的彩图,你可以点击下方的链接在浏览器中尝试Image-to-Image技术。

https://affinelayer.com/pixsrv/

在左侧框中按照自己想象画一个简笔画的猫,再点击pix2pix按钮,就能输出一个模型生成的猫。

Deep Computer Vision in DeepNude

Image Inpainting图像修复

  • 论文NVIDIA 2018 paper Image Inpainting for Irregular Holes Using Partial Convolutions and Partial Convolution based Padding.
  • 代码 Paper code partialconv。

效果

在Image_Inpainting(NVIDIA_2018).mp4视频中左侧的操作界面,只需用工具将图像中不需要的内容简单涂抹掉,哪怕形状很不规则,NVIDIA的模型能够将图像“复原”,用非常逼真的画面填补被涂抹的空白。可谓是一键P图,而且“毫无ps痕迹”。该研究来自Nvidia的Guilin Liu等人的团队,他们发布了一种可以编辑图像或重建已损坏图像的深度学习方法,即使图像穿了个洞或丢失了像素。这是目前2018 state-of-the-art的方法。

Pix2Pix(need for paired train data)

DeepNude mainly uses this Pix2Pix technology.

  • 论文 Berkeley 2017 paper Image-to-Image Translation with Conditional Adversarial Networks.
  • 主页 homepage Image-to-Image Translation with Conditional Adversarial Nets
  • 代码code pix2pix
  • Run in Google Colab pix2pix.ipynb

Image-to-Image Translation with Conditional Adversarial Networks是伯克利大学研究提出的使用条件对抗网络作为图像到图像转换问题的通用解决方案。

CycleGAN(without the need for paired train data)

  • 论文:Berkeley 2017 paper Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
  • 代码:code CycleGAN
  • Run in Google Colab cyclegan.ipynb

效果

CycleGAN使用循环一致性损失函数来实现训练,而无需配对数据。换句话说,它可以从一个域转换到另一个域,而无需在源域和目标域之间进行一对一映射。这开启了执行许多有趣任务的可能性,例如照片增强,图像着色,样式传输等。您只需要源和目标数据集。

未来

可能不需要Image-to-Image。我们可以使用GAN直接从随机值生成图像或从文本生成图像。

Obj-GAN

微软人工智能研究院(Microsoft Research AI)开发的新AI技术Obj-GAN可以理解自然语言描述、绘制草图、合成图像,然后根据草图框架和文字提供的个别单词细化细节。换句话说,这个网络可以根据描述日常场景的文字描述生成同样场景的图像。

效果

模型

StoryGAN

进阶版神笔:只需一句话、一个故事,即可生成画面

微软新研究提出新型GAN——ObjGAN,可根据文字描述生成复杂场景。他们还提出另一个可以画故事的GAN——StoryGAN,输入一个故事的文本,即可输出「连环画」。

当前最优的文本到图像生成模型可以基于单句描述生成逼真的鸟类图像。然而,文本到图像生成器远远不止仅对一个句子生成单个图像。给定一个多句段落,生成一系列图像,每个图像对应一个句子,完整地可视化整个故事。

效果

现在用得最多的Image-to-Image技术应该就是美颜APP了,所以我们为什么不开发一个更加智能的美颜相机呢

Image placeholder
harvee1981
未设置
  65人点赞

没有讨论,发表一下自己的看法吧

推荐文章
DeepFakes进化版DeepNude惊现!一键“脱衣“,火到宕机

大数据文摘出品作者:蒋宝尚、赵伟人工智能的黑暗面能有多黑?这边DeepFake带来的余震还没有被平息,本周,又一AI偏门应用爆出,一键直接“脱掉”女性的衣服!海外媒体Motherboard测试图片显然

华为“鸿蒙”所涉及的微内核到底是什么?一文带你认识微内核

微内核最近微内核的概念常常被大家提及,同时还有GoogleFuchisa这样的微内核新星,这里让我们一起来认识下微内核吧。背景庞大的UNIX家族计算机技术在二战后快速发展,构成计算机的主要基本单元从电

Qt on Linux 使用deb打包发布

DistributeQtAPPonPPAofUbuntuusingthe.debpackage.[Abstract]:在QtonLinux上开发程序完成后需要脱离本机所营造的开发库环境变量运行,则需要

(PPT 下载,来了!)DTCC2019 中国数据库技术大会见证实录

2019年5月8日-10日,DTCC2019第十届中国数据库技术大会历时3天,圆满收官。作为国内顶级的数据领域技术盛会,共有23个技术场次,邀请超过125名专家,包括来自阿里、京东、苏宁、滴滴出行、百

为什么使用div css布局?

提起DIV+CSS组合,还要从XHTML说起。XHTML是一种在HTML(标准通用标记语言的子集)基础上优化和改进的新语言,目的是基于XML应用与强大的数据转换能力,适应未来网络应用更多的需求。为什么

用docker拓展压测工具artillery的能力

指定域名的IP地址最近在用artillery做压测时遇到一个问题。我需要压测某一个通过域名访问的服务,而这个域名背后的机器地址需要随着压测用例变化的。通常这就是DNS要做的事情-把不变的域名和变化的地

通用高效的数据修复方法:Row level repair

导读:随着大数据的进一步发展,NoSQL数据库系统迅速发展并得到了广泛的应用。其中,ApacheCassandra是最广泛使用的数据库之一。对于Cassandra的优化是大家研究的热点,而Scylla

使用Jenkins一键打包部署SpringBoot应用,就是这么6!

SpringBoot实战电商项目mall(25k+star)地址:https://github.com/macrozheng/mall 摘要任何简单操作的背后,都有一套相当复杂的机制。本文将以Spri

推荐:10个Python图像处理工具

概述了一些常用的Python库,它们提供了一种简单直观的图像转换方法。介绍在我们今天的世界中有很多的数据,而图像是这些数据中的重要组成部分。但是,要使用这些图像,需要对它们进行处理。因此,图像处理是分

如何使用TensorFlow机器学习对图像进行分类?

本文将介绍如何使用迁移学习使用TensorFlow机器学习平台对图像进行分类。在机器学习环境中,迁移学习是一种技术,使我们能够重用已经训练的模型并将其用于另一个任务。图像分类是将图像作为输入并为其分配

在浏览器中使用Vue.js裁剪图像

在本教程中,我们将探讨如何在浏览器中使用JavaScript库来操作图片,为服务器上的存储做准备,并在Web程序中使用。我们将使用Vue.js而不是原生JavaScript来完成此操作。要了本文想要完

IEEE官方禁止华为参与期刊审稿,当全球最大技术学术机构向政治弯腰

大数据文摘出品作者:魏子敏、宋欣仪5月29日,作为全球最大专业技术组织之一的IEEE(电气和电子工程师协会)被曝出,在发给会员的内部邮件中禁止华为员工作为旗下期刊杂志的编辑和审稿人。今天早晨,IEEE

从 GFS 失败的架构设计来看一致性的重要性

作者简介陈东明,饿了么北京技术中心架构组负责人,负责饿了么的产品线架构设计以及饿了么基础架构研发工作。曾任百度架构师,负责百度即时通讯产品的架构设计。具有丰富的大规模系统构建和基础架构的研发经验,善于

嗨!你的 2019 晒好封存了吗?快来看程序老兵的 2019 吧!

时间过得真是太快快快了,2019还剩下最后几个小时了。回望即将过去的这一年,老兵哥做了不少事情,有计划内的,也有计划外的,当然还有不少事情没做。赶在最后时刻晒一晒我的2019年,希望从成绩荣誉中获得一

002.07 MineSweeper - PsSimleGUI 的应用

建檔日期:2019/12/07 更新日期:None 语言:Python3.7.2,PySimpleGUI4.6.0 系统:Win10Ver.10.0.17763主题:002.07MineSweeper

使用 openvpn 与集群内部服务通信

当我们访问集群内部服务,如postgres,redis,traefikDashboard,gitlab时,如果直接暴露在公网中,会造成很大的安全隐患,而使用BasicAuth,WhiteList等也稍

扩展包助手,一键生成 Composer/PHP/ThinkPHP/Laravel 扩展包

ComposerPackageBuilder扩展包助手,一键生成composer/php/thinkphp/laravel扩展包安装composergrequirehuangdijia/compose

DevOps平台之一键发布设计

引言:大型项目协同是DevOps要面对的一个重要场景,其中多项目发布上线协同,更是一个重要关键场景,一键发布就是为了解决这个场景而生的。本文主要介绍一键发布的界面设计、模型设计以及接口设计等。目录:1

如何利用Reworld做一个一键吸空投箱的效果

功能效果展示运行环境Win7,Win8,Win10Reworld版本体验版vc_redist.x64运行环境针对零基础读者的补充下载安装Reworld对应版本Reworld官网链接:http://ww

这波技术社区的程序员,技术视野有点堪忧!

前一段时间写了一篇文章《凌晨1点突发致命生产事故,人工多线程来破局!》,只是一篇生产事故的记实文章,没想到在圈内流传甚广,其中有程序员对其中的细节有点疑惑,刚好国庆可以和大家再进一步探讨一下。现在技术

冬虫夏草之技术路线图之一【“技”——技术篇】

作为一名28年证券机构从业经历的老兵,杨松一直在观察和研究IT技术对金融机构的业务重构,以及证券业务变革相关的内容。今天,让我们来看看这位金融业内人士如何利用他28年的行业积累,通过“技”“术”“路”

“我是技术总监,你干嘛总问我技术细节?”

题图:fromZoommy每个周末的午后,把儿子送进EF读书,随后找个环境幽静的咖啡馆坐一会,这便是我一周中最放松的时光。在咖啡厅的气氛和环境这两点上,我似乎有强迫症,比如装修主色调的运用,地上装饰是

2019年度IT168技术卓越奖名单:技术开发类

与边缘计算、人工智能、量子计算、区块链等高大的技术不同,以ERP、CRM、BI等为代表的应用类软件正在以更创新、更接地气的方式,深入到各个行业。所以,PaaS正在成为云时代的主角。基于PaaS,Saa

【新加坡】[30k-60k] 领航电商平台 Shopee 招聘技术职位

【Base新加坡】泛东南亚最大电商平台,新加坡知名团队,国际化平台,富有竞争的薪资,享受新加坡优质生活环境及教育资源,公司申请EP,属于技术引进性人才签证。可携带家人一起前往新加坡工作生活,配偶可在新

多次问鼎 NuerIPS、MRQA 等国际顶级比赛,百度 NLP 技术到底有多强?

人工智能技术的发展尤其是深度学习技术的成功运用,推动自然语言处理(NLP)进入了高速发展阶段。NLP目前也是应用范围最广的人工智能技术之一,已在智能搜索、智能客服、智能助手、智能推荐等方面得到了大规模