搜索
  • 首页
  • 快讯
  • 资讯
    • 推荐
    • 财经
    • AI
    • 创新
    • 城市
    • 最新
    • 创投
    • 汽车
    • 科技
    • 专精特新
  • 直播
  • 视频
  • 专题
  • 活动
搜索
寻求报道
我要入驻
城市合作
首页> 人工智能>正文

亲戚逼相亲?美国小哥生成了一个AI女友躲避催婚

新智元·2022-10-17 13:05
国外小伙意外发现DALL-E新妙用,AI生成女友竟成逃避长辈催婚利器!?

自从AI图片生成技术爆火以后,各路玩家纷纷亲自尝试。

要不就是用AI做个头像,要不就是生成一些奇思妙想的画作。

但要我说,这些点子和今天的主人公Dinda比起来,简直就是不值一提。

思路打开一点嘛。

用高科技应付长辈?

Dinda是YouTube的一名照片编辑,本着近水楼台先得月的原则,他每天就是和图片生成软件打交道。

最近,Dinda遭遇了全世界大龄青年都会面临的问题——来自长辈的催婚。

然而,Dinda小哥事业未就,怎能思虑儿女情长?可来自长辈的压力又不能不管,那就只剩一条路了——作假骗长辈。

在以前,作假是一件很麻烦的事,要找一个知根知底的异性朋友,约好来个一日情侣。见见家长,把两边都糊弄过去就算完。

但是不得不说,风险挺大的。一个大活人,可不能随时都配合着应付来自长辈的检查。

Dinda想了一个妙招。如果自己能用DALL-E生成一大堆和女朋友合拍的照片,时不时给长辈发过去应付一下,不就行了?

Dinda打开了DALL-E,用图像修复功能进行操作。该功能允许用户擦除图片上的一部分,然后DALL-E会根据用户输入的文字来填补空缺的部分。

于是,Dinda整了点自己的自拍照,然后把身边的空间擦了一块,留下一个正好能放下自己假想的女朋友的位置。

接着,他在指令中输入——一个有女朋友的男人。

然后,啪。

这还不算完,一般和修图打交道的人都很重视细节。

为了让生成的图像更加的逼真,Dinda还把虚拟女友的脸给裁了下来,导出到一个叫GFP-GAN的人工智能照片编辑程序中。

通过这个程序,Dinda可以进行微调,把这张脸做得更逼真。之后再把微调过的图像放到ps里,再修一下,最后放回原始图像。

这样一来,生成的照片就无可挑剔了。

Dinda表示,「就算我告诉别人这张照片是生成的,90%的人也不知道哪里是动过的。」

与此同时,他还演示了照片编辑人员如何使用同样的技术在AI的帮助下把人去掉。

还是一样的把要去掉的人身上涂抹一下,DALL-E就会生成一个替代背景出来。虽然背景很复杂,但是生成出来的图片也还可以。

超凡图像生成工具!

DALL-E究竟是什么呢?

我不允许还有人没听说过DALL·E。毕竟,现在都出到2代——DALL·E 2了。

这是一款由OpenAI开发的转化器模型,全部的功能就是把「话」变成「画」。

具体来说,DALL·E是一个有120亿参数版本的GPT-3,被训练成了使用文本生成图像的模型。背后的数据集是文本-图像的对应集。

比如上面这几张图,有戴帽子的狗,做实验的熊猫,还有长得像星云的狗狗。有没有觉得,哪怕不合常理,但是并不违和?这就是DALL·E能做到的。说起DALL-E的源头,其实是研究人员从GPT-3那里得到了启发。GPT-3是个用语言生成语言的工具,而图像GPT则可以用来生成高保真度的图片。

研究人员发现,用文本来操控视觉,是可以做到的。也就是这样,DALL·E成为了一个和GPT-3一样的转化器。

在此基础上,研究人员又开始琢磨同时用文本描述多个物体,生成一张图。这些物体各自的特征、之间的空间位置关系全都交给文字来描述。

比方说,输入文本:一只戴着红帽子、黄手套,穿着蓝衬衫和绿裤子的刺猬。为了正确生成对应的图片,DALL·E不仅要正确理解不同衣服和刺猬之间的关系,还不能混淆不同衣服和颜色的对应关系。

这种任务被称作变量绑定,在文献中有大量的相关研究。

可以说,DALL·E从1代到2代,就是这么一个个小任务走过来的。最终能够呈现的就是一个不错的文本-图像转化器。

T2I究竟有多卷?

要说今年最火的AI便是多模态人工智能崛起。

上半年,文本生成图像AI模型(T2I)各家争霸。

除了DALL-E,谷歌自家Imagen、Parti,Meta的文本图像生成工具Make-A-Scene,再到现在大火的Stable Diffusion、谷歌文本3D生成模型DreamFusion都在扩充着文本转图像的应用。

先是4月,在GPT-3大模型的加持下,Open AI对画图界的扛把子DALL-E进行了2.0版的全面升级。

和上一代相比,可以说,DALL·E 2简直就是直接从二次元简笔画走向超高清大图:

分辨率提升4倍,从256x256提升到了1024x1024,并且生成图像的准确率也更高!

5月,谷歌不甘落后推出AI创作神器Imagen,效果奇佳。

仅仅给出一个场景的描述,Imagen就能生成高质量、高分辨率的图像,无论这种场景在现实世界中是否合乎逻辑。

6月,谷歌再次推出了新一代AI绘画大师Parti。

要说Imagen和Parti不同地方,便在于采取了不同的策略——自回归和扩散。

Parti是一个自回归模型,它的方法首先将一组图像转换为一系列代码条目,然后将给定的文本提示转换为这些代码条目并「拼成」一个新图像。

7月,Meta公布了自家的AI「画家」——Make-A-Scene,通过文本描述,再加上一张草图,就能生成你想要的样子。

最重要的是,构图上下、左右、大小、形状等各种元素都由你说了算。

可以看到,DALL-E 2、Imagen等仍然停留在二维创作,无法生成360度无死角的3D模型。

而谷歌发布的文本3D生成模型DreamFusion便开辟了这一新路线。

训练后的模型可以在任意角度、任意光照条件、任意三维环境中基于给定的文本提示生成模型。

而且整个过程既不需要3D训练数据,也无需修改图像扩散模型,完全依赖预训练扩散模型作为先验。

由此可见,在文本转图像这块,各大厂已经卷上了新高度。

甚至有人称,今年文本转视频AI模型暂时还不会到来。

没想到的是,Meta和谷歌再次打破了这一预言。

T2V已来!

9月底,Meta最先公布了文本一键生成视频模型Make-A-Video。

这一模型厉害到什么程度?

除了可以把文本变成视频之外,它也可以把静态图变成Gif、把视频变成视频。

这一模型发布后,就连图灵奖得主Yann LeCun称,该来的都会来。

比如「马儿喝水」,生成如下效果:

猫主子拿着遥控器在看电视

简直AI导演上线。

紧接着10月,谷歌还是文本视频模型两连发。

先是Imagen Video,与Meta的Make-A-Video相比最突出一个特点就是「高清」。

它能生成1280*768分辨率、每秒24帧的视频片段。

与此同时,还有Phenaki模型,让骑马的宇航员也动了起来。

这一模型能根据200个词左右的提示语生成2分钟以上的长镜头,讲述一个完整的故事。

在文本转视频上,下一个谁会接棒?

参考资料:

https://petapixel.com/2022/10/14/photographer-creates-ai-girlfriend-to-stave-off-nosy-relatives/

本文来自微信公众号 “新智元”(ID:AI_era),作者:新智元,编辑:拉燕 桃子,36氪经授权发布。

人工智能 谷歌
+1
11

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
登录后参与讨论
提交评论0/1000
你可能也喜欢这些文章
沉默的OpenAI前员工,终于爆发了
三个90后,估值360亿
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
Cloudflare 宣布 AI Gateway 普遍可用
一句话生成UI,猿辅导母公司做了“AI版Figma” | New Things
骗子进军AI领域,一边“删号跑路”,一边研发“新业务”,网友: 我居然为它付了钱
暗战升级,Databricks 收购 Tabular,Iceberg 社区陷入动荡
Stable Diffusion老板跑路开新坑,被抛下的SD3开源成了烂摊子
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快

最新文章推荐

沉默的OpenAI前员工,终于爆发了 何以撑起浙江第三城 618电商广告攻陷内容社区 不管问界智界,卖得动就是华为「好界」 三个90后,估值360亿 我的阿勒泰,让穷游大军望而生畏 车企的盲盒彩票生意,你会all in押注吗? 问界 M7 “保鲜期”,只有 8 个月? “离职博主”扎堆小红书,“失业”成了流量密码 一年能省2880元,年收入超20万闭眼买?专家提醒
新智元
特邀作者

作者有点忙,还没写简介

最近内容

首次证实白盒Transformer可扩展性,马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
OpenAI前员工预测:2027年AGI降临,GPT智商飙升,4年从幼儿园蹿到高中生
AI「末日」突然来临,公司同事集体变蠢,只因四大聊天机器人同时宕机

提及的项目

查看项目库

见见

下一篇

人民忘掉电影院

观影习惯在消失

2022-10-17

热门标签

赛道 全新跑车 功能设计 ifttt 关机命令 互联网教育 中国男足 电气火灾 通信技术 电力线 奈雪の茶 降本增效 精益创业 创业能力 模糊 amc 首富 icloud 模特 云栖 脑白金 聊天技巧 货拉拉 云知声 msci 资本支出 cdp 胡世杰 卜蜂莲花 陆金
意见反馈
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

深圳SEO优化公司南通企业网站改版报价伊春网络广告推广多少钱红河网页制作松原百度标王临汾建站哪家好辽源网站排名优化宿州企业网站建设报价襄阳网站优化推广哪家好凉山外贸网站设计推荐汕尾seo排名哪家好绍兴关键词按天计费昌都SEO按天计费推荐飞来峡百度爱采购公司营口网站优化按天收费沙井SEO按效果付费哪家好永新seo排名价格淄博网站开发舟山网站设计价格株洲模板推广报价广元网络广告推广哪家好来宾网站改版价格苏州网站推广工具价格潜江至尊标王公司商丘网站推广工具报价怒江阿里店铺运营推荐金昌网站排名优化多少钱湘西关键词按天计费公司百色关键词按天扣费价格潜江网络广告推广哪家好宜昌百度标王价格歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化