马赛克秒变没!杜克大学推AI图像生成器,糊图像5秒变清晰
  • 首页
  • 资讯
  • 视频
  • 直播
  • 凤凰卫视
  • 财经
  • 娱乐
  • 体育
  • 时尚
  • 汽车
  • 房产
  • 科技
  • 读书
  • 文化
  • 历史
  • 军事
  • 旅游
  • 佛教
更多
  • 国学
  • 数码
  • 健康
  • 家居
  • 公益
  • 教育
  • 酒业
  • 美食
科技
科技 > 正文

马赛克秒变没!杜克大学推AI图像生成器,糊图像5秒变清晰

智东西6月24日消息,近日,杜克大学的研究团队研发了一个AI图像生成模型PULSE。PULSE可以在5秒钟内将低分辨率的人像转换成清晰、逼真的人像。

要指出的是,PULSE所做的工作并不是把输入的低分辨率人像变成一张高分辨率的人像,而是“一对多”地输出许多张面部细节各不相同的高分辨率人像。比如,用户输入一张16*16分辨率的图像,PULSE可输出一组1024*1024分辨率的图像。

特斯拉扩建电池实验室 自研超级电池或加速量产

这项研究于本月在计算机视觉与模式识别顶会CVPR 2020上发表,论文标题为《PULSE:通过对生成模型的潜在空间探索实现自监督照片上采样(PULSE:Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models)》。

特斯拉扩建电池实验室 自研超级电池或加速量产

一、PULSE:能为天文学/医学提供参考

在好莱坞间谍电影中,肩负拯救世界重任的特工常常采用高科技手段、把一张模糊的凶犯照片还原成清晰的人脸照片。现实中,许多研究人员致力于用AI技术使电影中的炫酷场景成真。但是,现有AI模型的性能普遍较差,生成的人脸图像往往与照片主人公的真实长相并不相似。

杜克大学计算机科学专业教授Cynthia Rudin指出,这是因为低像素图像中的信息较少,AI模型无法准确地“补足”缺失信息、进而还原出清晰人脸图像。因此,用AI技术对模糊人像进行面部识别十分困难。

Rudin团队认为,虽然不能用于模糊人像的面部识别,但是这类AI模型可以作为一种分类和探索工具,用于天文学、医学等难以获得清晰图像的领域。也就是说,基于模糊图像中缺失信息的各种可能性,AI模型可以生成许多清晰的图像,生成的多种图像可以为天文学、医学等领域研究人员提供参考。

基于这种设想,杜克大学研究人员研发了基于生成式对抗网络(GAN)的图像超分辨率模型PULSE。PULSE模型基于NVIDIA的StyleGAN算法进行开发。

二、降尺度损失方法:用生成图像“倒推”模糊图,相似才能输出

为了保证输出图像与输入图像的“对应性”,研究人员在PULSE模型中应用了一种“降尺度损失(downscaling loss)”方法。

当PULSE模型的生成网络提议以一张清晰图像作为输出时,判别网络会把这张清晰图像的分辨率降低到与输入图像相等的水平。然后,判别网络会对比降尺度损失图像与输入图像之间的相似性。

只有在降尺度损失图像与输入图像相似性较高时,判别网络才会判定生成网络提议的清晰图片可以作为输出。

特斯拉扩建电池实验室 自研超级电池或加速量产

▲基于同一张模糊的图像,PULSE可以生成面部细节不同的清晰图像

三、40位评估者参与打分,PULSE模型MOS得分最高

研究人员用高分辨人脸数据集CelebA HQ评估PULSE的性能。为了进行对比,研究人员利用CelebA HQ数据集训练了监督模型BICBIC、FSRNET和FSRGAN。

所有模型均以16*16分辨率的图像作为输入,BICBIC、FSRNET和FSRGAN模型以128*128分辨率图像作为输出,PULSE模型以128*128分辨率图像和1024*1024分辨率图像作为输出。

评估结果显示,图像质量方面,PULSE模型在生成眼睛、嘴唇等图像细节方面的能力优于其他模型。

特斯拉扩建电池实验室 自研超级电池或加速量产

▲PULSE生成图像的嘴唇、眼睛更加清晰

接下来,研究人员用平均意见分数(MOS)测试来定量评估模型的分辨率。研究人员应用6个模型生成128*128分辨率的图像,邀请40位评估者对6个模型的输出结果进行打分。

用于对比的模型分别是:HR、Nearest、Bicubic、FSRNet、FSRGAN。

结果显示,PULSE的MOS分数最高,为3.60,即评估者认为PULSE模型生成的图像分辨率最高。

特斯拉扩建电池实验室 自研超级电池或加速量产

结语:代码已在GitHub开源,用户担忧种族偏见

本项研究中,杜克大学研发的PULSE模型能够基于一张模糊的人像,生成多张面部细节不同的清晰人像,为使用者提供一个可能的参考范围。目前,研究团队已将模型代码在GitHub开源,鼓励其他开发者进行实验。

研究人员称,在未来,PULSE或可被用于天文学、医学等领域。比如,一位天文学研究人员可以输入一张模糊的黑洞图像,并获得许多可能的天体照片。

同时,也有人对PULSE的种族偏见问题表示担忧。有Twitter用户爆料称,其在PULSE模型中输入深肤色种族(比如奥巴马的照片)的人脸照片后,PULSE输出了白人的照片。研究人员称,目前他们正尝试通过引入更广泛的数据集解决这一问题。

参考信源:IEEE Spectrum,PULSE

关闭

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载

深圳SEO优化公司达州网站优化按天计费哪家好河源SEO按天扣费哪家好河源推广网站公司荆门百度seo公司景德镇网站优化软件价格巢湖网站优化按天计费辽源百搜标王贵阳seo排名公司阿坝网站建设设计多少钱网络推广多少钱唐山网站建设设计多少钱广东百度seo长葛模板网站建设公司张掖网站设计模板价格潜江网站seo优化多少钱飞来峡网站开发报价永州百度关键词包年推广武威网站改版报价清徐建设网站泉州网站排名优化多少钱吉安营销型网站建设恩施模板制作哪家好丽水企业网站设计多少钱白山网站开发张家界网站优化软件公司黄山seo网站推广哪家好梅州关键词按天收费报价茂名网站关键词优化价格仙桃网站建设哪家好宝安百搜标王歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化