AI视觉字谜爆火！梦露转180°秒变爱因斯坦，英伟达高级AI科学家：近期最酷的扩散模型_全球资讯热分享网(专注热点收集平台)

AI视觉字谜爆火！梦露转180°秒变爱因斯坦，英伟达高级AI科学家：近期最酷的扩散模型

AI视觉字谜爆火！梦露转180°秒变爱因斯坦，英伟达高级AI科学家：近期最酷的扩散模型

2023-12-04 14:05:57 简体|繁體
https://refenxiang.com/1011929.html

来源：量子位

AI画的玛丽莲·梦露，倒转180°后，竟然变成了爱因斯坦？！

这是最近在社交媒体上爆火的扩散模型视错觉画，随便给AI两组不同的提示词，它都能给你画出来！

哪怕是截然不同的对象也可以，例如一位男子，经过反色处理，就神奇地转变成一名女子：

就连单词也能被翻转出新效果，happy和holiday只在一旋转间：

原来，这是来自密歇根大学的一项“视觉字谜”新研究，论文一发出就在Hacker News上爆火，热度飙至近800。

英伟达高级AI科学家Jim Fan赞叹称：

这是我近期见到最酷的扩散模型！

还有网友感叹称：

这让我想到了从事分形压缩工作的那段经历。我一直认为它是纯粹的艺术。

要知道，创作一幅经过旋转、反色或变形后呈现出新主题的绘画作品，怎么也需要画家对色彩、形状、空间具备一定的理解能力。

如今连AI也能画出这样的效果，究竟是如何实现的？实际效果是否有这么好？

我们上手试玩了一番，也探究了一下背后的原理。

Colab就能直接试玩

我们用这个模型绘制了一组Lowpoly风格的画，让它正着看是一座山，反过来则是城市的天际线。

同时，我们让ChatGPT（DALL·E-3）也试着画了一下，结果除了清晰度高一些之外似乎就没什么优势了。

而作者自己展示的效果则更加丰富，也更为精彩。

一座雪后的山峰，旋转90度就变成了一匹马；一张餐桌换个角度就成了瀑布……

最精彩的还要属下面这张图——从上下左右四个角度看，每个方向的内容都不一样。

（这里先考验一下各位读者，你能看出这四种动物分别是什么吗？）

以兔子为初始状态，每逆时针旋转90度，看到的依次是鸟、长颈鹿和泰迪熊。

而下面这两张图虽然没做到四个方向每个都有“新内容”，但还是做出了三个不同的方向。

除了旋转，它还可以把图像切割成拼图，然后重组成新的内容，甚至是直接分解到像素级。

风格也是千变万化，水彩、油画、水墨、线稿……应有尽有。

那么这个模型去哪里能玩呢？

为了能让更多网友体验到这个新玩具，作者准备了一份Colab笔记。

不过免费版Colab的T4不太能带动，V100偶尔也会显存超限，要用A100才能稳定运行。

甚至作者自己也说，如果谁发现免费版能带动了，请马上告诉他。

言归正传，第一行代码运行后会让我们填写Hugging Face的令牌，并给出了获取地址。

同时还需要到DeepFloyd的项目页面中同意一个用户协议，才能继续后面的步骤。

准备工作完成后，依次运行这三个部分的代码完成环境部署。

需要注意的是，作者目前还没有给模型设计图形界面，效果的选择和提示词的修改需要我们手动调整代码。

作者在笔记中放了三种效果，想用哪个就取消注释（去掉那一行前面的井号），并把不用的删除或注释掉（加上井号）。

这里列出的三种效果不是全部，如果想用其他效果可以手动替换代码，具体支持的效果有这些：

修改好后要运行这行代码，然后提示词也是如法炮制：

修改好并运行后，就可以进入生成环节了，这里也可以对推理步数和指导强度进行修改。

需要注意的是，这里一定要先运行image_64函数生成小图，然后再用后面的image变成大图，否则会报错。

做个总结的话，我们体验后的一个感觉是，这个模型对提示词的要求还是比较高的。

作者也意识到了这一点，并给出了一些提示词技巧：

△机翻，仅供参考

那么，研究团队是如何实现这些效果的呢？

“糅合”多视角图像噪声

首先来看看作者生成视错觉图像的关键原理。

为了让图像在不同视角下，能根据不同的提示词呈现出不同的画面效果，作者特意采用了“噪声平均”的方法，来进一步将两个视角的图像糅合在一起。

简单来说，扩散模型（DDPM）的核心，是通过训练模型将图像“打碎重组”，基于“噪点图”来生成新图像：

所以，要想让图像在变换前后，能根据不同提示词生成不同图像，就需要对扩散模型的去噪过程进行改动。

简单来说，就是对原始图像和变换后的图像，同时用扩散模型进行“打碎”处理做成“噪点图”，并在这个过程中将处理后的结果取平均，计算出一个新的“噪点图”。

随后，基于这个新的“噪点图”生成的图像，就能在经过变换后呈现出想要的视觉效果。

当然，这个变换的图像处理过程，必须要是正交变换，也就是我们在展示效果中看到的旋转、变形、打碎重组或反色等操作。

具体到扩散模型的选择上，也有要求。

具体来说，这篇论文采用了DeepFloyd IF来实现视错觉图像生成。

DeepFloyd IF是一个基于像素的扩散模型，相比其他扩散模型，它能直接在像素空间（而非潜在空间或其他中间表示）上进行操作。

这也让它能更好地处理图像的局部信息，尤其在生成低分辨率图像上有所帮助。

这样一来，就能让图像最终呈现出视错觉效果。

为了评估这种方法的效果，作者们基于GPT-3.5自己编写了一个50个图像变换对的数据集。

具体来说，他们让GPT-3.5随机生成一种图像风格（例如油画风、街头艺术风），然后再随机生成两组提示词（一个老人、一个雪山），并交给模型生成变换画。

这是一些随机变换生成的结果：

随后，他们也拿CIFAR-10进行了一下不同模型间图像生成的测试：

随后用CLIP评估了一下，结果显示变换后的效果和变换之前的质量一样好：

作者们也测试了一下，这个AI能经得起多少个图像块的“打碎重组”。

事实证明，从8×8到64×64，打碎重组的图像效果看起来都不错：

对于这一系列图像变换，有网友感叹“印象深刻”，尤其是男人转变成女人的那个图像变换：

我看了大概有10遍左右。

还有网友已经想把它做成艺术作品挂在墙上了，或是使用电子墨水屏：

但也有专业的摄影师认为，现阶段AI生成的这些图像仍然不行：

仔细观察的话，会发现细节经不起推敲。敏锐的眼睛总是能分辨出糟糕的地方，但大众并不在意这些。

那么，你觉得AI生成的这一系列视错觉图像效果如何？还能用在哪些地方？

参考链接：

[1]https://news.ycombinator.com/item?id=38477259

[2]https://arxiv.org/pdf/2311.17919.pdf

[3]https://twitter.com/DrJimFan/status/1730253638935920738

— 完 —

编辑：web3528btc 来源：加密钱包代币

分享到：

上一篇下一篇

分享知识|收获智慧

全球资讯热分享网(专注热点收集平台)

手机查看（二维码扫一扫）

全球资讯热分享网，最有影响力热点信息分类网站,主要集合图文、知识、日常、娱乐、财经、文化、生活、致富、女性、地区、科技等多类信息分享交流，免费提供最有价值的头条信息平台。

行业分类

招商加盟体育赛事金融期货教育培训减肥丰胸祛斑美白小病种类电商微商礼品首饰新能源类机械设备生活服务

« 2024年 » « 11月 »
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

最新资讯

想开个小加工厂做什么好

2024-11-23 19:04:35

2025年天猫年货节满减是多少

2024-11-23 18:59:31

2025年天猫年货节时间是几号

2024-11-23 18:54:27

科学护航，泰薇肝胶囊—— 您的肝脏健康守护者

2024-11-23 18:49:22

中国人寿保险人身意外险多少钱？中国人寿意外险怎么购买？

2024-11-23 18:44:18

保险的纸质合同不见了怎么办？能退保吗？

2024-11-23 18:39:13

中信信用卡逾期半天严重吗？这些后果要知道

2024-11-23 18:34:13

少儿保险怎么买不被坑？少儿保险要买哪些险种？

2024-11-23 18:29:05

掉马后首富前妻火遍全球全文目录时笙司寒枭小说免费阅读无广告

2024-11-23 18:24:01

帮助环卫后，被全网网曝了周美兰李东旺完结小说全文在线阅读

2024-11-23 18:18:56

龙卿卿龙晏龙倩倩全文阅读龙卿卿龙晏龙倩倩小说最新章节

2024-11-23 18:13:52

楚悠沐灵儿小说免费试读楚悠沐灵儿第10章

2024-11-23 18:08:47

主角是陈建业宋雪梅林自强的小说免费阅读全文大结局

2024-11-23 18:03:43

江逸周彩华陆瑶小说章节目录江逸周彩华陆瑶免费阅读第三章

2024-11-23 17:58:39

天策王洛阳小说名女帝你退他的婚，这天下真不要了妖二代在线阅读

2024-11-23 17:53:34

随机资讯

六盘水工艺品金融期货 - 提取,墨西哥比索,指数,普通股

2023-12-18 10:18:09

朔州绘画金融期货 - 证券,财富,英镑,后配股

2023-12-18 10:18:09

寿司油泼面小病种类 - 脑血栓,狐臭,不孕不育,男科

2024-06-12 10:25:14

运动服装八月教育培训 - 建筑师资格证,教师从业,职业技能,英语类

2023-12-18 10:18:03

便当陇南新能源类 - 地热能,洋流能,风能,洋流能

2024-03-09 10:20:54

窝窝头湘潭机械设备 - 重型矿山机械, 包装机,机械,环保机

2023-11-16 23:36:25

资阳章鱼小丸子祛斑美白 - 抗衰,祛斑,祛斑霜,祛斑精华

2024-05-29 22:38:26

八月茂名教育培训 - 本科,IT培训,资格认证,本科

2023-12-05 10:58:50

丰镇通辽卤肉卷体育赛事 - 欧冠,篮球,奥运会,奥运会

2023-11-21 17:28:30

通讯干锅招商加盟 - 培训,早教,内衣,创业

2024-03-09 10:21:49

桶装水童鞋小病种类 - 血糖,不孕不育,不孕不育,去眼袋

2024-03-09 10:21:12

营口烧烤礼品首饰 - 珠宝,白金,代发,回收

2024-06-16 21:38:44

锅盖面八月教育培训 - IT培训,事业单位招录培训,教师从业资格,建筑师资格证

2024-05-24 16:13:49

基因检测天门体育赛事 - 意甲,法甲,足球,足球

2023-12-18 10:18:16

驻马店养发馆招商加盟 - 化妆品,创业,作文,精品

2024-05-24 16:14:11