英伟达推出免训练,可生成连贯图片的文生图模型_全球资讯热分享网(专注热点收集平台)

英伟达推出免训练,可生成连贯图片的文生图模型


英伟达推出免训练,可生成连贯图片的文生图模型

  2024-02-25 19:07:19     简体|繁體
http://refenxiang.com/1047491.html

文章来源:AIGC开放社区

图片来源:由无界AI生成

目前,多数文生图模型皆使用的是随机采样模式,使得每次生成的图像效果皆不同,在生成连贯的图像方面非常差。

例如,想通过AI生成一套图像连环画,即便使用同类的提示词也很难实现。虽然DALL·E 3和Midjourney可以对图像实现连贯的生成控制,但这两个产品都是闭源的。

因此,英伟达和特拉维夫大学的研究人员开发了免训练一致性连贯文生图模型——ConsiStory。(即将开源)

论文地址:https://arxiv.org/abs/2402.03286

目前,文生图模型在生成内容一致性方面比较差的原因主要有两个:1)无法识别和定位图像中的共同主体,文生图像模型没有内置的对象检测或分割模块,很难自动识别不同图像中的相同主体;

2)无法在不同图像中保持主体的视觉一致性,即使定位到主体,也很难使不同步骤中独立生成的主体在细节上保持高度相似。

主流解决这两种难题的方法是,基于个性化和编码器的优化方法。但这两类方法都需要额外的训练流程,例如,针对特定主体微调模型参数,或使用目标图像训练编码器作为条件。

即便使用了这种优化方法,训练周期较长难以扩展到多个主体,且容易与原始模型分布偏离。

而ConsiStory提出了一种全新的方法,通过共享和调整模型内部表示,可以在无需任何训练或调优的情况下实现主体的一致性

值得一提的是,ConsiStory可以作为一种插件,帮助其他扩散模型提升文生图的一致性和连贯性。

主体驱动自注意力(SDSA)

SDSA是ConsiStory的核心模块之一,可以在生成的图像批次中共享主体相关的视觉信息,使不同图像中的主体保持一致的外观。

SDSA主要扩大了扩散模型中自注意力层,允许一个图像中的“提示词”不仅可以关注自己图像的输出结果,还可以关注批次中其他图像的主体区域的输出结果

这样主体的视觉特征就可以在整个批次中共享,不同图像中的主体互相"对齐"。

为了防止背景区域之间的敏感信息泄露,该模块使用主体分割蒙版来进行遮蔽——每个图像只能关注批次中其他图像主体区域的输出结果。

主体蒙版是通过扩散模型本身的交叉注意力特征自动提取。

特征注入

为了进一步增强主体不同图像之间细节层面的一致性,“特征注入”基于扩散特征空间建立的密集对应图,可以在图像之间共享自注意力输出特征。

同时图像中一些相似的优化地方之间共享自注意力特征,这可以有效确保主体相关的纹理、颜色等细节特征在整个批次中互相"对齐"

特征注入也使用主体蒙版进行遮蔽,只在主体区域执行特征共享。同时还设置相似度阈值,只在足够相似的优化之间执行。

锚图像和可重用主体

ConsiStory中的锚图像提供了主题信息的参考功能,主要用于引导图像生成过程,确保生成的图像在主题上保持一致。

锚图像可以是用户提供的图像,也可以是从其他来源获取的相关图像。在生成过程中,模型会参考锚图像的特征和结构,并尽可能地生成与一致性的图像。

可重用主体是通过共享预训练模型的内部激活,来实现主题一致性的方法。在图像生成过程中,模型会利用预训练模型的内部特征表示来对生成的图像进行对齐,而无需进一步对齐外部来源的图像。

也就是说生成的图像可以相互关注、共享特征,这使得ConsiStory实现了0训练成本,避免了传统方法中需要针对每个主题进行训练的难题。



编辑:web3528btc 来源:加密钱包代币

分享到:

  • 上一篇
    下一篇

  • 分享知识|收获智慧

    全球资讯热分享网(专注热点收集平台)
    手机查看(二维码扫一扫)

    全球资讯热分享网,最有影响力热点信息分类网站,主要集合图文、知识、日常、娱乐、财经、文化、生活、致富、女性、地区、科技等多类信息分享交流,免费提供最有价值的头条信息平台。
    « 2024年 » « 11月 »
    123
    45678910
    11121314151617
    18192021222324
    252627282930

    最新资讯

    [开户]信息流广告开户,自然流量,接小程序拉新,快应用拉新,APP拉新拉活产品开户,代运营
  • 2024-11-16 19:36:54

     

    [开户]高德地图商户通+推广通(cpa计费)
  • 2024-11-16 19:30:49

     

    [开户]中医养生好量,羊奶粉,食疗图书粉等各种礼品粉,量大成本低
  • 2024-11-16 19:24:44

     

    [开户]千川对公2+ 小红书20+ 百度(baidu)ka电商60+ 金牛对公8+ 逾期cpa 企微可跑
  • 2024-11-16 19:18:39

     

    [开户]失眠,骨病,风湿,肝病,肺结节,关节肽,血糖,石斛,驼奶,心脑软文加粉,缺量的来聊聊
  • 2024-11-16 19:12:34

     

    [开户]360(haosou)贷款、变现猫、知逸,索知平台下载量
  • 2024-11-16 19:06:29

     

    [开户]抖音免领:艾草枕,泡脚包,老花镜,经络梳,骨病贴,血糖贴,给码直接上线,有需求的老板
  • 2024-11-16 19:00:25

     

    [开户]oppo核代:中老年养生粉有量,可跑户也可按A切量,日出粉2000+,需要的来聊。
  • 2024-11-16 18:54:21

     

    [开户]流量,寻支付宝视频红包助力,IAA快应用,app唤醒拉新,可代运营合作
  • 2024-11-16 18:48:15

     

    [开户]减肥、丰胸抖音垂直问答粉
  • 2024-11-16 18:42:10

     

    [开户] [开户]百度(baidu)企业转让户,腾讯企业贷,百度(baidu)抖音腾讯信贷车抵户,抖音企业实缴户
  • 2024-11-16 18:36:05

     

    [开户]百度(baidu)总部KA电商切量,政策拉满
  • 2024-11-16 18:30:00

     

    [开户]抖音来客门店跳保证金、本地推跳保证 云连锁poi
  • 2024-11-16 18:23:56

     

    [开户]血糖户,量大质优,欢迎合作
  • 2024-11-16 18:17:50

     

    [开户]抖音直播粉。dk 创业等
  • 2024-11-16 18:11:45