当前位置:首页 > seo优华 > 正文内容

【开普云AI实践】风格迁移:如何泛化一种画风进行内容创作?(开普云是外包公司吗)

admin3个月前 (11-19)seo优华8

本文分享给大家的是:

  (来源:开普云)引言  作为生成式人工智能的一个重要研究方向个性化风格迁移是根据给定的一张或多张图像生成具有相同风格的图像将带有某种风格的图像输入到生成模型,模型学习输入图像中带有的图像画风,从而创作出多样、高质量且富有创意的个性化作品。

常见的图像风格如水墨画、剪纸画、日漫、赛博朋克、3D动画、像素艺术、吉卜力等,虽然大多数生图模型的基础模型就可以支持一些图像风格的生成,但这些风格一般偏大众,相对普通个性化风格迁移能够捕获任何领域的风格,它可以是一个小众、细分的独特风格,比如某外漫画作家的独特画风。

这样的需求同样旺盛,尤其是在艺术创作、社交娱乐、文化传媒等领域,更注重图像风格独创性的领域个性化生成任务的一个关键在于保真度和泛化性,期望生成图像与输入图像的风格有极高相似度,同时可以灵活地组合、迁移到不同的场景。

此外,推理速度也至关重要,更快速地生成有利于提升用户体验鉴于上述挑战,目前大多数解决方案都存在不同的缺陷  开普云提出了低秩自适应个性化风格迁移方法,将LoRA 方式的优异性能与适配器策略的零样本能力相结合。

该方法构建了一种低维线性LoRA网络,并冻结其中部分参数在确保模型学习到风格的同时,提升这部分网络的训练效率测试来看,这种方法既具有高保真度又具有零样本能力,并且推理高效推理测试时,输入提示词和一张风格图,就会输出带有该风格,且符合提示词描述的画面。

例如:

现有的个性化图像生成方法  最新的个性化图像生成方法通常可以分为基于微调的方法和无需微调的方法基于微调的方法,如LoRA和 DreamBooth,会根据用户提供的特定数据更新模型参数,能够准确理解并保留输入的特征信息。

理论上,这些方法主要针对少批量样本情况设计,为不同的风格定制不同的模型因此,高计算成本、训练不稳定以及训练过程漫长等问题使得这类方法不太便捷  无需调优的方法,最典型的IP-Adapter ,通常利用额外的插件结构来编码图像风格的信息。

通过图像风格相关的特征输入到冻结的基础模型中,这些方法会对推理过程产生影响,最终生成定制化风格的结果这种额外的适配器结构会提前使用大型数据集进行训练,并在推理时冻结这些方法摆脱了在线训练,便于实际应用然而,对于这些方法而言,编码的输入信息与基础模型之间的交互依赖于一组固定的额外交叉注意力模块,这可能会降低生成图像的质量,导致生成图像不自然且缺乏真实感,并且无法恢复精细的细节。

先前的方法很难同时在保真度、泛化性两者间取得平衡低秩自适应生成方法  开普云提出了一种低秩自适应生成方法,它实现了极高的风格保真度、快速推理速度和更强的泛化性它使用自适应插件网络对输入图像进行编码,这遵循了诸如IPAdapter等无需调优方法的设计。

然而,与这些方法利用编码后的标记进行注意力计算不同,我们直接通过插件网络生成LoRA权重这种策略不仅保持了适配器策略的零样本能力,还继承了LoRA策略通过调整全局参数而无需实际微调过程的表示能力和高质量生成效果。

   考虑到LoRA中参数数量庞大,为降低训练难度,我们首先将LoRA参数投影到线性LoRA空间, 而非直接在原始参数空间中进行训练这样生成的LoRA权重可以表示为可训练的线性组合我们使用感知器重采样器(如IP-Adapter中所用)将输入图像转换为向量。

为了编码输入图像,我们使用CLIP提取图像特征上述特征提取器在整个训练过程中被冻结LoRA空间当前业界使用的扩散模型结合LoRA用于生成图像的工程中,LoRA的每一层包含下采样矩阵At、上采样矩阵Bt、各自包含查询、键、值和输出矩阵。

使用随机高斯分不分初始化矩阵At,用零初始化矩阵Bt,以保证在训练开始时Δt=0,计算公式如下:

本文中采用LoRI中冻结At,仅训练Bt 的方式,提升训练效率,这种方法已被证明可以在大幅减少可训练参数的同时,性能下降极小即将At 固定为随机矩阵,仅通过Bt 学习如何组合固定的子空间也就是冻结At,无需其对应的存储梯度和优化器状态,大幅减少了内存消耗。

在推理过程中,与一般LoRA 类似,LoRI通过将AtBt加到W上合并,与全量微调相比没有额外的推理延迟在衔接图像特征时,将Bt 的每个矩阵投影到一个较小的K  维向量MLoRA层的数量N,其投影维度为N×8K,即。

,图像特征对应的向量记作

,所以LoRA的Bt表示为:

图2 (a)LoRA结构         (b) LoRI结构自适应结构  自适应结构包括:图像编码器、感知重采样器,最后结合LoRA图像编码器  与IP-Adapter相似,图像编码器使用一个预训练的CLIP图像编码器,由“图像-文本”组成的大数据集通过对比学习训练而来,在训练阶段,CLIP图像编码器是冻结状态。

图像经过CLIP图像编码器后成为表示图像的特征向量,随后将该向量投影到低维,投影网络由一个线性层和一个归一化层组成感知重采样器  感知重采样器内部是Transformer网络,图像特征被注意力机制进一步提取。

感知重采样器有4层,每层两个注意力模块感知重采样器的输出,即组合系数  ,后面用于计算输出的LoRA权重LoRA组合

是训练参数。训练阶段参与训练,推理阶段为常量。得到

时,网络可以通过如下公式计算: 

实验  在模型预训练时,使用StyleGallery作为数据集,该数据集由三部分开源数据集整合而来包括JourneyDB Sun等人在MidJourney使用的风格数据集;具有大量细粒度高品质绘画风格的WIKIART Phillips & Mackintosh数据集,如点彩和水彩画;来自LAION-Aesthetics的风格化图像子集。

相比于直接使用Laion-Aesthetics,StyleGallery数据集中图像的风格分布更加平衡和多样化  不同于一般“描述词-图像”的文图数据对,我们使用“描述词-风格-风格化图像”组合作为训练数据对,额外输入一张“风格”图。

其中,描述词使用BLIP-2生成,而非直接使用StyleGallery数据集自带的描述词,这是因为该数据集自带的描述词中大多包含对该图风格的描述而本文方法的风格特征来自“风格”图,需要避免描述词引入风格相关的描述引起混乱。

结语  开普云提出的低秩自适应个性化风格迁移方法,具备独特的自适应结构、创新的 LoRA 空间运用以及精心设计的实验方案,在个性化图像生成领域展现出了良好性能,克服了现有方法在保真度、泛化性和推理速度等难题,为艺术创作、社交娱乐、文化传媒等对图像风格独创性要求极高的领域带来了新的可能。

扫描二维码推送至手机访问。

版权声明:本文由rj119.com发布,如需转载请注明出处。

本文链接:http://www.rj119.com/post/1822.html

分享给朋友:

“【开普云AI实践】风格迁移:如何泛化一种画风进行内容创作?(开普云是外包公司吗)” 的相关文章

2025佛山英文网站建设公司推荐榜独立站制作Seo优化服务商(佛山网站建设方案报价)

本篇文章给大家谈谈 随着全球外贸市场竞争加剧,“品牌出海”已成为佛山制造企业的重要转型方向越来越多的外贸企业意识到:想让海外客户快速找到你,光有产品远远不够,还必须要有一个高质量的英文网站(独立站),并辅以专业的Google SEO优化推广。 在这样的趋势下,佛山本地的外贸...

外贸独立站如何有效引流,外贸推广方案(外贸独立站的前景)

外贸独立站如何有效引流,外贸推广方案(外贸独立站的前景)

本篇文章给大家谈谈 要让B2B独立站获得持续且高质量的流量,需结合技术优化、内容策略、渠道布局和数据驱动,形成系统性引流体系以下是经过实战验证的核心策略及具体实施方法:一、SEO优化:低成本长效引流的核心基础关键词精准布局。 长尾词挖掘:针对行业痛点词(如“CNC Mach...

天津众赢天下网络推广公司:专业打造个性化网站建设服务(天津众赢天下科技怎么样可靠吗)

天津众赢天下网络推广公司:专业打造个性化网站建设服务(天津众赢天下科技怎么样可靠吗)

今天给各位分享 网站建设公司选购指南:为何天津众赢天下值得推荐在数字化时代,一个优质的网站是企业展示形象、拓展业务的关键窗口选择一家靠谱的网站建设公司成为众多企业的重要决策,天津众赢天下凭借其独特优势,在行业内脱颖而出,本文将从多个关键维度深入剖析。 性价比——高性价比之选...

免费信息发布平台 软文推广免费网站(58同城免费发布信息平台)

免费信息发布平台 软文推广免费网站(58同城免费发布信息平台)

今天给各位分享 在当前清朗行动持续推进的背景下,各类自媒体平台对账号及内容的监管日益严格,单一IP地址下分发多个账号内容的行为存在较高风险,因此必须采取账号隔离措施,确保操作合规安全。 针对内容分发需求,以下推荐部分可免费发布信息的平台及渠道,覆盖不同领域,便于精准对接目标...

网站优化推广SEO怎么做?(网站推广排名优化多少钱)

网站优化推广SEO怎么做?(网站推广排名优化多少钱)

本文分享给大家的是: 咱运营个网站,肯定都盼着它能被更多人瞅见、流量蹭蹭往上涨,这时候就需要懂 SEO啦。虽说这听起来挺专业、挺复杂,但爬爬客小编把关键环节给大家捋捋,你就会发现上手也没想象中难。 先从网站内容开始说吧,你得保证你的网站有足够吸引人的内容就像你去一家餐厅,要...

网站 SEO 内容规划开发工具多款对比,选出优质 SEO 工具(seo网站分析报告)

网站 SEO 内容规划开发工具多款对比,选出优质 SEO 工具(seo网站分析报告)

本篇文章给大家谈谈 SEO 内容规划开发的最终效果,离不开工具对优化需求的适配能力模板是否能承载清晰的内容架构、是否有专业工具简化优化流程、成本是否与优化投入匹配,这些因素直接决定搜索引擎排名的提升效率本文针对乔拓云、光秒、固乔、唯顿四款工具,从 SEO 核心需求拆解差异,帮运营者...