SD3-Turbo：基于LADD的快速文本到图像生成模型 [复制链接]

gythy1978

军衔等级：

少将

电梯直达

1^# 大中小

发表于 2024-3-19 14:52:25 |只看该作者 |倒序浏览

站长之家（ChinaZ.com）3月19日消息:SD3模型还未发布，SD3-Turbo又来了!近日，一篇关于SD3-Turbo的论文引起了广泛关注。该论文主要介绍了Stability AI升级过的蒸馏技术LADD，以及其在SD3-Turbo模型上的应用效果。

LADD（Latent Diffusion Model Distillation）是对原有ADD(Activation Distillation Distillation)技术的改进。原有的ADD技术基于像素级别进行操作，而LADD则利用了预训练的潜在扩散模型中的生成特性。这种策略不仅简化了训练流程，还显著提高了性能。

论文地址:https://arxiv.org/html/2403.12015v1

具体来说，LADD能够有效克服了ADD的限制，使得我们能够生成高分辨率、多宽高比的图像。这一特性在图像生成领域具有重要意义，因为它能够提高生成图像的质量，同时保持较高的效率。

将LADD应用于“稳定扩散3（8B版）”，开发出了SD3-Turbo这一快速模型。令人惊喜的是，SD3-Turbo仅需四步无指导采样，就能达到与当今最先进的文本到图像生成器相媲美的性能。这意味着，SD3-Turbo能够在较短的时间内，生成高质量的图像，提高了生产效率。

SD3-Turbo是一个基于LADD的快速文本到图像生成模型，它通过利用预训练的潜在扩散模型中的生成特性，简化了训练流程，提高了性能。这一模型的发布，无疑将为图像生成领域带来新的突破。

本主题由版主或管理员于 2024-3-19 14:52 审核通过

0 举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-11-22 14:05 , Processed in 0.114851 second(s), 16 queries , Gzip On.

Discuz Licensed

回顶部

		自动登录	找回密码
密码			注册