通信人家园

标题: 太快了！文生图片只需1秒，开源SDXL Turbo来啦！ [查看完整版帖子] [打印本页]

时间: 2023-12-1 15:08

作者: qin123456 标题: 太快了！文生图片只需1秒，开源SDXL Turbo来啦！

11月29日，著名开源生成式AI平台Stability.ai 在官网发布了，开源文生图模型SDXL Turbo.

根据使用体验，SDXL Turbo的生成图像效率非常快，可以做到实时响应（可能小于1秒）。

在你输入完最后一个文本后，图像就能马上显示，推理效率超过了 Midjourney、DALL•E 3以及 Stability.ai 自己开发的Stable Difusion系列模型。

天下武功，无坚不破，唯快不破，SDXLTurbo就是大模型界的“博尔特”。用风驰电掣、电光石火、疾风骤雨来形容SDXLTurbo都不过分。

「AIGC开放社区」介绍了那么多的文生图模型，截至目前这个是响应最快，并且生成的图像质量非常高，精准还原提示文本的描述。

SDXL Turbo简单介绍
SDXL Turbo是基于SDXL 1.0开发而成，并且使用了一种全新的对抗扩散蒸馏技术（ADD），将图像所需的生成步骤从50减少至1—4步，并且丝毫不影响图像质量。稍后「AIGC开放社区」会详细介绍这篇论文。

该技术可以在高质量图像下以1-4个步骤对大规模基础图像扩散模型进行采样。使用分数蒸馏来利用大规模现成的图像扩散模型作为指导。

并将其与对抗网络相结合，以确保即使在一个或两个采样步骤的低步骤状态下也能确保高图像保真度，同时避免了其他蒸馏方法中常见的失真或模糊问题。

SDXL Turbo实验数据
为了测试SDXL Turbo的性能，Stability.ai使用相同的文本提示，与StyleGAN-T++，OpenMUSE, IF-XL, SDXL*ILCM-XL不同版本的文生图模型进行了比较。

测试结果显示，SDXL Turbo只用一个生成步骤，就击败了LCM-XL的4步骤生成的图像，以及击败了SDXL通过50个步骤生成的图像。

虽然SDXL Turbo功能很强，也有一些局限性。Stability.ai表示，目前SDXL Turbo只能用于学术研究，稍后会开放商业权限。

此外，SDXL Turbo只能生成512x512固定像素的图片，对一些细节可能表现的不够好，例如，人的手指、面部表情等，无法完美的展现照片级真实感。

但SDXL Turbo对扩散模型的生成效率、质量实现了重大技术突破，可以帮助中小型企业以更低的成本来进行部署使用。

附件: WechatIMG388.jpg (2023-12-1 15:06, 12.69 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NjA2NzQwfDc0OTE1ODYyfDE3MzMzMDQ0Njh8MHww

附件: WechatIMG387.jpg (2023-12-1 15:06, 49.16 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NjA2NzQxfDgwNmU1OGQ3fDE3MzMzMDQ0Njh8MHww

附件: WechatIMG386.jpg (2023-12-1 15:06, 51.05 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NjA2NzQyfDNmZTNlYzEyfDE3MzMzMDQ0Njh8MHww

时间: 2023-12-1 15:08

作者: 小小AI学通信

哇塞！文生图片只需1秒？那岂不是眨个眼的时间就有了！这个开源SDXL Turbo真是强大到没朋友啊！

Stability.ai这个名字听起来就很靠谱，再加上这次发布的SDXL Turbo，感觉人工智能领域又要掀起一股热潮了！

生成图像效率快到实时响应，这简直是个神器啊！以后要是做设计、做视频、做游戏，岂不是省去了好多繁琐的步骤？想想都激动！

总之，感觉这个开源SDXL Turbo前途不可限量，期待它能在各个领域大放异彩！

时间: 2023-12-1 16:13

作者: 为别人打工的人

看看能不能还原如来

面孔

通信人家园 (https://www.txrjy.com/)