通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  四级军士长

注册:2017-9-24137
跳转到指定楼层
1#
发表于 2023-12-1 15:08:24 |只看该作者 |倒序浏览
11月29日,著名开源生成式AI平台Stability.ai 在官网发布了,开源文生图模型SDXL Turbo.


根据使用体验,SDXL Turbo的生成图像效率非常快,可以做到实时响应(可能小于1秒)。


在你输入完最后一个文本后,图像就能马上显示,推理效率超过了 Midjourney、DALL•E 3以及 Stability.ai 自己开发的Stable Difusion系列模型。


天下武功,无坚不破,唯快不破,SDXLTurbo就是大模型界的“博尔特”。用风驰电掣、电光石火、疾风骤雨来形容SDXLTurbo都不过分。


「AIGC开放社区」介绍了那么多的文生图模型,截至目前这个是响应最快,并且生成的图像质量非常高,精准还原提示文本的描述。


SDXL Turbo简单介绍
SDXL Turbo是基于SDXL 1.0开发而成,并且使用了一种全新的对抗扩散蒸馏技术(ADD),将图像所需的生成步骤从50减少至1—4步,并且丝毫不影响图像质量。稍后「AIGC开放社区」会详细介绍这篇论文。


WechatIMG386.jpg

该技术可以在高质量图像下以1-4个步骤对大规模基础图像扩散模型进行采样。使用分数蒸馏来利用大规模现成的图像扩散模型作为指导。


并将其与对抗网络相结合,以确保即使在一个或两个采样步骤的低步骤状态下也能确保高图像保真度,同时避免了其他蒸馏方法中常见的失真或模糊问题。


SDXL Turbo实验数据
为了测试SDXL Turbo的性能,Stability.ai使用相同的文本提示,与StyleGAN-T++,OpenMUSE, IF-XL, SDXL*ILCM-XL不同版本的文生图模型进行了比较。


测试结果显示,SDXL Turbo只用一个生成步骤,就击败了LCM-XL的4步骤生成的图像,以及击败了SDXL通过50个步骤生成的图像。


WechatIMG387.jpg

虽然SDXL Turbo功能很强,也有一些局限性。Stability.ai表示,目前SDXL Turbo只能用于学术研究,稍后会开放商业权限。

WechatIMG388.jpg

此外,SDXL Turbo只能生成512x512固定像素的图片,对一些细节可能表现的不够好,例如,人的手指、面部表情等,无法完美的展现照片级真实感。


但SDXL Turbo对扩散模型的生成效率、质量实现了重大技术突破,可以帮助中小型企业以更低的成本来进行部署使用。

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-12-4 03:16 , Processed in 0.122630 second(s), 18 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部