通信人家园

标题: 最新AI生图模型Flux1.1刷屏，添加单反相机文件名获得超写实图像，网友：我分不清啊 [查看完整版帖子] [打印本页]

时间: 2024-10-8 10:06

作者: ttxx 标题: 最新AI生图模型Flux1.1刷屏，添加单反相机文件名获得超写实图像，网友：我分不清啊

最新AI文生图模型Flux1.1，一夜刷屏。

只需一个简单技巧，就能去除图中的“AI味”，无论人物还是风景都能达到照片级效果。

评论区网友的反应be like：我分不清，真的分不清啊。

这个技巧用起来也非常简单，在提示词中模仿单反相机的文件命名格式即可。

比如“CR2”就是佳能相机使用的原始图像文件格式，输入“IMG”+随机编号+“.CR2”，再加指定的内容，就能获得一张写实图像了。

后面也陆续有尝试过的网友反馈，换成索尼相机的“ARW”、尼康相机的“NEF”，甚至苹果的“HEIC”格式，都能获得不错的结果。

以至于有人都开始怀疑，不会是模型随机吐出来一张训练数据里的真照片吧？

不过放大看一些特定细节，还是很容易看出确实是AI生成的，比如车牌号上的文字都是乱码。

那么是否Flux1.1模型本身能力就很强大，这个技巧在其中起到了多大作用呢？

一位资深修图师傅晒出了对比，左边加了IMG_1018.CR2，对比右边不加的，他认为差别巨大。

我们的实测结果也能看出，加上这个技巧能显著提升画面真实性。

现在想免费试玩这个Flux1.1模型，可以来到together.ai平台，注册即送5美元的积分。

随便生成一张在长城的游客自拍照，乍一看像那么回事，但仔细观察人物皮肤质感、背景山和植物都有还是有一股AI味。

换成“IMG_0314.cr2: selfie on The Great Wall”，是不是立马就不一样了？

01 代号蓝莓，最新SOTA文生图模型
随着FLUX1.1的正式发布，此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下，正是它。

官方不藏了，直接放出数据，在Artificial Analysis image arena上，FLUX1.1 [pro]以“blueberry”为代号，超越所有其它模型，获得最高的整体Elo评分。

相比之下，FLUX1.1 [pro]价格也更低，速度更快，各项指标超越Midjourney、SD3、Ideogram等。

生成速度上，FLUX1.1 [pro]在保持图像质量、指令响应和多样性提升的同时，速度是前代FLUX.1 [pro]的6倍。

顺便提一下，现在FLUX.1 [pro]也进行了更新，速度是之前的2倍，FLUX1.1 [pro]的速度是目前可用的FLUX.1 [pro]的3倍。

此外，官方表示即将推出快速高分辨率生成，FLUX1.1 [pro]可原生支持的那种，在不牺牲任何指令响应情况下，能生成2k图像。

FLUX1.1 [pro]将通过Together.ai 、Replicate 、fal.ai、Freepik等在线平台提供。

同时官方还推出了BFL API，可供其他开发者集成到自己的应用程序中，API定价是：

FLUX.1 [dev]：每张图2.5美分（约RMB 0.18元）

FLUX.1 [pro]：每张图5美分（约RMB 0.35元）

FLUX1.1 [pro]：每张图4美分（约RMB 0.28元）

02 Stable Diffusion原班人马打造
FLUX1.1 [pro]的背后是Stable Diffusion原团队，成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。

△

其实Stable Diffusion最初是一个学术研究项目。

由Bjrn Ommer教授领衔，Robin Rombach、Andreas Blattmann、Dominik Lorenz等几位慕尼黑大学机器视觉与学习研究小组成员，以及Runway的研究人员Patrick Esser完成。

研究论文发表七个月后，Stability AI开始介入，提供计算资源，以进一步开发文本到图像生成模型。2022年，上述几位论文作者加入Stability AI。

团队一同创建了Stable Diffusion XL、Stable Video Diffusion等。

ICML 2024最佳论文之一、Stable Diffusion 3技术论文的Rectified Flow Transformers，还有SDXL-Turbo使用的对抗扩散蒸馏方法（Adversarial Diffusion Distillation），也是这帮子人在研究。

今年三月份这些核心研究团队成员被曝集体辞职。

而后，他们组成了新团队名为Black Forest Labs（黑森林实验室），总部位于德国。

今年8月初刚刚宣布成立，并发布了其初代文生图模型FLUX.1，FLUX.1有三个变体：FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell]，平衡了性能和可访问性。

目前黑森林实验室已完成种子轮融资，共融资3100万美元，Andreessen Horowitz领投，Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。

据说他们还已经收到General Catalyst、MtchVC的后续投资。

黑森林实验室和马斯克还有合作，将其图像生成模型引入xAI的Grok助手中。

接下来，团队透露将推出SOTA级文本到视频生成模型。

据说他们正在以10亿美元的估值筹集1亿美元资金，比之前1.5亿美元的估值大幅上涨。

从Pika 1.5到Meta Movie Gen，今年下半场视频生成赛道爆火，黑森林实验室的加入，或许会带来不一样的火花。

参考链接：

[1]https://x.com/fofrAI/status/1841854401717403944

[2]https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/

[3]https:/techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/

来源：36kr

通信人家园 (https://www.txrjy.com/)