通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  少将

注册:2015-1-2880
跳转到指定楼层
1#
发表于 2024-3-13 15:29:22 |只看该作者 |倒序浏览
·在“可预见的未来”Sora不会被发布,目前的版本仍是一个研究项目,不能在ChatGPT或其他地方使用。“对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。”

OpenAI文生视频大模型Sora不会很快发布。

Sora团队日前在一档播客中接受采访时表示,在“可预见的未来”Sora不会被发布,目前的版本仍是一个研究项目,不能在ChatGPT或其他地方使用。“对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但我们应该如何改进它是一个悬而未决的问题。”OpenAI的Sora项目研究负责人蒂姆·布鲁克斯(Tim Brooks)说。

“要听听安全专家的意见,如何让这项技术对世界更安全。听听艺术家的意见,如何让这项技术在工作流程中发挥作用。”布鲁克斯表示,早期的反馈是,用户希望对视频生成有更多的控制,而不仅仅是文本提示。2月16日,OpenAI推出新的AI大模型Sora,该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。研究人员表示,Sora是在公开可用数据和OpenAI授权数据的组合上进行训练的。目前Sora在生成手部、复杂的物理过程,以及随时间发生的运动或轨迹方面存在局限。

而在Sora生成视频中添加音频并不直接出现在开发路线图上,但这是一种选择。OpenAI的Sora项目负责人比尔·皮布尔斯(Bill Peebles)表示,对于目前的Sora版本,OpenAI聚焦推进视频生产模型的能力,因为在此之前,很多AI生成视频的时长只有4秒,质量也不高。添加音频确实会让AI生成视频更加沉浸式,这是团队考虑的事情,但目前Sora主要是一个视频生成模型。
AI可能会生成与真实视频无法区分的视频。为了遏制虚假的人工智能视频,Sora团队负责人阿迪亚·拉梅什(Aditya Ramesh)表示,OpenAI计划为Sora调整OpenAI图像生成工具DALL-E 3的分类器。图像分类器可以可靠识别图像是否使用DALL-E 3创建。“这本身不是一个完整的解决方案,但可以看作是第一步。”

他们还提到了Sora在创意产业中潜在的革命性作用:通过降低生产成本,Sora可以实现以前由于资金问题而无法实现的创新内容。布鲁克斯表示,“通过创造全新的工具,让有创造力的人推动创意的边界,是非常令人激动的。”

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-5 16:38 , Processed in 0.111235 second(s), 15 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部