通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上尉

注册:2007-10-2911
跳转到指定楼层
1#
发表于 2025-4-11 09:01:05 |只看该作者 |倒序浏览

【导读】刚刚,xAI 正式上线 Grok 3 API,一次性推出4种模型,以适配不同应用场景,定价策略灵活,用户可按需选择。同日,谷歌、Anthropic等也推出新的定价策略。

GenAI竞争,越来越激烈了。

据Similar Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。两者都已经超过50万日活跃用户,差距不足5万。



就在昨天,谷歌面向开发者推出全新套餐体系,其中标准套餐对个人开发者免费开放,可免费使用 Gemini 代码助手。



谈及API价格策略,AI巨头各出奇招:

<ol>
  • Grok-3 推出2款模型,支持2种调用模式,衍生出 4 种定价套餐;
  • Anthropic推出100美元的Max套餐,主打高端服务;
  • 谷歌Gemini 2.5 需付费解锁使用限制,以高性价比吸引用户;
  • Meta开源Llama 3,成本优势显著,平均每百万token仅需0.36 美元 。
    </ol>
    Grok-3:4种模型,各取所需

    xAI,正式向公众开放了Grok 3系列API!

    目前,Grok 3和 Grok 3 Mini均处于Beta测试阶段,支持常规模式与快速模式。


    • Grok 3 适用于企业应用场景,如数据抽取、编程、文本处理等。其价格为:每输入100万token收费3美元,每输出100万token收费15美元。
    • Grok 3 MINI属于轻量级模型,适用于对深度领域知识无需求的简单任务。价格为:每输入100万token收费0.3美元,每输出100万token收费 0.5 美元。



    Grok-3Grok-3-fast使用的是相同的基座模型,提供相同的响应质量。

    它们的区别在于服务方式:Grok-3-fast运行在更快的基础设施上,响应速度显著高于标准版grok-3,但其输出token的成本也更高

    Grok-3grok-3-fast指向的是相同的模型。


    • 如果需要低延迟的应用,选择grok-3-fast
    • 如果想降低成本,可以选择grok-3

    对于grok-3-minigrok-3-mini-fast也是如此。

    它们本质上是相同的模型,唯一的区别是响应延迟。

    可用模型列表:

    grok-3-beta(标准版):输入3美元/百万token,输出15美元/百万token

    grok-3-fast-beta(标准版,快速响应):输入5美元/百万token,输出25美元/百万token

    grok-3-mini-beta(轻量版):输入0.3美元/百万token,输出0.5美元/百万token

    grok-3-mini-fast-beta(轻量版,快速响应):输入0.6美元/百万token,输出4美元/百万token



    在文档中,xAI展示了几个示例。

    比如对话补全,可以流式传输响应,用户向xAI API端点发送请求。

    API处理该请求后返回完整的响应。



    响应:



    AI巨头,各显神通

    Gemini系列模型推出了免费的Gemini 2.5 Pro、 2.0 Flash等最新模型。

    而且除了使用的模型不同,以及部分功能每日请求次数的限制,免费版几乎和付费版没有什么不同



    今天,Anthropic推出了Max套餐:最低100美元,专为那些重度使用Claude并且需要更多使用次数,完成重要工作的用户设计。

    Llama 4 Maverick 相较于平均水平更为便宜,定价为每百万token为0.36美元。

    Llama 4 Maverick输入令牌价格:每百万个令牌0.20美元

    Llama 4 Maverick输出令牌价格:每百万个令牌0.82美元



    在ARC-AGI的半私有评估中,Llama 4 Maverick非常具有性价比:

    - ARC-AGI-1:每个任务只要0.0078美元

    - ARC-AGI-2:每个任务只要0.0121美元



    此前,o3被爆出在ARC-AGI测试中烧3万美元解决一道题,试错1024次!

    参考资料:

    https://x.com/Similarweb/status/1909947139301482768

    https://x.com/testingcatalog/status/1910101992887771342

    https://www.reddit.com/r/singularity/comments/1jvbgea/google_developer_program_plans_pricing/

    https://x.com/arcprize/status/1909659233324548402%20%20

    https://www.anthropic.com/news/max-plan


    来源:36kr
  • 举报本楼

    本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
    您需要登录后才可以回帖 登录 | 注册 |

    版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

    GMT+8, 2025-4-16 03:39 , Processed in 0.161997 second(s), 16 queries , Gzip On.

    Copyright © 1999-2023 C114 All Rights Reserved

    Discuz Licensed

    回顶部