通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  一级军士长

注册:2010-4-284
跳转到指定楼层
1#
发表于 2024-10-21 17:03:43 |只看该作者 |倒序浏览
被称为“AI六小虎”的6家中国大模型独角兽中,已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。

——智能涌现
近日,一篇名为《大模型「六小虎」里,至少两家要放弃大模型了|智涌分析》的文章在科技媒体圈引起了轩然大波,其文中清晰的指出,在资金、算力、技术的重压之下多家初创公司不得不对自身的发展路径重新思考。

文章中虽然没有明确的指出哪两家的,但也让人不自主地开始对号入座,甚至引得零一万物CEO李开复亲自下场回应。这种回应不止在书面上,在行动上,10月16日,零一万物正式对外发布新旗舰模型Yi-Lightning。



大模型的研发和运行确实需要大规模的资源和资金支持,非小规模团队能够轻易承担。这一点在当前的人工智能领域尤为明显。以GPT4-o为例,其训练涉及了文本、视觉和音频等多种数据模态,这意味着它需要处理和分析的数据量是巨大的。

据OpenAI透露,GPT-4o在训练过程中使用了多达13兆的数据,这比之前的一些大型模型如LLAMA和PaLM使用的数据量还要多。此外,GPT-4o的模型参数数量也非常庞大,达到了1.8万亿。

几天前,OpenAI在其官方网站上宣布,已成功筹集到66亿美元(约合人民币466.9亿元)的资金。此轮融资完成后,OpenAI的估值超过了1500亿美元。尽管66亿美元并非一个小数字,但对于OpenAI而言,这仅相当于一年多的亏损额。据OpenAI预测,今年的营业收入将达到37亿美元,而亏损额则为50亿美元。

种种迹象表明,对于小规模团队甚至是行业新星来说,如果没有足够的资金支持,要独立完成像GPT-4这样的大型模型的研发和部署是非常困难的。

赋能与反噬并行,AI甚至要考虑能源

金沙江创投主管合伙人朱啸虎曾表示,国内“AI六小虎”最好的结果就是卖给大厂,但是在国内来说,你到底有没有一些额外的人才是大厂没有的?这是每个投资人都要思考的问题,大厂会不会为了这些人才花这么多钱去并购?

实际上,不单单是OpenAI或国内创业公司,在面对AI增速带来的焦虑,海外的大厂同样有着相同的境遇。

谷歌就在近日签署了一项协议,与核初创公司Kairos Power签署了一项协议,建造七个小型核反应堆,为其数据中心供电。该协议承诺在数据中心和人工智能的能源需求激增的时候增加约500兆瓦的无碳电力。



据谷歌消息,新发电厂计划在十年内上线。目前还不清楚反应堆是否会直接连接到谷歌的站点。AI技术的迅猛发展和大规模应用导致了数据中心的电力需求急剧增加。AI模型的训练和运行需要大量的计算资源,这直接转化为对电力的高需求。传统的可再生能源如风能和太阳能虽然清洁,但其间歇性和不稳定性使其难以完全满足数据中心24/7不间断运行的需求。

除谷歌与Kairos Power的合作外,微软重启三哩岛核电站,以及亚马逊在宾夕法尼亚州的核电数据中心项目,都显示出海外巨头在应对能源需求和环境责任方面的双重压力。核能提供了持续、可靠的电力供应,能够支持AI技术的长时间高负荷运行,同时减少碳排放,符合全球可持续发展的趋势。

聚焦国内,在各种多模态产品爆火之时,百度创始人李彦宏在全员邮件中提到,百度不碰Sora类的视频生成,“10年、20年都可能难以商业化应用”。

他也指出,ToB业务尽量不碰吃力不讨好的项目制,尽量推出标准化产品。而文心一言改名后的ToC新搜索应用“文小言”,在推广上则不会像字节跳动的豆包、月之暗面的Kimi那样激进。

对此我们也不难看出,在大模型发展的最蓬勃之时,行业内更多充斥着理性的气息,而非盲目的追逐和扩张。企业开始更加注重技术的实际应用价值、商业可行性和长期可持续性。这种理性态度的形成,一方面源于对市场和技术发展规律的深刻理解,另一方面也反映了企业在面对激烈竞争时的策略调整和风险控制意识。

诺贝尔为AI提振,赛道重于规模



在今年的诺贝尔奖颁奖典礼上,物理学和化学领域的奖项均授予了与人工智能相关的科学家。尽管这些奖项引发了广泛的讨论和争议,但它们无疑凸显了AI在科学研究中的不可或缺的作用。AI在科研领域的应用主要体现在显著提高工作效率和解决复杂问题上,这充分展现了AI在应对特定挑战时的强大能力。

从预训练模型的规模观察,全球科技巨头正竞相增加模型的参数量。然而,类似2023年的参数规模竞赛已成过往,尽管模型规模仍在增长,但增速已明显放缓,这背后反映了数据、算力等多方面资源的压力与限制。

9月13日,OpenAI正式发布了其全新AI模型“OpenAI o1”。采用了Self-play RL(自我博弈强化学习)技术,这一技术使得o1能够自我学习、反思并纠正错误,同时能够将复杂问题分解为更易处理的步骤。

而在更早些时候,360便提出了CoE(Collaboration of Experts,专家协同)架构。基于“类脑分区协同”的原理,CoE架构能够整合多个大模型与专家模型,形成一个强大的协作网络,可根据任务阶段,调动各功能中枢协同工作。

在今年双十一的预热阶段,京东呈现了言犀视频大模型的最新研发成果。与以往的应用方向不同,言犀大模型此次更侧重于为商家提供服务,旨在增强卖家的视频内容生产能力,而非直接面向C端用户的内容创作,最终成为推动服务产业升级的生产力工具。



大模型之家认为,未来人工智能的发展应该更加注重赛道的选择和实际应用的落地,以实现技术与产业的共同发展和进步。在AI技术发展的征途上,规模的扩张固然扮演着举足轻重的角色,它为技术的突破和创新提供了坚实的基础和广阔的舞台。然而,在这股追求规模的热潮中,我们不应忽视一个更为关键的命题:如何将这些前沿的技术成果应用于实际场景之中,真正解决现实世界中的问题和挑战。

AI的价值远不止于其模型参数量的庞大或计算能力的强悍,而更在于它能够在特定领域发挥的实际应用和贡献。无论是医疗健康、教育培训,还是智能制造、环境保护,AI技术的真正意义在于它如何帮助我们提高效率、降低成本、改善体验,乃至创造全新的价值和可能性。


来源:36kr

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-25 08:09 , Processed in 0.160587 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部