2025年,被业界认为是大模型推理爆发年。大模型厂商们在开年便祭出“王炸”,1月15日,科大讯飞发布全国产算力平台上的深度推理大模型——讯飞星火X1,尚属业界首个。该模型中文数学能力国内第一,已率先落地教育、医疗等刚需场景。
全面对标OpenAI最新版GPT-4o的讯飞星火4.0 Turbo底座能力再次升级,首发混域知识搜索技术。作为2024年中标数量和中标金额“双第一”的大模型,在一定程度上,讯飞星火的研发方向揭示了行业和企业的大模型落地痛点。
而讯飞的看家本领是翻译,此次科大讯飞还推出业界首个具备端到端语音导语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒,这意味着大模型在向翻译领域最高难度挑战时迈出了一大步。
科大讯飞一直走全国产化路线,与华为深度合作,2023年10月24日,双方联合发布首个国产万卡算力集群“飞星一号”。2024年10月24日,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
此前科大讯飞与华为组成“特攻队”,持续攻坚很多大模型在全国产算力平台上的训练推理挑战。最近,双方成功攻克训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。
这给2025年推理年的爆发踩了加速油门,但深度推理大模型跟通用大模型有何不同?从科大讯飞展示来看,讯飞星火X1在解答高考题、AIME竞赛题以及高中奥赛题的表现较为突出,不仅准确给出了题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。
通用大模型能力虽强,但是所耗费的算力成本过高,在某些领域,深度推理大模型能用更少的算力取得同等的效果。讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,拿下了多项指标国内第一。
coffee198375 发表于 2025-1-17 23:46
您真落后。。。。
通信人家园 (https://www.txrjy.com/) | Powered by C114 |