通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  三级军士长

注册:2015-11-141
跳转到指定楼层
1#
发表于 2024-10-28 19:23:00 |只看该作者 |倒序浏览





智东西(公众号:zhidxcom)

作者| 程茜

编辑| 漠影

智东西10月28日报道,讯飞输入法又上新,这次是端侧大模型重塑版!

科大讯飞的大模型底座上周官宣更新,讯飞星火4.0 Turbo七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中拿下9项第一。

在此之上,搭载着讯飞星火端侧输入大模型、讯飞星火语音大模型的讯飞输入法14.0亮相,再次让人眼前一亮。

讯飞输入法14.0的”AI输入增强“可以直接让输入法“猜你喜欢”,输入上句就能秒出下句,聊天气、游玩计划都不在话下;在大模型的加持下,输入法方言语音输入即将支持多达202种;为了更契合生成式AI输入,输入法的界面升级活力视界2.0,除了各种功能卡片、切换动效一应俱全,个性皮肤设置也让视觉焕新;还有横贯娱乐、生活、工作等各大场景的AI助手。

这一被大模型重塑的讯飞输入法14.0,提出的“每个人的AI输入”价值主张,已经清晰呈现在大众视野中,让所有人都能享受AI输入服务的可能成为了现实。

可以看到,大模型应用时代,这一历经40多年发展原先只用于打字的输入法,已经在作为用户日常工作、生活、娱乐必备交互工具这件事上更胜一筹。

在大模型走向落地应用深水区的同时,现在小小的AI原生应用层出不穷,但像输入法这样与用户日常生活连接如此紧密,又能在不同界面随时调用AI能力的产品并不多。

但如果输入法直接与大模型简单粗暴的相接,只能解决助力表达的一环,但新的问题又接踵而至。首先云端大模型输入服务成本高,其次用户对生成内容的多样化需求难以被紧凑的键盘界面满足,还有通用模型难以解决用户垂域沟通场景的体验,这些都是当前AI为名的输入法亟需解决的难题。

那么,在AI席卷我们日常生活的当下,讯飞输入法针对于上述痛点的思考是什么?输入法如何潜移默化影响我们的日常表达?看完讯飞输入法14.0的全面重构,我们或许可以找到答案。

一、输入法也能“猜你喜欢”,输入中前后三大场景帮你秒回消息

现在不论是听音乐、购物、点外卖…………“AI输入增强”经常能猜中我的内心想法。你有没有想过在聊天中,也能有一位24小时随时待命“猜你喜欢”的互联网嘴替?

这就是讯飞输入法14.0重磅更新的本地AI化的“联想”和“预测”功能。不过,这可并非此前输入法中预埋的根据上文猜词功能。在讯飞星火端侧输入大模型的加持下,我有时候只需要一句话,输入法上就会自动生成下文的完整回答。

先来聊一下最近大家都关心的天气。

当我向聊天对象发出“今天好冷啊”,讯飞输入法上方的输入框就能自动帮我接上下一句,“多穿点衣服”、“不要着凉了”,不仅省下了输入的时间,还能给我一些聊天灵感。



聊天气、聊周末安排时,这些直接出现的短句都深得我心。

除了直接给出关联句子,这一输入法还能根据用户的关键词进行“私人订制”回复。

当我打出“我想周末去公园”,输入法就可以自动帮你联想到去公园需要天气好的时候,所以当打出“天气”,输入法就会自动补齐句子。



晚上极度疲惫想要和朋友快速结束对话,当你打出“我要早点睡”,讯飞输入法上方就直接出现“明天要上班”的表达,这时候你就可以心安理得抛下手机进入梦乡。



还有一种场景是,在下雨天手拿雨伞的你本来打字就不方便,当你和聊天对象输入“今天下雨了”,下半句话只要输入“jide”的拼音,就可以直接生成“记得带伞”的回复。



在增强联想的场景中,只要你给出一个情境,讯飞输入法就能帮你补齐下文。

例如想和朋友讨论周末出去玩的计划,当你输入“我想去公园散步”,输入“享受”,讯飞输入法就可以秒懂你的想法,直接给出“享受大自然,放松心情”,消除AI机械化、硬生生的联想。



讯飞输入法的升级,能根据用户输入的拼音或者开头关键词,然后结合其日常输入习惯联想甚至预测出一些完整的句子。

除了打字输入,现在语音输入的使用场景也越来越多。基于端侧大模型的泛化能力,离线状态下讯飞输入法的识别能力也直线up,识别准确率基本持平云端语音输入效果。

讯飞输入法业务部总经理程坤补充道,这一离线语音识别的功能可以让用户网络不好时,也能实现完整输入体验。为了做到这一点,他们用大模型将离线语音功能重写,他认为,这也是未来针对用户做个性化输入的基础,能结合用户的本地输入习惯。这意味着,离线的语音输入不仅仅是在线语音输入的补充,而是有可能成为用户使用日常语音输入的风向标。

无独有偶,谷歌、苹果、OpenAI等国际巨头科技公司正不遗余力强化语音识别能力,提高其识别的准确率和响应速度。

而在中文语音识别这件事上,讯飞输入法不断加码。自2010年发布以来,讯飞输入法已经迭代了14年。此次,讯飞输入法14.0接入讯飞星火语音大模型,将使得方言识别种类倍增,可覆盖近300座城市。据悉,讯飞输入法将在“方言免切换”中支持202种方言自由说,让每个人都能“想说就说”。这与科大讯飞在1024开发者节上发布的星火大模型的底座能力一脉相承。



在方言免切换的功能中,即使两个聊天对象一个说方言一个说普通话,或者两个人说不同的方言,也无需手动切换。当我播放了一段北京话和中原官话夹杂的方言音频,讯飞输入法也准确识别了出来。



二、上万个AI人设,帮你分分钟化身网络显眼包

当然大模型赋能的输入法能力远不止于此,更新后的讯飞输入法还能让AI直接横跨你的工作、生活、娱乐社交圈。

与上司沟通、恋爱、斗图、翻译、校对……形形色色的场景都能让你在输入法中找到对应的AI助手。

对于我而言,社交场景中最头疼的就是工作相关的沟通环节,既需要准确传达自己的意思,还要把握好和同事、客户沟通的方式。

所以讯飞输入法的AI助手中,我高频使用的就是“高情商沟通”助手。

当与同事合作完成一个项目,但项目DDL就在明天,僵硬的催促可能不是沟通的好办法。这时候你只需要点击高情商沟通,选择沟通对象以及想要的风格,讯飞输入法就直接生成了5种回复方式,语气词、关键信息应有尽有。



还有更为考验情商的一个场景就是,你需要通知大家今晚加班,这时候你只需要将“今天晚上需要加班”这几个字打出来,AI助手就能对应生成风趣幽默、高情商、简单直接等话术,你直接点击发送,无需再头痛斟酌每一个字词。



当下的网络上的年轻人都喜欢立人设,“人设立得好”等相关话题也颇有热度!

讯飞输入法直接将这些人设一股脑搬到了输入法的AI助手里,不仅有霸道总裁、黛玉文学、大胖橘,还有乌萨奇等,想要立什么样的人设,AI都能帮你用“同款”风格进行聊天。程坤透露,短短一个多月时间,讯飞输入法中官方加用户创建的人设已经达到1万多个。

作为甄嬛传深度爱好者,我主要试用了“嬛言嬛语”,即使面对现代色彩浓厚的“我好困,想喝咖啡”,AI助手也非常忠于人设,直接穿越到了古代。



此外,除了面向C端消费者提供丰富的AI助手,针对于企业,讯飞输入法也提供了领域定制化的AI助手,能根据企业所属的行业、具体的需求,让输入更能深入其中,帮助企业员工提质增效。如今,讯飞输入法已经与友邦保险联合定制了AI营销助手,提供了一整套智能化的解决方案。

把大模型装进输入法的最新形态已经被展现在我们的日常生活中。值得一提的是,讯飞输入法的AI能力并不局限与当前,其创新采用了全新的AI插件化引擎构架,使得输入法可以灵活拓展多种AI模型,能实现广泛覆盖、智能融合,让本地化的AI输入呈现给更多的用户。

三、让输入更准确、更高效、更懂用户,大模型+输入的更优解

讯飞输入法正在全方位重塑中文输入法。这除了体现在上述提到的功能升级,讯飞输入法还在输入界面以及用户的交互上进行了自我革新。

为了让生成式AI与用户的输入更加契合,讯飞输入法的活力视界2.0再一次亮眼的表现。程坤谈道,活力视界2.0为输入法中的每种服务都单独设计了卡片,并跟其本身的功能进行了深度结合。



同时,用户在选择不同功能时中间有动效切换并完成了和所有输入法皮肤的适配。

程坤认为,输入法界面的重新设计,是未来输入法提供输入文字之外更广泛能力必须要走的一步。

在这个趋势下,讯飞输入法一直走在行业前面,正如其此前率先将传统输入法的候选栏变为工具栏,从只有备选文字变为拥有语音输入等更多切换按钮。

基于这种模式,讯飞输入法集成了很多服务,覆盖了用户输入前、中、后三大场景。

输入法作为用户使用电子设备时调用频率最高的,也是与用户距离最近的服务,相比于其他AI产品而言与用户的交互也更为密切、深入。

不过,这背后程坤提到,他们遇到的难题就是,大模型训练、推理成本高,在高频输入场景为用户提供大模型能力,对于输入法本身而言并不是提供AI服务最好的路径,因此要找到一个平衡点,让所有用户都能用上大模型同时成本降下来。

在输入法领域已经积累14年之久的科大讯飞,交出了自己的答卷。

从2010年发布业内首个中文语音输入法,到方言语音输入、多方言多语种免切换输入,讯飞输入法不断突破高效输入、降低输入门槛这两件事的极限,在生成式AI输入法上同样如此。



▲讯飞输入法业务部总经理程坤

基于星火大模型,他们结合讯飞输入法的输入场景训练出了端侧大模型,这个大模型解决了输入过程、输入上屏以及输入完成之后,下一句话如何联想的过程。

在大模型参数不再追求庞大的参数,手机性能提升同时垂直领域大模型应用兴起的背景下,端侧大模型部署成为可能,这使得输入法与端侧大模型的结合多了更多可能性和创新空间。

多年布局之下,讯飞输入法已经贯穿不同设备、不同输入场景、不同用户群体的个性化需求,再辅以大模型时代的生成式AI技术,将这一产品打造的更准确、更高效、更懂用户。

结语:14年技术积累,致力于打造每个人的AI输入

输入法与大模型的结合与其他产品不同,既需要符合用户传统的使用习惯,还要将新的AI能力融入其中。输入法是用户日常使用频率极高的工具,人们在长期使用过程中形成特定的操作习惯和预期,同时,大模型具有强大的语言理解、生成和预测等能力,将这些融入输入法需要精心设计,不能简单地堆砌功能。而恰好,科大讯飞在技术研发和产品落地的耕耘已久。

在讯飞星火大模型底座之上,讯飞输入法搭载了讯飞星火端侧输入大模型,全力支撑输入法的拼音和离线语音输入,同时基于讯飞星火语音大模型云端能力的快速迭代用于提升方言输入种类和效果,将通用大模型与垂域小模型的能力充分体现到用户的输入过程之中,真正实现AI的交互体验升级。

讯飞输入法发展至今已经14年时间,且星火大模型自去年起就成绩颇丰。可以看到,讯飞输入法已经在端侧大模型时代努力打造普惠的属于“每个人的AI输入”。

来源:智东西

举报本楼

本帖有 4 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-22 05:39 , Processed in 0.205691 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部