科大讯飞发布四款消费类新品 搭载核心AI转写能力-冯金伟博客园

  9 月 1 日,科大讯飞消费类新品发布会,发布了讯飞智能录音笔 SR901、SR702、SR101,讯飞首款智能 TWS 耳机 iFLYBUDS 四款新品。

  科大讯飞轮值总裁胡郁表示,科大讯飞坚持“To B+To C”双轮驱动战略,让 AI 应用服务大众。秉承着助力用户高效办公、智慧生活的理念,讯飞消费者业务连续三年保持超过 30% 的高增速。随着讯飞智能硬件产品体系不断完善,C端营收占比在 2020 年上半年达 37.59%。在 AI 转写赛道上,我们希望讯飞消费者产品不仅为文字工作者的记录场景赋能,更成为每个人的知识管理工具。

  目前,全新发布的讯飞智能录音笔 SR702、SR101,讯飞智能耳机 iFLYBUDS 已在 9 月 1 日 0 点开启预售,9 月 9 日 0 点在天猫京东等电商平台同步现货开售。而 SR901 将在 9 月下旬开启预售。新品预售期享有不同程度分期免息计划、预定金充抵、赠品等多重优惠,参与预售有机会赢得讯飞智能录音笔 SR301。

  科大讯飞此次发布三款智能录音笔新品,补全了智能录音笔全系列,覆盖了从入门、旗舰再到尊享版全线机型,为不同需求的消费者提供选择。

  讯飞智能录音笔 SR101 是面向职场新人和学生推出的入门级新品,融便携体验、高性价比和智能体验于一身。其拥有星空灰、深海蓝、象牙白三种配色可选,标配 1.4 英寸触摸屏使得转写实时可见,同时搭载 1 颗定向麦克风 +2 颗矩阵麦克风的组合,四核处理芯片,8GB 存储空间和 1500mAh 电池容量,在硬件配置上毫不妥协。SR101 售价 599 元,转写终身免费并享有 3 年 5GB 云空间服务。

科大讯飞发布四款消费类新品 搭载核心AI转写能力-冯金伟博客园

  讯飞智能录音笔 SR702 则是讯飞继 SR701 之后的旗舰之作。SR702 采用星空灰配色,一体设计的 3D 陶瓷背板和航空级铝合金,其采用高密度 2600mAh 大容量电池,搭载 2 颗定向麦克和 6 颗矩阵麦克风,配置 3.5 英寸高清屏幕,并配备 800 万像素数字变焦后置摄像头。

科大讯飞发布四款消费类新品 搭载核心AI转写能力-冯金伟博客园

  而讯飞智能录音笔 SR901 尊享版采用钢琴黑全陶瓷机身,搭载 6.01 英寸 AMOLED 屏幕,64GB 存储空间及 4000mAh 支持 18W 快充大容量聚合物锂电池。讯飞智能录音笔 SR901 拥有豪华三摄配置和 2 颗哈曼 MEMS 定向麦克风 +10 颗全向麦克风。通过全面升级的转写引擎,SR702 和 SR901 搭载了行业首发的离线转写、OCR 图文识别、视频字幕等新功能,再次拓宽了转写记录的易用性和使用场景。SR702 售价 3699 元,SR901 售价 5999 元,两款产品购买随硬件赠送终身免费会员服务,包含转写和翻译服务等,同时自激活之日起,另赠 3 年 20GB 云空间服务。

科大讯飞发布四款消费类新品 搭载核心AI转写能力-冯金伟博客园

  识别方面,讯飞智能录音笔新品语音识别模块采用基于深度全序列卷积神经网络的语音识别框架,识别准确率达 98%;录得远方面,讯飞智能录音笔新品最远拾音距离均可达 15 米;录得清方面,讯飞智能录音笔新品采用 AI 算法降噪处理前端语音信号,保证拾音的准确性,并提供高清无损音质的音频格式;语种全方面,讯飞智能录音笔新品同样支持粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话 12 种方言转写、藏语、维吾尔语 2 种少数民族语言转写、中、英、日、韩、俄、法、越南、西班牙 8 种语言转写和 IT 科技、财经贸易、文化体育、医疗、政法、运营商、教育 7 大专业领域转写优化。同时,中英文混读识别功能也可在转写时自动识别夹杂着中英文的语音内容。

  讯飞智能录音笔 SR901 和 SR702 两款新品在行业率先搭载了离线转写功能。无需 4G/WIFI 网络,用户也能实现语音实时转文字、转写后的文字内容即刻保存,离线转写准确率高达 95%,无惧断网环境。同时离线转写也防止了高度机密信息的泄露,保障了用户信息安全和特有转写需求的实现。同时,通过 SR901 和 SR702 的摄像头可将图片上的文字内容提取出来并实时呈现,便于用户实现重要音频和图文信息的混合记录,用于后期记录及整理。同时,这两款新品还支持录制视频、实时收音并实时生成字幕,同时后期也可编辑字幕,打造多场景重要信息记录的全新 AI 交互体验。

  在讯飞智能录音笔前端降噪处理上,通过讯飞原创神经网络与传统信号处理深度结合的降噪算法(SSA-IME),可以有效降低环境干扰噪声,并有效消除干扰说话人的声音,从而大幅降低语音识别的处理难度。在无喇叭的情况下3-10 米远距离提升相对 30%,有喇叭的情况超远距离(20-50m)演讲场景效果达到 90% 以上。而为了满足用户快速出稿的需求,讯飞大力投入语音识别后处理技术并运用到讯飞智能录音笔上,先后上线语气过滤词、口语规整、文本语义分段、文本智能摘要等文本理解能力。针对多人交谈会议场景,上线了分离与 ASR 联合建模的说话人分离方案,说话人分离的准确率达到 95% 让用户能够快速检索到目标说话人数据,提升编辑体验。

  与讯飞智能录音笔三款新品同时发布的还有讯飞首款 TWS 智能耳机 iFLYBUDS。凭借通话实时转写、智能拨号识别、通话译文对照三大核心 AI 功能,能够轻松满足商务人士在自驾、通勤、会议等多场景中,解放双手、重要信息记录和从容沟通的需求。

  讯飞智能耳机 iFLYBUDS 采用珍珠白配色,弧形美学设计,耳机单只仅重 4.6g,半入耳仿生设计,持久佩戴也舒适。该设备搭载旗舰级芯片,保证了连接的稳定性和超低延迟。此外,iFLYBUDS 还拥有悦耳音质,通过智能降噪在机场、健身房等嘈杂环境也能带来清晰流畅的通话体验。iFLYBUDS 支持智能语音助手,只要说“小飞小飞”即可快速唤醒语音助手。同时 iFLYBUDS 的特点还包括:支持轻击耳机交互,并且支持自定义功能;佩戴检测,摘下耳机时暂停播放,再次戴上音乐继续。不仅如此,讯飞智能耳机 iFLYBUDS 续航可以满足日常商务沟通。

科大讯飞发布四款消费类新品 搭载核心AI转写能力-冯金伟博客园

  讯飞智能耳机 iFLYBUDS 的核心功能之一通话实时转写支持常规电话和网络电话(微信语音、腾讯会议、钉钉语音、Skype、Zoom 等),随时随地可以接听网络电话会议。且对于多人会议还支持自动区分讲话人,查找通话内容更加方便。通话开始时一键录音,通话过程转成文字,转写准确率在 98% 以上。而在通话结束后可以形成智能摘要,自动提炼重点内容,还支持对通话内容进行快速查找、多终端分享(手机端和电脑端)和编辑。

  智能拨号识别则让讯飞智能耳机 iFLYBUDS 解决了商务人士的通讯录里联系人繁多,并且多重名、同音联系人的痛点,针对拨号对象重名、同音等情况,iFLYBUDS 可通过多种方式区分,例如章子怡的章、立早章;归属地名称区分,例如北京的李总、科大讯飞的李总。避免复杂查找,拨号效率成倍提升。与 Siri 等语音助手相比,iFLYBUDS 的语音拨号功能专注拨号,更智能、精准,具备明显的优势:说法更自然,只说姓名即可拨号;纯语音交互,无需看屏;一句搞定,避免重复。

  而在外语电话交流场景中,面对行业术语、俚语等生僻的专业词汇,经常会遇到语言沟通障碍,针对这一点,iFLYBUDS 专为商务人士打造的核心功能之三就是通话译文对照。它在英语通话时,可将通话内容实时转译为汉字,辅助英语沟通,是你耳朵上的助理翻译官,沟通更加自信、简单,未来将会支持更多的语种。在发布会现场,科大讯飞副总裁李传刚表示“技术革新与消费升级双轮驱动,将出现巨大的颠覆式创新机会,并催生新的领导品牌。