科大讯飞 语音突围-冯金伟博客园

  一个人在短短 5 分钟不到的时间内,先后模仿了单田芳、林志玲、罗永浩的声音,效果足以以假乱真,这一幕就真实地发生在科大讯飞 2019 新品发布会现场。

  科大讯飞董事长刘庆峰利用语音“变声器”技术,在一代评书大师和明星、企业家之间自如转换身份。

  他的现场演讲内容,更是通过会场内的 6 幅吊屏,实时翻译成维、藏、中、英、日、韩、法、西、葡萄牙、阿拉伯、泰、俄等 12 种语言登出,大屏幕两侧还有利用讯飞听见技术设置的中英文实时转写翻译文字屏幕;没到现场的用户,还能接收到科大讯飞多语种 AI 虚拟主播“小晴”9 种语言的全球同步直播。

  成立距今 20 年的科大讯飞,已经做到了中文语音识别全世界第一,英文语音识别全世界第一,并在俄罗斯语、印地语等方面达到全球领先水平。

  但现在的科大讯飞,早已不满足于 AI 语音一哥的身份这么简单,在图像识别和万物互联新时代,也有着一番新规划。

  过去的 2018 年,科大讯飞在 AI 核心技术突破上,实现了两大里程碑式的跨越:机器翻译首次达到专业译员水平;机器阅读理解首次超越人类平均水平。

  AI 源头核心技术的突破,助推了科大讯飞的C端发力。会上,科大讯飞一连发布了讯飞翻译机 3.0、讯飞转写机、讯飞智能录音笔、讯飞智能办公本、讯飞学习机 X1 Pro 五大硬件新品。

  从技术提供商转向产品提供商

  会后媒体采访中,科大讯飞轮值总裁胡郁如此定位公司:我们不是一个技术服务的提供商,我们是一家创新型的 IT 企业。

  胡郁将一个公司的核心创新能力分为三部分,包括源头核心技术,产品创新,和商业模式创新。最终,“能够为企业真正创造价值的,是你能不能在 To C 的用户心里面,形成你的一个用户认知。因为没有一个用户会因为你的技术来产生这方面的认知的。”胡郁解释,这就是科大讯飞发力C端的重要原因。

  同时,科大讯飞也是看到了C端潜在的利润空间和更广泛的市场规模。

  胡郁谈到,现在已经不能再把科大讯飞视为是一个技术提供商。未来的科大讯飞,将利用技术不断进步的 AI,让沟通因 AI 而能,让办公因 AI 而能,让学习因 AI 而能,最终能够让每个人的未来因 AI 而能。

  技术落地C端用户

科大讯飞 语音突围-冯金伟博客园

  讯飞翻译机 3.0 进行了三大升级:新一代的语音翻译;新一代的离线内核;拍照翻译的系统性升级。同时它还支持普通话与中国四大方言(粤语、东北话、河南话、四川话)之间的翻译,并新增维汉、藏汉等民族语言翻译。最终达到的效果是,中英文的识别率超过 95%,0.5 秒就可以完成一次翻译任务。讯飞翻译机 3.0 售价 3499 元。

  讯飞转写机,简单说就是一台 AI 办公时代的语音转写移动工作站。在中英文会议上,它能够直接输出中文文字和实时的英文翻译,并支持对讲话者中英文夹杂的语音进行实时转写。1 小时会议内容,5 分钟出稿。同时,它还首创“语音+图像”同步智能识别功能,可以将专业名词错误率下降 50%。

  讯飞智能录音笔,最大的特点是支持录音转文字,1 小时录音,5 分钟成稿,识别准确率高达 98%。同时,它还支持重要内容标记、语音搜索。通过 4G、WiFi 方式连接网络,它还能够实现录音文本的快速分享。旗舰版 SR 701 售价 2999 元,标准版 SR501 售价 1999 元。

  讯飞智能办公本,彻底解决了纸质笔记记不全、找不到、容易丢等难题。它的存储容量,相当于 2000 本纸质笔记本的内容,只需一个指令,就能轻松查找笔记。同时,它还支持电子书阅读、收发邮件等。讯飞智能办公本售价 4999 元。

  讯飞学习机 X1 Pro,能够减少学生 60% 无效练习。它可以对数理化进行精准学习并提升效率;也可以综合提升英语听说读写能力。此外,它还内置名师视频、拍照搜题、同步练习、历年真题试卷等功能,售价 3999 元。

  AIoT 时代的科大讯飞

  面对物联网所带来的个性化、差异化、拟人化的智能硬件需求,科大讯飞早在 2010 年就尝试推出了第一个中文语音开放平台——讯飞“语音云”。2018 年,推出基于云端的智能物联网操作系统 iFLYOS。

  该系统集合讯飞 19 年来的语音技术研究,为第三方智能设备提供以语音为主要交互方式的软硬一体化解决方案,快速实现语音交互能力,为硬件智能化创造更大的想象空间。

  截至目前,iFLYOS 连接的智能手机数超过了 4 亿,连接的车载终端数达到 3800 万,智能电视机、智能机顶盒的激活量达到 1400 万,机器人玩具数 500 万。

科大讯飞 语音突围-冯金伟博客园

  会上,胡郁介绍了全新升级的 iFLYOS 2.0,它是一款将 AIUI 与 iFLYOS 融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的A.I. Agent(智能物联网操作系统),应用场景涵盖车载、智能家居、手机、玩具、穿戴式设备…. 触达用户生活中的方方面面。

  iFLYOS 2.0 具备 “人性化交互”、“深度自定义”、“端到端集成”、“高效率开发”四大特点。据胡郁介绍,借助 iFLYOS 2.0 平台,原来需要6-12 个月开发周期的智能语音应用,现在只需要 5 天就可以完成。

  AI 进入应用红利兑现年

  外界有部分声音在质疑人工智能,包括科大讯飞,认为很多 AI 企业并没有很强的核心技术,甚至很多东西都在忽悠人。

  胡郁在采访中表示,科大讯飞其实跟华为有一些基因上的类似特点:都是那种板凳能做 10 年冷的企业。

  10 年磨一剑。如今,磨了 20 年的科大讯飞究竟如何?

  刘庆峰讲到,2019 年,将是人工智能规模化应用落地元年,“AI 将在今年开始进入应用红利兑现年”。

科大讯飞 语音突围-冯金伟博客园

  刘庆峰给出了 AI 技术价值兑现的三大判断标准:真实可见的实际应用案例、能规模化应用的核心产品、能够统计数据的应用成效。科大讯飞,将因 AI 而能。

  未来属于“人机耦合”的新时代,刘庆峰预测,“谁能将技术与行业深度耦合形成自我迭代,谁就是第三次浪潮红利兑现过程中的最终赢家!”