根据国家统计局的数据显示,截至2023年,我国残疾人人口达8591.4万。随着科技助残政策的进一步推行,以及前沿科技的迅猛发展,利好残障人士的高科技产品也不断问世。脑机接口技术、智能假肢、智能AR眼镜、外骨骼机器人……,这些前沿产品正逐渐重塑着残障人士的生活,为他们逐步打造出一个“有爱无碍”的世界。在今年的科技助残平行论坛上,科大讯飞的智能语音交互技术也入选了科技助残创新案例,为助残事业注入了更新鲜的活力。那么科大讯飞智能语音交互技术具体是什么?一起跟着福祉君来看看吧!
此外,在今年的9月12日-14日,2025中国国际福祉博览会暨中国国际康复博览会(CR EXPO)将在北京国家会议中心举行,科大讯飞爱博智能也将在本届福祉博览会上展示最新人工智能辅具产品,欢迎提前扫码登记,体验更多前沿科技产品!
科大讯飞智能语音交互技术,主要是基于科大讯飞全自研国产语音大模型,集成语音转写、合成等关键技术,可广泛应用于听障群体的无障碍沟通与交流。
语音能力作为科大讯飞的领先优势,去年年初科大讯飞便在星火大模型V3.5的更新中,首次对外发布了星火语音大模型,对于37种主流语种的语音识别效果已超过OpenAI Whisper V3。在后续的星火大模型V4.0发布会上。除了之前已有的37个主流语种,还新增了37种方言,这代表着使用者可以多语种和方言随意切换。
同时,在今年1月,在讯飞星火大模型升级发布会现场,现场发布了目前全国产算力平台上唯一的深度推理模型——讯飞星火X1。该模型的中文和数学能力都在国内处于领先地位。此外,首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型也在现场同期发布,据悉,该模型最快语音同传时延小于5秒。
除了上述提到的星火语音大模型,科大讯飞的语音识别与合成技术也是其智能语音交互技术的重要支撑。
根据相关资料显示,讯飞语音识别技术可将短音频(≤60秒)精准识别成文字,同时能支持多语种的自动判别,其中包括语音转写等功能,可满足使用者不同时长音频的转文字需求,识别率较高。以科大讯飞推出的智能语音识别与转写软件“讯飞听见”为例,其能将语音内容实时转为文字,同时支持多语言自动识别,可广泛应用在会议、教学、面对面交流等场景,众多听障人士也能利用该软件进行语音识别与转写,从而实现与健听人士的无障碍沟通。
同时,讯飞语音合成技术(TTS)也是智能语音交互技术的重要基石。今年6月,科大讯飞宣布其语音合成技术实现了关键性的突破,“一句话声音复刻”与“超拟人语音合成”两项能力取得重大升级。此前,讯飞星火APP上线了“一句话声音复刻”功能,并在业界和客户中取得了较好的评价,在今年升级完成后, AI可在仅一句语音录音的基础上,复刻用户完整音色、语气与情绪起伏,效果更逼近真人。
基于讯飞自研的星火语音大模型的迭代升级以及最新构建的三阶段层次化语音建模框架,讯飞语音合成技术在音色恢复方面,不仅通过融合帧级音色编码与声纹语义一致性损失函数,进一步提升了合成音频的相似度与自然度,同时结合DPO强化学习策略,强化了所合成语音的流畅性。目前,蔚来汽车已在新车型中应用了讯飞“超拟人情感语音系统”。
为了能在复杂环境下也能实现语音识别与转写,同时达到无障碍沟通的目的,讯飞抗干扰技术也已达到国际领先地位,可成功完成在极复杂场景的语音转写。讯飞推出的麦克风阵列技术和降噪算法以及噪音鲁棒性技术都能显著进行抗干扰,从而实现多重叠复杂环境下的语音转写。
在今年的2025中关村论坛年会科技助残平行论坛上,科大讯飞的智能语音交互技术已入选2025科技助残创新案例。同时,科大讯飞也与中国残联签署了合作协议,将共建通用人工智能助残联合实验室。目前,以“讯飞听见”APP为例,2019年,科大讯飞联合中国聋人协会、中国残疾人艺术团发起“听见AI的声音”关爱听障人士公益行动,使用“讯飞听见”APP,将实时语音转化成文字,从而帮助听障人士更好地与他人交流。截至目前,“听见AI的声音”公益行动已累计为听障人士提供超2亿分钟的免费转写服务。
此外,科大讯飞子公司讯飞爱博智能推出的无障碍AI交流屏也是科技助残的有力产品。该产品集成多语种识别翻译、星火大模型和多模态降噪技术,具备多语种识别翻译、手写输入等功能,能帮助听障人士实现面对面的与人交流。
目前,科大讯飞的智能语音交互技术也已应用在公共服务领域,例如政府部门、机场、商业中心等。科大讯飞的智能语音客服系统在接入政务热线后,可实现7×24小时在线值守,能够迅速反馈并解决民众咨询的问题,实现迅速响应。
不仅如此。科大讯飞的无障碍AI交流屏也已在北京首都国际机场、大兴机场、成都春熙路商圈IFS、曼谷高端购物中心Siam Paragon和ICONSIAM等投入使用,可为不用国籍的旅客提供更为方便的服务。
此外,科大讯飞的智能语音交互技术也在特殊教育领域有较大应用前景。此前,科大讯飞为全国80多所特殊教育学校提供了技术和产品,为特殊教育学校师生的课堂效率等提供了较大助力。
智能语音交互技术等更多助残科技,正帮助许多残疾人和老年人改善生活。目前程天、大艾、强脑、科大讯飞爱博智能等科技品牌企业,已确认参加2025中国国际福祉博览会。作为助残科技成果展示推广与落地转化的重要平台,中国国际福祉博览会将于2025年9月12-14日在北京国家会议中心举行。本届展会将特设“创研汇”科技助残专区及品牌展示区,为企业、高校及科研院所提供科技创新产品的首发平台,并推动科技成果转化及落地应用。
目前,组委会正在征集科技助残创新成果、技术应用、产品和服务案例展示及发布,我们诚挚邀请人工智能、脑机接口、信息无障碍、智能假肢与康复机器人、感知辅助技术、VR/AR、仿生、神经调控等领域助残创新相关领域的高校、科研院所、企业、服务机构及相关单位报名参与,共同推动科技助残及残疾人事业的发展,让科技的温度惠及更多有需要的人群。欢迎感兴趣的朋友扫码报名参与此次征集活动→征集通知 | 2025中国国际福祉博览会科技助残创新成果展示交流活动
资料来源:中国残联公众号、中国残联公众号、机器之心公众号、科大讯飞集团公众号、科大讯飞官网、信息化教学创新公众号、讯飞产业加速中心公众号、蓝鲸新闻等