第三媒体软件中心软件网络资讯软件资讯 → 捷通华声: 灵云语音质检系统 深度神经网络的新应用 TTL

捷通华声: 灵云语音质检系统 深度神经网络的新应用

上传:星际打工     来源:信息存储服务     日期:2014-03-21

[摘要]  
   前言:深度神经网络(DNN)是近几年在工业界和学术界新型的一个机器学习领域的热点话题。DNN算法成功的将以往的智能识别率提高了一个显著的档次,可以极大地提高图像、语音识别的准确度,可以更快地推动智能人机交互(HCI)技术的进步
 
[正文]    

   前言:深度神经网络(DNN)是近几年在工业界和学术界新型的一个机器学习领域的热点话题。DNN算法成功的将以往的智能识别率提高了一个显著的档次,可以极大地提高图像、语音识别的准确度,可以更快地推动智能人机交互(HCI)技术的进步。

   自DNN发展以来,该技术已成功应用于语音识别技术领域,并取得很好的效果,在移动互联网中已实现广泛应用。近一年来,伴随语音质检系统在各在呼叫中心得到越来越广的重视,捷通华声通过与清华大学合作,成功将深度神经网络应用到灵云语音质检分析系统中,促进语音转写识别率达到实用化水平,从而使语音质检质量与效率得到大幅提升。

   深度学习神经网络是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。2010年,微软雷德蒙研究院发现深层网络可显著提高语音识别的精度。此后,微软亚洲研究院在测试中发现应用DNN的语音识别模型识别错误率比最低错误率降低了33%之多,即绝对识别率提升了6.6%。

   “使结果发生翻天覆地变化的是DNN,通过应用DNN,在日常对话中,最多可使单词识别错误率比之前降低42%。这意味着,以往10个错误,有4个能用这种方法解决。这是自HMM(隐马尔科夫模型)出现以来,单项技术使语音识别精确度获得的最大提升”,微软亚洲研究院研究员Frank Seide解释道。

捷通华声: 灵云语音质检系统 深度神经网络的新应用

   显然,比起传统的混合高斯模型(GMM),DNN在识别精度上具有相当的优势。

   在采用了最先进的第4代深度神经网络算法后,捷通华声灵云语音识别的通用语音识别率达到93%以上,定制模型的识别率达到97%以上,各项指标已经达到国内最好水准。然而,在对其他声源的识别能力上DNN是否会有所突破呢?2013年,捷通华声与清华大学合作,开始在灵云语音质检系统上应用DNN技术。该系统以识别“电话通道语音”为核心,将通话录音中的语音信息提取出来,通过灵云语音识别转换成文本保存在系统中,再通过提取关键词、静音检测、情绪检测、语速检测等方式对语音进行筛选分析,从而得出质检结果。通过灵云语音质检系统,可以帮助客户将客服录音数据进行各种分析,从而针对性地改善呼叫中心的服务质量。其中除对企业自身呼叫中心质检之外,这套系统还可以为企业分析客户的反馈意见,跟踪广大用户的热点问题,从而对公司的产品和服务提出优化建议,实现更加精准的市场决策。因此,“电话通道语音”识别的精度越高意味着语音质检的效率越高、客户体验越好。在应用DNN之后,客户普遍反映灵云语音质检的质量和效率已经有明显的提升,证明了DNN在多声源识别中的适用能力。

   DNN的火热虽早已经引起语音企业的重视,而图像是DNN最早尝试的应用领域——它已经使 YouTube的视频分类提高了70%的准确率。而恰好图像识别又是灵云的另一条主打产品线:灵云智能图像。在语音识别和DNN产生化学反应后,我们有理由期待灵云智能图像识别&DNN在票证、车牌、人脸等图像识别领域的更新的表现。

   捷通华声在语音识别、图像识别等技术领域全面应用DNN,得到了清华大学的鼎力支持。2013年,清华大学产业基金入资捷通华声,成为捷通华声第二大股东,也因此确立了捷通华声与清华大学的战略合作关系,并得到清华大学HCI领域中强大科研力量的支持。捷通华声凭借自身在智能语音、智能图像、自然语言理解等技术领域的技术积累,与清华大学HCI技术各领域实验室、专家教授建立起联合研究机制,为长期发展HCI技术奠定了坚实的基础。

   捷通华声此次与清华大学在DDN领域的成功合作,也标示清华大学在HCI技术领域的雄厚科研力量通过与市场需求的紧密结合,开始全面服务社会。未来发展,捷通华声将发扬清华大学在国家科技进步、国民经济建设中的强大推动力与影响力,全面推进灵云发展战略,促进提升清华大学HCI技术在产业中的影响力,助力清华大学构建“学术超前、科研领先、产业化推广最强”的领导地位,从而共同实现“灵云科技 源自清华 服务全球”的战略发展规划,为中国HCI产业化发展做出更大的贡献。

   更多信息,请浏览灵云开发平台:www.hcicloud.com

   (新闻稿 2014-03-21)


频道首页 】【 评论 】 【 打印 】 【 字体:
   上一篇:民富通: 为企业提供移动入口 民富通APP让财富触手可得
   下一篇:灵犀语音助手: 新版发布 体验快又准的语音拨号
导航:报价 | 大全 | 排行榜 | 产品大全 | 参量 | 订阅 
 Advertisement
 十大最受关注的新闻
1  国内首款微软授权分体式手柄「X4幻蝶」正式官宣
2  适合的才是最好的 ,金士顿性价比U盘推荐
3  被微软选中的天之骄子!小鸡「影舞者」手柄正式官宣!
4  HUAWEI Pura 70系列搭载小艺多项AI功能,玩转智慧体验
5  好评如潮,开放世界竞速游戏天花板竟然是它?
6  参赛者必看 | 拯救者杯OPENAIGC开发者大赛最全攻略指南来啦
7  抢抓汽车金融市场新机遇,联众优车深耕二手车服务
8  2024年勒索软件值得关注的三大趋势
9  赋能产业互联网,高通量计算让世界更高效!
10  极光推送鸿蒙版SDK正式上线,全面适配HarmonyOS NEXT
 十大热门驱动/软件下载
1  [手机驱动]手机usb万能
2  [热门常用软件]QQ2008正式版下载【腾讯QQ2008官方版Beta1】
3  [热门常用软件]E话通下载【E话通4.5 正式版】
4  [手机驱动]Samsung三星 手机USB驱动1.0版For Win98SE/ME/...
5  [手机驱动]Microsoft微软 ActiveSync同步软件4.5中文版Fo...
6  [摄像头驱动]万能摄像头 FOR Windows
7  [热门常用软件]皮皮播放器下载【PPFilm皮皮播放器 2.1.0....
8  [手机驱动]诺基亚 PC套件下载
9  [热门常用软件]面对面游戏下载【面对面视频游戏大厅】
10  [手机驱动]Microsoft微软 Windows Mobile Device Center ...
 十大最受关注的品牌
1  三星手机(SAMSUNG)
2  诺基亚手机(NOKIA)
3  华硕笔记本(ASUS)
4  摩托罗拉手机(MOTOROLA)
5  英特尔CPU(Intel)
6  华硕主板(ASUS)
7  LG手机(LG)
8  索爱手机(Sony Ericsson)
9  联想笔记本(lenovo)
10  宏碁笔记本(acer)
 十大热门常用软件下载
1  QQ2008正式版下载【腾讯QQ2008官方版Beta1】
2  E话通下载【E话通4.5 正式版】
3  皮皮播放器下载【PPFilm皮皮播放器 2.1.0.2版】
4  面对面游戏下载【面对面视频游戏大厅】
5  DVD解码器下载【NVIDIA DVD Decoder 1.02】
6  迅雷5下载【迅雷5.8.1.507官方版】
7  QQ2007 II正式版下载【腾讯QQ2007官方版本】
8  QQ2006正式版下载【腾讯QQ2006官方版本】
9  联众世界游戏大厅下载【联众世界2.7.0.8官方版】
10  MTV下载器【MTV下载精灵 8.31版】
11  pplive最新版下载【PPLive网络电视V1.9.35版】
12  迅雷(Thunder)下载【迅雷v5.7.12.493官方版】
13  腾讯QQ2008下载【腾讯QQ官方版2008极速贺岁版KB1】
14  Total Video Converter下载【Total Video Converter v3.1...
15  QQ拼音输入法下载【腾讯QQQQ拼音输入法V1.4.1版】
16  皮皮高清影视播放器下载【PIPIPlayer 2.7.0.3版】
17  eMule下载【电驴eMule官方v0.49a正式版】
18  极点五笔输入法下载【极点五笔6.1标准版】
19  QQ2009正式版下载【腾讯QQ2009 SP4官方版】
20  Vagaa哇嘎画时代版下载【哇嘎 2.6.5.10】
   >> 查看评论   
3楼     Re: 捷通华声: 灵云语音质检系统 深度神经网络的新应用
  厉害!!!!!!! 四川人民发来贺电!
  作者:依纱贝尔    2014-3-24 12:55:00
   
2楼     Re: 捷通华声: 灵云语音质检系统 深度神经网络的新应用
  留点痕迹下。然后继续潜水去~
  作者:?????健    2014-3-24 12:11:00
   
 
   >> 查看更多评论   [共有2条评论]
发表评论
        
        
   点评:
   姓名:  
            字数: 0
     
新闻精选
·2万元奖池,10-30万元等额算力扶持!OPENAIGC
·智能装备行业领军企业,光大激光携手蓝凌打造
·JFrog安全研究表明:Docker Hub遭受协同攻击
·莱克电气之《心有净界》重磅登陆CCTV-1 携手
·EngageLab AppPush引入全封装语音播报SDK
·专家技术指导,OPENAIGC开发者大赛能量充电走