语音识别揭秘 你的手机究竟有多理解你看完就了解了!

2019-12-12 18:25:36来源:钛媒体APP编辑:居小桃

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:语音识别揭秘 你的手机究竟有多理解你看完就了解了!

  在我们的生活中,语言是传递信息最重要的方式,它能够让人们之间互相了解。人和机器之间的交互也是相同的道理,让机器人知道人类要做什么、怎么做。交互的方式有动作、文本或语音等等,其中语音交互越来越被重视,因为随着互联网上智能硬件的普及,产生了各种互联网的入口方式,而语音是最简单、最直接的交互方式,是最通用的输入模式。

  Siri技术来源于美国国防部高级研究规划局(DARPA)的CALO计划:初衷是一个让军方简化处理繁重复杂的事务,并具备认知能力进行学习、组织的数字助理,其民用版即为Siri虚拟个人助理。

  现在,Siri成为苹果iPhone上的一项语音控制功能,可以让手机变身为一台智能化机器人。通过自然语言的语音输入,可以调用各种APP,如天气预报、地图导航、资料检索等,还能够通过不断学习改善性能,提供对话式的应答服务。

  语音识别(ASR)原理

  (1)语音输入的预处理模块

  对输入的原始语音信号进行处理,滤除掉其中的不重要信息以及背景噪声,并进行语音信号的端点检测(也就是找出语音信号的始末)、语音分帧(可以近似理解为,一段语音就像是一段视频,由许多帧的有序画面构成,可以将语音信号切割为单个的“画面”进行分析)等处理。

  (2)特征提取

  (3)声学模型训练

  (4)语言模型训练

  (5)语音解码和搜索算法

  站在巨人的肩膀上:开源框架

  (1)CMUSphinix是卡内基梅隆大学的研究成果。已有20年历史了,在Github和SourceForge上都已经开源了,而且两个平台上都有较高的活跃度。
 
  (2)Kaldi从2009年的研讨会起就有它的学术根基了,现在已经在GitHub上开源,开发活跃度较高。
 
  (3)HTK始于剑桥大学,已经商用较长时间,但是现在版权已经不再开源软件了。它的最新版本更新于2015年12月。
 
  (4)Julius起源于1997年,最后一个主版本发布于2016年9月,主要支持的是日语。
 
  语音识别技术研究难点
 
  (1)输入无法标准统一

  (2)噪声的困扰

  (3)模型的有效性

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐
AI无人商店竟是靠人工识别商品!七成交易需要人 AI无人商店竟是靠人工识别商品!七成交易需要人

原标题:AI无人商店竟是靠人工识别商品!七成交易需要人为 4月10日消息,据媒

科技说2024-04-10

格力颠覆家庭能源!新一代光储空调揭秘:从此 格力颠覆家庭能源!新一代光储空调揭秘:从此

原标题:格力颠覆家庭能源!新一代光储空调揭秘:从此不用交电费 3月21日消

科技说2024-03-21

前苹果高管打造AI穿戴设备:无屏幕设计 支持投 前苹果高管打造AI穿戴设备:无屏幕设计 支持投

原标题:前苹果高管打造AI穿戴设备:无屏幕设计 支持投影、语音 11月10日消息

科技说2023-11-10

长江存储232层闪存揭秘:密度世界第一!独特设 长江存储232层闪存揭秘:密度世界第一!独特设

原标题:长江存储232层闪存揭秘:密度世界第一!独特设计无敌 长江存储早已

科技说2023-11-01

ChatGPT大升级:支持图片和语音输入 严格限制被诈 ChatGPT大升级:支持图片和语音输入 严格限制被诈

原标题:ChatGPT大升级:支持图片和语音输入 严格限制被诈骗利用 9月25日消息,

科技说2023-09-25

华为ADS 2.0实测!问界M5智驾版小巷穿梭:铁铲都 华为ADS 2.0实测!问界M5智驾版小巷穿梭:铁铲都

原标题:华为ADS 2.0实测!问界M5智驾版小巷穿梭:铁铲都能识别! 9月7日消息,

科技说2023-09-07

贴脸微信抄?马斯克:X(推特)将支持视频/语音 贴脸微信抄?马斯克:X(推特)将支持视频/语音

原标题:贴脸微信抄?马斯克:X(推特)将支持视频/语音通话 8月12日消息,马

科技说2023-08-12

谷歌语音助手转型:开发AI新版,部分员工被裁 谷歌语音助手转型:开发AI新版,部分员工被裁

原标题:谷歌语音助手转型:开发AI新版,部分员工被裁 谷歌日前对谷歌助手的

科技说2023-08-02

蚂蚁集团发布AI安全检测平台“蚁鉴2.0”:一键识 蚂蚁集团发布AI安全检测平台“蚁鉴2.0”:一键识

原标题:蚂蚁集团发布AI安全检测平台蚁鉴2.0:一键识别AI模型漏洞 7月7日消息

科技说2023-07-07

Mate发布Voicebox AI模型:仅需2秒片段即可“学会” Mate发布Voicebox AI模型:仅需2秒片段即可“学会”

原标题:Mate发布Voicebox AI模型:仅需2秒片段即可学会语音细节 6月19日消息,近

科技说2023-06-19