主页 > 快资讯 > 科技说 > 正文

语音识别揭秘你的手机究竟有多理解你看完就了解了！

2019-12-12 18:25:36来源：钛媒体APP编辑：居小桃

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

　　原标题：语音识别揭秘你的手机究竟有多理解你看完就了解了！

　　在我们的生活中，语言是传递信息最重要的方式，它能够让人们之间互相了解。人和机器之间的交互也是相同的道理，让机器人知道人类要做什么、怎么做。交互的方式有动作、文本或语音等等，其中语音交互越来越被重视，因为随着互联网上智能硬件的普及，产生了各种互联网的入口方式，而语音是最简单、最直接的交互方式，是最通用的输入模式。

　　Siri技术来源于美国国防部高级研究规划局（DARPA）的CALO计划：初衷是一个让军方简化处理繁重复杂的事务，并具备认知能力进行学习、组织的数字助理，其民用版即为Siri虚拟个人助理。

　　现在，Siri成为苹果iPhone上的一项语音控制功能，可以让手机变身为一台智能化机器人。通过自然语言的语音输入，可以调用各种APP，如天气预报、地图导航、资料检索等，还能够通过不断学习改善性能，提供对话式的应答服务。

　　语音识别（ASR）原理

　　（1）语音输入的预处理模块

　　对输入的原始语音信号进行处理，滤除掉其中的不重要信息以及背景噪声，并进行语音信号的端点检测（也就是找出语音信号的始末）、语音分帧（可以近似理解为，一段语音就像是一段视频，由许多帧的有序画面构成，可以将语音信号切割为单个的“画面”进行分析）等处理。

　　（2）特征提取

　　（3）声学模型训练

　　（4）语言模型训练

　　（5）语音解码和搜索算法

　　站在巨人的肩膀上：开源框架

　　（1）CMUSphinix是卡内基梅隆大学的研究成果。已有20年历史了，在Github和SourceForge上都已经开源了，而且两个平台上都有较高的活跃度。

　　（2）Kaldi从2009年的研讨会起就有它的学术根基了，现在已经在GitHub上开源，开发活跃度较高。

　　（3）HTK始于剑桥大学，已经商用较长时间，但是现在版权已经不再开源软件了。它的最新版本更新于2015年12月。

　　（4）Julius起源于1997年，最后一个主版本发布于2016年9月，主要支持的是日语。

　　语音识别技术研究难点

　　（1）输入无法标准统一

　　（2）噪声的困扰

　　（3）模型的有效性

投稿邮箱：lukejiwang@163.com 详情访问鹿财经网：http://www.lucaijing.com.cn

相关推荐

AI无人商店竟是靠人工识别商品！七成交易需要人

AI无人商店竟是靠人工识别商品！七成交易需要人

原标题：AI无人商店竟是靠人工识别商品！七成交易需要人为 4月10日消息，据媒

科技说2024-04-10

格力颠覆家庭能源！新一代光储空调揭秘：从此

格力颠覆家庭能源！新一代光储空调揭秘：从此

原标题：格力颠覆家庭能源！新一代光储空调揭秘：从此不用交电费 3月21日消

科技说2024-03-21

前苹果高管打造AI穿戴设备：无屏幕设计支持投

前苹果高管打造AI穿戴设备：无屏幕设计支持投

原标题：前苹果高管打造AI穿戴设备：无屏幕设计支持投影、语音 11月10日消息

科技说2023-11-10

长江存储232层闪存揭秘：密度世界第一！独特设

长江存储232层闪存揭秘：密度世界第一！独特设

原标题：长江存储232层闪存揭秘：密度世界第一！独特设计无敌长江存储早已

科技说2023-11-01

ChatGPT大升级：支持图片和语音输入严格限制被诈

ChatGPT大升级：支持图片和语音输入严格限制被诈

原标题：ChatGPT大升级：支持图片和语音输入严格限制被诈骗利用 9月25日消息，

科技说2023-09-25

华为ADS 2.0实测！问界M5智驾版小巷穿梭：铁铲都

华为ADS 2.0实测！问界M5智驾版小巷穿梭：铁铲都

原标题：华为ADS 2.0实测！问界M5智驾版小巷穿梭：铁铲都能识别！ 9月7日消息，

科技说2023-09-07

贴脸微信抄？马斯克：X（推特）将支持视频/语音

贴脸微信抄？马斯克：X（推特）将支持视频/语音

原标题：贴脸微信抄？马斯克：X（推特）将支持视频/语音通话 8月12日消息，马

科技说2023-08-12

谷歌语音助手转型：开发AI新版，部分员工被裁

谷歌语音助手转型：开发AI新版，部分员工被裁

原标题：谷歌语音助手转型：开发AI新版，部分员工被裁谷歌日前对谷歌助手的

科技说2023-08-02

蚂蚁集团发布AI安全检测平台“蚁鉴2.0”：一键识

蚂蚁集团发布AI安全检测平台“蚁鉴2.0”：一键识

原标题：蚂蚁集团发布AI安全检测平台蚁鉴2.0：一键识别AI模型漏洞 7月7日消息

科技说2023-07-07

Mate发布Voicebox AI模型：仅需2秒片段即可“学会”

Mate发布Voicebox AI模型：仅需2秒片段即可“学会”

原标题：Mate发布Voicebox AI模型：仅需2秒片段即可学会语音细节 6月19日消息，近

科技说2023-06-19

头条资讯

推荐资讯

最近更新

鹿财经网—新锐财经媒体！: 关于我们 | 联系我们 | 商务合作; 寻求报道 | 免责声明 | 网站地图; 申请友链 | 加入我们 | 意见反馈

投诉建议: 通过E-mail将您的想法和建议发给我们; 稿件投诉：jiujiukejiwang@163.com; 合作网站：金宠物绿植迷

联系我们: 服务热线：400-8558-350; 官方客服QQ：3443764770; 微信公众号：lucaijingwang

有态度·有温度·有深度

有态度·有温度·有深度

Copyright © 2002-2024 鹿财经粤ICP备2022102098号-2 深圳蜂牛科技有限公司版权所有

浙公网安备 33052102000515号