[發(fā)明專利]一種語(yǔ)音識(shí)別方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201310665238.1 | 申請(qǐng)日: | 2013-12-10 |
| 公開(kāi)(公告)號(hào): | CN104700836B | 公開(kāi)(公告)日: | 2019-01-29 |
| 發(fā)明(設(shè)計(jì))人: | 翟魯峰 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G10L15/30 | 分類號(hào): | G10L15/30;G10L15/26;H04L12/58 |
| 代理公司: | 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 許志勇 |
| 地址: | 英屬開(kāi)曼群島大開(kāi)*** | 國(guó)省代碼: | 開(kāi)曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 識(shí)別 方法 系統(tǒng) | ||
本申請(qǐng)涉及一種語(yǔ)音識(shí)別方法和系統(tǒng)。該方法包括:接收用戶的語(yǔ)音識(shí)別請(qǐng)求;語(yǔ)音識(shí)別請(qǐng)求中包括預(yù)先分配的唯一標(biāo)識(shí)語(yǔ)音信息的語(yǔ)音ID及將語(yǔ)音轉(zhuǎn)換為文字的語(yǔ)音識(shí)別命令;根據(jù)該語(yǔ)音ID找到對(duì)應(yīng)的語(yǔ)音信息并根據(jù)該語(yǔ)音識(shí)別命令對(duì)該語(yǔ)音信息進(jìn)行轉(zhuǎn)換而獲得對(duì)應(yīng)所述語(yǔ)音信息的文字信息;將獲得的文字信息作為識(shí)別結(jié)果返回給發(fā)出語(yǔ)音識(shí)別請(qǐng)求的用戶。本申請(qǐng)的方法和系統(tǒng)改進(jìn)即時(shí)通信中語(yǔ)音消息功能的用戶交互,提高即時(shí)通信中語(yǔ)音消息功能的用戶交互處理速度,節(jié)省網(wǎng)絡(luò)資源,減少網(wǎng)絡(luò)數(shù)據(jù)流量,從而用戶可以在不方便收聽(tīng)語(yǔ)音消息的場(chǎng)合能及時(shí)獲得信息,提升語(yǔ)音識(shí)別處理速度、提高識(shí)別處理效率、節(jié)省網(wǎng)絡(luò)資源,為用戶提供更好的用戶體驗(yàn)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及通信領(lǐng)域,更具體地涉及一種語(yǔ)音識(shí)別方法和系統(tǒng)。
背景技術(shù)
隨著通信技術(shù)的發(fā)展,智能手機(jī)的普及,各種網(wǎng)絡(luò)通訊工具,比如MSN、騰訊QQ、微信、來(lái)往等通訊產(chǎn)品、逐步成為大眾溝通的主要工具之一。其中,語(yǔ)音消息由于其操作和傳輸功能的便捷性等特點(diǎn)帶來(lái)的溝通快、操作方便,而廣受歡迎。在目前的手機(jī)、PC、PAD、PDA、MID等移動(dòng)終端或網(wǎng)絡(luò)終端(互聯(lián)網(wǎng)設(shè)備)中,一般可以通過(guò)網(wǎng)絡(luò)通信工具(APP)提供語(yǔ)音輸入、輸出功能。
現(xiàn)有技術(shù)中,對(duì)于網(wǎng)絡(luò)通信工具,比如即時(shí)通信工具,語(yǔ)音消息的輸入輸出過(guò)程包括:發(fā)送端將發(fā)送方用戶發(fā)出的語(yǔ)音消息進(jìn)行錄音、并將該錄音編碼后發(fā)送到即時(shí)通信服務(wù)器IM-Server(IMS),由該即時(shí)通信服務(wù)器IMS將發(fā)送來(lái)的錄音編碼推送到對(duì)應(yīng)的接收端,從而在接收方用戶收聽(tīng)語(yǔ)音消息時(shí),接收端將接收到的該錄音編碼進(jìn)行解碼和播放。現(xiàn)有的即時(shí)聊天工具的語(yǔ)音消息功能只能是播放給用戶,但語(yǔ)音的播放在沒(méi)有耳機(jī)的情況下,會(huì)存在諸多問(wèn)題,比如:1.不能保證私密性,如:涉及隱私的語(yǔ)音消息不適宜于在公眾場(chǎng)合播放;2.影響周圍其他人,如:會(huì)議中或閱覽室播放語(yǔ)音不合適但又需要及時(shí)了解語(yǔ)音所傳遞的消息;3.在嘈雜的環(huán)境下影響清晰度,如:太嘈雜而難以聽(tīng)清楚語(yǔ)音所傳遞的消息內(nèi)容。
發(fā)明內(nèi)容
基于現(xiàn)有技術(shù)中上述即時(shí)通信工具中語(yǔ)音消息傳播交互所存在的缺陷,本申請(qǐng)的主要目的在于提供一種語(yǔ)音識(shí)別方法和系統(tǒng),以解決改進(jìn)即時(shí)通信中語(yǔ)音消息功能的用戶交互的技術(shù)問(wèn)題。進(jìn)一步,還可以解決提高即時(shí)通信中語(yǔ)音消息功能的用戶交互處理速度,以及節(jié)省網(wǎng)絡(luò)資源,減少網(wǎng)絡(luò)數(shù)據(jù)流量的技術(shù)問(wèn)題。
為了解決上述技術(shù)問(wèn)題,本申請(qǐng)?zhí)峁┮环N語(yǔ)音識(shí)別方法,包括:接收用戶的語(yǔ)音識(shí)別請(qǐng)求;其中,語(yǔ)音識(shí)別請(qǐng)求中包括預(yù)先分配的唯一標(biāo)識(shí)語(yǔ)音信息的語(yǔ)音ID以及將語(yǔ)音轉(zhuǎn)換為文字的語(yǔ)音識(shí)別命令;根據(jù)語(yǔ)音識(shí)別請(qǐng)求中的語(yǔ)音ID,查找到對(duì)應(yīng)所述語(yǔ)音ID的語(yǔ)音信息;根據(jù)語(yǔ)音識(shí)別請(qǐng)求中的語(yǔ)音識(shí)別命令,對(duì)所述語(yǔ)音信息進(jìn)行轉(zhuǎn)換,以獲得對(duì)應(yīng)所述語(yǔ)音信息的文字信息;將獲得的文字信息作為語(yǔ)音識(shí)別結(jié)果返回給發(fā)出語(yǔ)音識(shí)別請(qǐng)求的用戶。
本申請(qǐng)還提供一種語(yǔ)音識(shí)別方法,包括:為接收的語(yǔ)音信息分配唯一的標(biāo)識(shí)作為語(yǔ)音ID;根據(jù)所述語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,對(duì)所述語(yǔ)音信息進(jìn)行轉(zhuǎn)換,以獲得對(duì)應(yīng)所述語(yǔ)音信息的文字信息;根據(jù)接收的用戶的語(yǔ)音識(shí)別請(qǐng)求中的語(yǔ)音ID,查找到對(duì)應(yīng)所述語(yǔ)音ID的文字信息;將獲得的文字信息作為語(yǔ)音識(shí)別結(jié)果返回給發(fā)出語(yǔ)音識(shí)別請(qǐng)求的用戶。
另外,提供了實(shí)現(xiàn)方法的一種語(yǔ)音識(shí)別系統(tǒng),包括:即時(shí)通信服務(wù)器IMS、接收端、發(fā)送端、以及所述IMS中設(shè)置的語(yǔ)音識(shí)別模塊或與所述IMS連接的語(yǔ)音識(shí)別服務(wù)器/語(yǔ)音識(shí)別服務(wù)器集群;所述IMS為接收的來(lái)自發(fā)送端的語(yǔ)音信息分配唯一的標(biāo)識(shí)作為語(yǔ)音ID,推送所述語(yǔ)音信息到接收端;當(dāng)所述IMS接收來(lái)自接收端的用戶對(duì)所述語(yǔ)音信息發(fā)起的語(yǔ)音識(shí)別請(qǐng)求時(shí),提取語(yǔ)音識(shí)別請(qǐng)求中的對(duì)應(yīng)所述語(yǔ)音信息的語(yǔ)音ID,查找到所述語(yǔ)音信息,并且,將所述語(yǔ)音識(shí)別請(qǐng)求中的語(yǔ)音識(shí)別命令和所述查找到的語(yǔ)音信息,提交給所述語(yǔ)音識(shí)別模塊或所述語(yǔ)音識(shí)別服務(wù)器/語(yǔ)音識(shí)別服務(wù)器集群;語(yǔ)音識(shí)別模塊或所述語(yǔ)音識(shí)別服務(wù)器/語(yǔ)音識(shí)別服務(wù)器集群,根據(jù)所述語(yǔ)音信息和語(yǔ)音識(shí)別命令進(jìn)行語(yǔ)音識(shí)別,對(duì)所述語(yǔ)音信息進(jìn)行轉(zhuǎn)換,以獲得對(duì)應(yīng)所述語(yǔ)音信息的文字信息;所述IMS從語(yǔ)音識(shí)別模塊或所述語(yǔ)音識(shí)別服務(wù)器/語(yǔ)音識(shí)別服務(wù)器集群得到所述文字信息,并將獲得的文字信息作為語(yǔ)音識(shí)別結(jié)果返回給所述接收端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310665238.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種音頻信號(hào)的發(fā)送、接收方法及裝置
- 下一篇:一種薩克斯
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





