[發明專利]基于語音識別的數據傳輸方法和裝置有效
| 申請號: | 201710047882.0 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN108346429B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 林劍城 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/04;H04M1/72439;H04M1/72469 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 識別 數據傳輸 方法 裝置 | ||
1.一種基于語音識別的數據傳輸方法,其特征在于,所述方法由終端執行,所述方法包括:
當進入語音輸入界面時,向服務器發送建立數據傳輸通道的請求,在接收到所述服務器反饋的應答消息后,與所述服務器之間建立基于傳輸控制協議的數據傳輸通道;
定期檢測所述數據傳輸通道是否處于空閑狀態;
當檢測到所述數據傳輸通道處于空閑狀態時,通過所述數據傳輸通道發送心跳數據包;
若在預設時長內未接收到通過所述數據傳輸通道傳來的針對所述心跳數據包的應答包,則關閉所述數據傳輸通道,重新建立數據傳輸通道并保持;
依次獲取輸入的語音片段,每個所述語音片段是用戶在進行語音輸入時,人為分次輸入的語音數據;通過所述數據傳輸通道,依次發送所述語音片段;
通過所述數據傳輸通道,接收與發送的所述語音片段匹配的語音識別結果;
當退出所述語音輸入界面時,關閉所述數據傳輸通道。
2.根據權利要求1所述的方法,其特征在于,所述進入語音輸入界面的步驟包括:
顯示語音輸入界面的開啟入口;
獲取針對所述開啟入口的開啟指令;
根據所述開啟指令,展示語音輸入界面。
3.根據權利要求2所述的方法,其特征在于,所述退出所述語音輸入界面的步驟包括:
獲取針對所述語音輸入界面的界面隱藏指令;
根據所述界面隱藏指令隱藏所述語音輸入界面。
4.根據權利要求2所述的方法,其特征在于,所述通過所述數據傳輸通道,接收與發送的所述語音片段匹配的語音識別結果之后,所述方法還包括:
在所述語音輸入界面輸出所述語音識別結果;
當檢測到針對輸出的所述語音識別結果的取消操作時,撤銷輸出的所述語音識別結果;
當檢測到針對輸出的所述語音識別結果的確認輸入操作時,根據輸出的所述語音識別結果進行文本錄入操作。
5.根據權利要求1所述的方法,其特征在于,所述通過所述數據傳輸通道,依次發送所述語音片段的步驟包括:
通過所述數據傳輸通道,依次向所述數據傳輸通道所連接至的服務器發送所述語音片段,使得所述服務器在接收到發送的所述語音片段后,根據已接收到的多個語音片段進行語音識別,得到與發送的所述語音片段匹配的語音識別結果。
6.根據權利要求5所述的方法,其特征在于,所述通過所述數據傳輸通道,接收與發送的所述語音片段匹配的語音識別結果的步驟包括:
在通過所述數據傳輸通道發送語音片段時,通過所述數據傳輸通道并行接收所述服務器反饋的與發送的所述語音片段匹配的語音識別結果。
7.根據權利要求1至4中任一項所述的方法,其特征在于,所述通過所述數據傳輸通道,接收與發送的所述語音片段匹配的語音識別結果包括:
通過所述數據傳輸通道,接收按照應用層協議封裝的數據包;
解析所述數據包,得到所述數據包中封裝的加密的語音識別結果;
將加密的語音識別結果解密,得到與發送的所述語音片段匹配的語音識別結果。
8.根據權利要求1至6中任一項所述的方法,其特征在于,所述方法還包括:
在每次通過所述數據傳輸通道發送所述語音片段時,和/或,在每次通過所述數據傳輸通道接收所述語音識別結果時,則
檢測所述數據傳輸通道是否異常;
當所述數據傳輸通道異常時,則
關閉所述數據傳輸通道,重新建立數據傳輸通道并保持;
通過重新建立的所述數據傳輸通道,繼續發送當次需發送的所述語音片段和/或接收當次需接收的所述語音識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710047882.0/1.html,轉載請聲明來源鉆瓜專利網。





