[發(fā)明專利]一種識(shí)別AI來電的方法、裝置、語音助手、終端、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201910349993.6 | 申請(qǐng)日: | 2019-04-28 |
| 公開(公告)號(hào): | CN110198381B | 公開(公告)日: | 2020-11-27 |
| 發(fā)明(設(shè)計(jì))人: | 張偉萌;龔思穎 | 申請(qǐng)(專利權(quán))人: | 北京驀然認(rèn)知科技有限公司 |
| 主分類號(hào): | H04M3/22 | 分類號(hào): | H04M3/22;H04M3/42;H04M3/493;G10L15/02;G10L15/04;G10L15/08;G10L15/26;G10L15/30 |
| 代理公司: | 北京智丞瀚方知識(shí)產(chǎn)權(quán)代理有限公司 11810 | 代理人: | 楊樂 |
| 地址: | 100083 北京市海淀區(qū)學(xué)院*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識(shí)別 ai 來電 方法 裝置 語音 助手 終端 計(jì)算機(jī) 設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
1.一種識(shí)別AI來電的方法,其特征在于,該方法包括以下步驟:
步驟101、終端接收到來電呼叫時(shí),語音助手自動(dòng)接通來電;
步驟102、獲取來電的語音信號(hào),對(duì)語音信號(hào)進(jìn)行預(yù)處理;
步驟103、利用數(shù)據(jù)庫對(duì)預(yù)處理后的語音信號(hào)進(jìn)行分析判斷,識(shí)別該來電是否屬于AI來電;
在步驟103之前,預(yù)先建立數(shù)據(jù)庫,其中包括以下步驟:
步驟1、獲取多個(gè)真人語音樣本以及多個(gè)AI語音樣本,形成語料庫;
步驟2、對(duì)真人語音樣本、AI語音樣本按照完整語意、詞組兩個(gè)維度進(jìn)行切分,形成真人語音段、AI語音段,分別提取兩種語音段的長期頻譜特征LTAS(The Long Term AverageSpectrum),獲取LTAS的基頻特征,根據(jù)LTAS中的基頻特征確定兩種語音段的音調(diào);其中完整語意切分粒度大于或等于詞組切分粒度;
步驟3、分別識(shí)別真人語音段、AI語音段的音素序列,根據(jù)各音素的變化位置確定每個(gè)音素的發(fā)音時(shí)間長度,得出兩種語音段的發(fā)音節(jié)奏;
步驟4、建立數(shù)據(jù)庫,將語音段轉(zhuǎn)換為文本,以該文本為索引,存儲(chǔ)對(duì)應(yīng)的真人語音段、AI語音段的LTAS的基頻特征、音調(diào)、音素的發(fā)音時(shí)間長度以及對(duì)應(yīng)的節(jié)奏這四個(gè)特征參數(shù);其中一個(gè)文本可對(duì)應(yīng)于一個(gè)或多個(gè)真人語音段、一個(gè)或多個(gè)AI語音段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
步驟102具體包括:語音助手獲取來電的語音信號(hào),濾除語音信號(hào)中的噪聲值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,由云服務(wù)器或者終端預(yù)先建立數(shù)據(jù)庫,數(shù)據(jù)庫存儲(chǔ)于云服務(wù)器或者終端。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用數(shù)據(jù)庫對(duì)預(yù)處理后的語音信號(hào)進(jìn)行分析判斷,識(shí)別該來電是否屬于AI來電,具體包括以下步驟:
步驟1031、將預(yù)處理后的語音信號(hào)按照完整語意進(jìn)行切分,將切分后的語音段轉(zhuǎn)換為文本,以該文本為索引,查找數(shù)據(jù)庫中是否存在該文本索引,執(zhí)行步驟1032;
步驟1032、若數(shù)據(jù)庫中存在對(duì)應(yīng)的文本,獲取切分后的語音段對(duì)應(yīng)的LTAS的基頻特征及與其對(duì)應(yīng)的音調(diào)、音素的發(fā)音時(shí)間長度以及對(duì)應(yīng)的節(jié)奏這四個(gè)特征參數(shù);將切分后的語音段對(duì)應(yīng)的LTAS的基頻特征及與其對(duì)應(yīng)的音調(diào)、音素的發(fā)音時(shí)間長度以及對(duì)應(yīng)的節(jié)奏分別與數(shù)據(jù)庫中該文本索引對(duì)應(yīng)的真人語音段、AI語音段的LTAS的基頻特征、音調(diào)、音素的發(fā)音時(shí)間長度、節(jié)奏這四個(gè)特征參數(shù)進(jìn)行比較,計(jì)算切分后的語音段的四個(gè)特征參數(shù)分別與真人語音、AI語音的四個(gè)特征參數(shù)的相似度;當(dāng)數(shù)據(jù)庫中該文本對(duì)應(yīng)于多個(gè)真人語音段、和/或多個(gè)AI語音段時(shí),將切分后的語音段的四個(gè)特征參數(shù)分別與數(shù)據(jù)庫中的每個(gè)真人語音段、AI語音段的四個(gè)特征參數(shù)進(jìn)行相似度計(jì)算,并執(zhí)行步驟1033;若數(shù)據(jù)庫中不存在對(duì)應(yīng)的文本,將預(yù)處理后的語音信號(hào)按照詞組進(jìn)行切分,獲取按照詞組切分后的語音段對(duì)應(yīng)的LTAS的基頻特征及與其對(duì)應(yīng)的音調(diào)、音素的發(fā)音時(shí)間長度以及對(duì)應(yīng)的節(jié)奏這四個(gè)特征參數(shù),并執(zhí)行步驟1034;
步驟1033、當(dāng)按照語意和/或按照詞組切分后的語音段的四個(gè)特征參數(shù)與真人語音段/AI語音段的四個(gè)特征參數(shù)比較后的每個(gè)特征參數(shù)的相似度均高于預(yù)設(shè)值時(shí),為該語音段的真人屬性/AI屬性賦值1+a(N-1),否則賦值0;其中N為按照語意和/或按照詞組切分后的語音段與多個(gè)真人語音段/多個(gè)AI語音段的比較中每個(gè)特征參數(shù)的相似度均高于預(yù)設(shè)值時(shí)真人語音段/AI語音段的個(gè)數(shù),a為權(quán)重因子,a為正數(shù);執(zhí)行步驟1035;
步驟1034、將按照詞組切分后的語音段轉(zhuǎn)換為文本,以該文本為索引,查找數(shù)據(jù)庫中對(duì)應(yīng)于該文本的真人語音段、AI語音段的LTAS的基頻特征、音調(diào)、音素的發(fā)音時(shí)間長度、節(jié)奏這四個(gè)特征參數(shù);將按照詞組切分后的語音段的四個(gè)特征參數(shù)分別與數(shù)據(jù)庫中該文本索引對(duì)應(yīng)的真人語音段、AI語音段的LTAS的基頻特征、音調(diào)、音素的發(fā)音時(shí)間長度、節(jié)奏進(jìn)行比較,計(jì)算切分后的語音段的四個(gè)特征參數(shù)分別與真人語音、AI語音的四個(gè)特征參數(shù)的相似度;當(dāng)數(shù)據(jù)庫中該文本對(duì)應(yīng)于多個(gè)真人語音段、和/或AI語音段時(shí),將切分后的語音段的四個(gè)特征參數(shù)分別與數(shù)據(jù)庫中的每個(gè)真人語音、AI語音的四個(gè)特征參數(shù)進(jìn)行相似度計(jì)算,并執(zhí)行步驟1033;
步驟1035、對(duì)來電的語音信號(hào)對(duì)應(yīng)的語音段中真人屬性、AI屬性分別求和,當(dāng)真人屬性的和值大于AI屬性的和值,則判斷該來電屬于真人來電,否則為AI來電,結(jié)束;若真人屬性的和值與AI屬性的和值相同,則執(zhí)行步驟1036;
步驟1036、語音助手播放預(yù)設(shè)語音,與來電進(jìn)行對(duì)話,如向來電提問等;判斷來電的回復(fù)是否與預(yù)設(shè)語音內(nèi)容相關(guān),若相關(guān),則對(duì)回復(fù)的語音信號(hào)進(jìn)行預(yù)處理,執(zhí)行步驟1031;否則判斷其為AI來電,結(jié)束。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京驀然認(rèn)知科技有限公司,未經(jīng)北京驀然認(rèn)知科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910349993.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- AI接口平臺(tái)及其應(yīng)用方法、AI應(yīng)用系統(tǒng)
- AI行為調(diào)用方法和裝置
- 人工智能平臺(tái)實(shí)現(xiàn)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 人工智能的病種分析方法及裝置、存儲(chǔ)介質(zhì)、計(jì)算機(jī)設(shè)備
- 一種處理AI任務(wù)的方法及裝置
- 提供AI模型的方法、AI平臺(tái)、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 一種自適應(yīng)AI模型部署方法
- 分離AI中的公共知識(shí)與私有知識(shí)
- 應(yīng)用于城市大腦的AI算法和AI模型的調(diào)配系統(tǒng)及方法
- 云服務(wù)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





