[發(fā)明專利]基于語義聚類的通話通道構(gòu)建方法、裝置和計(jì)算機(jī)設(shè)備有效
| 申請?zhí)枺?/td> | 202010733115.7 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111901554B | 公開(公告)日: | 2022-11-11 |
| 發(fā)明(設(shè)計(jì))人: | 鄒芳;曹磊;李沛恒 | 申請(專利權(quán))人: | 中國平安人壽保險(xiǎn)股份有限公司 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;G10L15/26;G10L15/16;G10L15/06;G10L15/18;G06Q40/04;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市明日今典知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44343 | 代理人: | 王杰輝;曹勇 |
| 地址: | 518000 廣東省深圳市福田區(qū)益田路503*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語義 通話 通道 構(gòu)建 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
1.一種基于語義聚類的通話通道構(gòu)建方法,其特征在于,應(yīng)用于第一通話終端,包括:
利用所述第一通話終端上預(yù)設(shè)的第一收音設(shè)備,獲取輸入的第一通話語音數(shù)據(jù);其中所述第一通話語音數(shù)據(jù)是所述第一通話終端的使用者針對預(yù)設(shè)問題的答復(fù);
獲取第二通話終端、第三通話終端、...、第n通話終端分別發(fā)送的第二通話語音數(shù)據(jù)、第三通話語音數(shù)據(jù)、...、第n通話語音數(shù)據(jù);其中所述第二通話語音數(shù)據(jù)、第三通話語音數(shù)據(jù)、...、第n通話語音數(shù)據(jù)指所述第二通話終端、第三通話終端、...、第n通話終端上預(yù)設(shè)的第二收音設(shè)備、第三收音設(shè)備、...、第n收音設(shè)備分別采集的語音數(shù)據(jù);其中所述第二通話語音數(shù)據(jù)、第三通話語音數(shù)據(jù)、...、第n通話語音數(shù)據(jù)分別是所述第二通話終端、第三通話終端、...、第n通話終端的使用者針對所述預(yù)設(shè)問題的答復(fù);
將所述第一通話語音數(shù)據(jù)、第二通話語音數(shù)據(jù)、第三通話語音數(shù)據(jù)、...、第n通話語音數(shù)據(jù),輸入預(yù)設(shè)的語義識別模型中,從而得到所述語義識別模型對應(yīng)輸出的n個語義識別結(jié)果;
根據(jù)預(yù)設(shè)的語義聚類方法,對所述n個語義識別結(jié)果進(jìn)行聚類處理,從而得到多個語義組;其中同一個語義組中的語義識別結(jié)果相同;
根據(jù)預(yù)設(shè)的識別結(jié)果篩選方法,從每個語義組中均選出一個指定語義識別結(jié)果,從而得到與所述多個語義組對應(yīng)的多個指定語義識別結(jié)果;
根據(jù)預(yù)設(shè)的語義識別結(jié)果與通話終端的對應(yīng)關(guān)系,獲取與所述多個指定語義識別結(jié)果對應(yīng)的多個指定通話終端;
構(gòu)建所述多個指定通話終端之間的視頻通話通道;其中每個指定通話終端上均預(yù)設(shè)有攝像頭。
2.根據(jù)權(quán)利要求1所述的基于語義聚類的通話通道構(gòu)建方法,其特征在于,所述語義識別模型基于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練而成,所述將所述第一通話語音數(shù)據(jù)、第二通話語音數(shù)據(jù)、第三通話語音數(shù)據(jù)、...、第n通話語音數(shù)據(jù),輸入預(yù)設(shè)的語義識別模型中,從而得到所述語義識別模型對應(yīng)輸出的n個語義識別結(jié)果的步驟之前,包括:
調(diào)取預(yù)先收集的m個訓(xùn)練用語音數(shù)據(jù);
將所述m個訓(xùn)練用語音數(shù)據(jù)輸入已訓(xùn)練完成的語音識別模型中,從而得到所述語音識別模型輸出的m個語音識別文本;其中所述m個語音識別文本由第一語音識別文本、第二語音識別文本、...、第m語音識別文本構(gòu)成;
根據(jù)預(yù)設(shè)的相似算法,計(jì)算所述m個語音識別文本與預(yù)設(shè)的多個參照語義之間的相似度值;
構(gòu)建與所述m個語音識別文本對應(yīng)的m個樣本組,其中第一個樣本組由第一語音識別文本和與所述第一語音識別文本最相似的參照語義構(gòu)成,第二個樣本組由第二語音識別文本和與所述第二語音識別文本最相似的參照語義構(gòu)成,...,第m個樣本組由第m語音識別文本和與所述第m語音識別文本最相似的參照語義構(gòu)成;
將所述m個樣本組按預(yù)設(shè)比例劃分為訓(xùn)練組和驗(yàn)證組;
將所述訓(xùn)練組輸入預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,從而得到中間模型;
利用所述驗(yàn)證組對所述中間模型進(jìn)行驗(yàn)證,以得到驗(yàn)證結(jié)果,并判斷所述驗(yàn)證結(jié)果是否為驗(yàn)證通過;
若所述驗(yàn)證結(jié)果為驗(yàn)證通過,則將所述中間模型記為所述語義識別模型。
3.根據(jù)權(quán)利要求1所述的基于語義聚類的通話通道構(gòu)建方法,其特征在于,所述根據(jù)預(yù)設(shè)的語義聚類方法,對所述n個語義識別結(jié)果進(jìn)行聚類處理,從而得到多個語義組的步驟,包括:
根據(jù)預(yù)設(shè)的向量映射方法,將所述n個語義識別結(jié)果分別映射為高維空間的n個高維向量;
根據(jù)公式:
計(jì)算出一個高維向量A與一個高維向量B的相似程度值Q,從而得到與所述n個高維向量對應(yīng)的多個相似程度值;其中,A、B均為所述n個高維向量中的任意一個高維向量,Ai為高維向量A的第i個分向量,Bi為高維向量B的第i個分向量,高維向量A與高維向量B 均為t維向量;
構(gòu)建多個語義組,其中每個語義組均至少包括兩個語義識別結(jié)果,并且同一個語義組中的語義識別結(jié)果兩兩之間的相似程度值Q小于預(yù)設(shè)的相似閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國平安人壽保險(xiǎn)股份有限公司,未經(jīng)中國平安人壽保險(xiǎn)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010733115.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級語義表征和語義計(jì)算的信號語義識別方法
- 語義分類方法及裝置、存儲介質(zhì)及電子設(shè)備





