[發(fā)明專利]一種中文相似問題生成系統(tǒng)與方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811360413.5 | 申請(qǐng)日: | 2018-11-15 |
| 公開(公告)號(hào): | CN109460462B | 公開(公告)日: | 2021-10-19 |
| 發(fā)明(設(shè)計(jì))人: | 韓冰 | 申請(qǐng)(專利權(quán))人: | 中通天鴻(北京)通信科技股份有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/36;G06F40/30 |
| 代理公司: | 北京卓愛普專利代理事務(wù)所(特殊普通合伙) 11920 | 代理人: | 王玉松 |
| 地址: | 101149 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 中文 相似 問題 生成 系統(tǒng) 方法 | ||
1.一種中文相似問題生成方法,其特征在于,所述生成方法包括:
S1:中文語義知識(shí)庫構(gòu)建步驟,將關(guān)鍵詞與常見問題建立第一映射、常見問題與銷售標(biāo)記建立第二映射,將經(jīng)過銷售標(biāo)記的常見問題與問題答案建立第三映射,所述銷售標(biāo)記基于訓(xùn)練或規(guī)則生成;
S2:關(guān)鍵詞提取步驟,若干商家端通過語音交互服務(wù)器向與各自商家所屬的若干用戶端建立語音信道,用戶通過語音信道向?qū)?yīng)的商家端提出自然語言問題,語音交互服務(wù)器識(shí)別到用戶提出的問題后,經(jīng)過語音轉(zhuǎn)文字處理、自然語言關(guān)鍵詞提取處理后,獲得用于在所述中文語義知識(shí)庫中匹配的關(guān)鍵詞;
S3:常見問題匹配步驟,將步驟S2中提取的關(guān)鍵詞在中文語義知識(shí)庫中基于第一算法匹配到常見問題,判斷常見問題是否具備銷售標(biāo)記屬性,如果為帶有銷售標(biāo)記屬性的常見問題,則進(jìn)入步驟S4,如果為不帶有銷售標(biāo)記屬性的常見問題,則進(jìn)入步驟S5并將該常見問題放入待標(biāo)記銷售標(biāo)記列表;
S4:第一相似問題答案生成步驟,將匹配到的常見問題基于第二算法生成基于關(guān)聯(lián)度和相似度排序的若干第一相似問題答案;
S5:第二相似問題答案生成步驟,將匹配到的常見問題基于第三算法生成基于相似度排序的若干第二相似問題答案;
S6:商家端將經(jīng)過語音交互服務(wù)器語音合成處理后的所述第一相似問題答案或所述第二相似問題答案發(fā)送至客戶端,實(shí)現(xiàn)商家端和用戶端的自動(dòng)語音交互。
2.根據(jù)權(quán)利要求1所述的中文相似問題生成方法,其特征在于,步驟S1的中文語義知識(shí)庫中關(guān)鍵詞與常見問題之間、經(jīng)過銷售標(biāo)記的常見問題與問題答案之間均采用多種的映射關(guān)系,常見問題與銷售標(biāo)記之間采用一一對(duì)應(yīng)的映射關(guān)系。
3.根據(jù)權(quán)利要求1所述的中文相似問題生成方法,其特征在于,驟S1中,所述規(guī)則包括但不限于根據(jù)商家的銷售專家知識(shí),當(dāng)數(shù)據(jù)量超出10000條時(shí)基于訓(xùn)練生成,所述訓(xùn)練方法包括已知的機(jī)器學(xué)習(xí)算法。
4.根據(jù)權(quán)利要求1所述的中文相似問題生成方法,其特征在于,步驟S4中,匹配出的帶有銷售標(biāo)記的常見問題的數(shù)量為至少2個(gè)。
5.根據(jù)權(quán)利要求1所述的中文相似問題生成方法,其特征在于,步驟S4包括如下步驟:
S41:對(duì)于帶有銷售標(biāo)記屬性的常見問題,在中文語義知識(shí)庫中通過第二算法基于相似度生成若干第一相似問題答案,所述第二算法包括但不限于基于Word2Vec計(jì)算常見問題與問題答案之間的相似度;
S42:計(jì)算帶有銷售標(biāo)記屬性的常見問題的關(guān)聯(lián)度,基于關(guān)聯(lián)度值對(duì)生成的第一相似問題答案進(jìn)行排序,所述關(guān)聯(lián)度基于訓(xùn)練或規(guī)則計(jì)算。
6.根據(jù)權(quán)利要求5所述的中文相似問題生成方法,其特征在于,步驟S42中基于規(guī)則計(jì)算包括但不限于基于商家的銷售專家知識(shí)對(duì)中文語義知識(shí)庫中的各銷售標(biāo)記賦予關(guān)聯(lián)度,基于訓(xùn)練的計(jì)算包括對(duì)中文語義知識(shí)庫中每個(gè)銷售標(biāo)記進(jìn)行關(guān)聯(lián)度賦值,計(jì)算模型對(duì)賦予了關(guān)聯(lián)度的銷售標(biāo)記進(jìn)行訓(xùn)練,所述計(jì)算模型是基于人工智能深度學(xué)習(xí)技術(shù)建立的。
7.根據(jù)權(quán)利要求1所述的中文相似問題生成方法,其特征在于,步驟S3中的第一算法包括但不限于遞歸神經(jīng)網(wǎng)絡(luò)算法;步驟S5中的第三算法包括但不限于自然語言處理算法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中通天鴻(北京)通信科技股份有限公司,未經(jīng)中通天鴻(北京)通信科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811360413.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





