[發(fā)明專利]用戶查詢意圖理解方法、系統(tǒng)及計算機終端在審
| 申請?zhí)枺?/td> | 201711487965.8 | 申請日: | 2017-12-30 |
| 公開(公告)號: | CN108228820A | 公開(公告)日: | 2018-06-29 |
| 發(fā)明(設(shè)計)人: | 李成華;劉麗君;葉正 | 申請(專利權(quán))人: | 廈門太迪智能科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 鄧超 |
| 地址: | 361000 福建省廈*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用戶查詢 語句 概念節(jié)點 鏈接 計算機終端 分類標(biāo)簽 概率 知識庫 查詢語句 返回結(jié)果 概念特征 檢索概念 語句覆蓋 語義表達 相似度 返回 覆蓋 學(xué)習(xí) | ||
本發(fā)明公開了一種用戶查詢意圖理解方法、系統(tǒng)及計算機終端。該方法包括:以預(yù)定意圖領(lǐng)域的種子概念為起點,爬取知識庫內(nèi)與該領(lǐng)域相關(guān)的概念和分類標(biāo)簽;根據(jù)爬取的概念和分類標(biāo)簽建立預(yù)定意圖領(lǐng)域的概念鏈接圖;計算概念鏈接圖中節(jié)點屬于預(yù)定意圖領(lǐng)域的概率;獲取用戶查詢語句,檢索概念鏈接圖,若用戶查詢語句覆蓋概念節(jié)點,返回概念;否則利用深度學(xué)習(xí)模型,計算用戶查詢語句和概念節(jié)點之間的相似度,并返回與用戶查詢語句最相似的前K個概念;根據(jù)返回結(jié)果和概念節(jié)點屬于預(yù)定意圖領(lǐng)域的概率,計算用戶查詢語句屬于預(yù)定意圖領(lǐng)域的概率,并與預(yù)定閾值相比較以判斷是否屬于預(yù)定意圖領(lǐng)域。本發(fā)明解決了查詢語句的概念特征覆蓋和語義表達問題。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體而言,涉及一種用戶查詢意圖理解方法、系統(tǒng)及計算機終端。
背景技術(shù)
用戶查詢意圖的理解一直是搜索引擎技術(shù)中的核心問題,解決好此問題可以極大的提升用戶體驗。同時,隨著人工智能的興起,人機對話技術(shù)成為熱點,而該技術(shù)也需要依托準確的用戶查詢意圖理解。因此,如何準確理解用戶查詢意圖的難題廣泛地引起了學(xué)術(shù)界和工業(yè)界的關(guān)注。
目前,查詢意圖理解的主流方法是機器學(xué)習(xí)方法。該類方法首先建立意圖分類體系,然后獲取各分類的訓(xùn)練語料,訓(xùn)練意圖分類器,最后應(yīng)用該分類器,獲得查詢文本的分類結(jié)果。然而,由于語言的博大精深,訓(xùn)練語料往往存在數(shù)據(jù)稀疏的問題,即語料不能覆蓋大部分的語言表達,不能全面表達特定意圖。當(dāng)查詢語句中的概念特征不被訓(xùn)練語料覆蓋時,意圖分類器將不能得出準確的結(jié)果。通過人工標(biāo)注更多的語料數(shù)據(jù)或者采用一些半監(jiān)督的方法可以部分克服這一弊端,但需要耗費大量的人力。再者,用戶的查詢語句通常比較簡短,特征有限,查詢語句的語義表示成為一個難題。傳統(tǒng)的方法通常基于詞袋模型,這種方法存在高緯度和高稀疏的問題,特征表達能力很弱,且忽略了上下文關(guān)系,無法提取出抽象的語義信息。
因此,解決好查詢語句的概念特征覆蓋問題和語義表達問題將會有助于準確理解用戶查詢意圖,對搜索引擎優(yōu)化和人機對話應(yīng)用產(chǎn)生有益的效果。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提供了一種用戶查詢意圖理解方法、系統(tǒng)及計算機終端,解決了查詢語句的概念特征覆蓋問題和語義表達問題,有助于準確理解用戶查詢意圖,對搜索引擎優(yōu)化和人機對話應(yīng)用產(chǎn)生有益的效果。
需要說明的是,本發(fā)明中提及的術(shù)語“計算機終端”是廣義上的術(shù)語,其可包括例如服務(wù)器、個人電腦、筆記本電腦、平板電腦、智能手機等,其既可以是例如服務(wù)器和個人電腦、智能手機的組合,也可以是單個計算機設(shè)備。另外,“計算機設(shè)備”也是一個廣義上的術(shù)語,可以是例如服務(wù)器、個人電腦、筆記本電腦、平板電腦、智能手機等。
此外,在本發(fā)明的方法描述中,可能對各個步驟進行了編號,然而,這樣的編號僅僅是為了方便描述,而并不意味著,這些方法必須按照所列序號依次進行,除非,在描述中明確地指出了執(zhí)行這些步驟的先后順序或者根據(jù)上下文的邏輯關(guān)系這些步驟必須先后進行。否則,這些步驟的執(zhí)行順序可以根據(jù)需要調(diào)整。
根據(jù)本發(fā)明的一個實施方式,提供一種用戶查詢意圖理解方法、系統(tǒng)及計算機終端,包括:
S1以預(yù)定意圖領(lǐng)域的種子概念為起點,爬取知識庫內(nèi)與該領(lǐng)域相關(guān)的概念和所述概念的分類標(biāo)簽;
S2根據(jù)爬取的所述概念和所述概念的分類標(biāo)簽建立預(yù)定意圖領(lǐng)域的概念鏈接圖;
S3計算所述概念鏈接圖中概念節(jié)點屬于預(yù)定意圖領(lǐng)域的概率;
S4獲取用戶查詢語句,檢索所述概念鏈接圖,若所述用戶查詢語句覆蓋所述概念節(jié)點,返回所述概念節(jié)點所示概念;否則利用深度學(xué)習(xí)模型,計算所述用戶查詢語句和所述概念節(jié)點之間的相似度,并返回與所述用戶查詢語句最相似的前K個概念;
S5根據(jù)返回結(jié)果和所述概念節(jié)點屬于預(yù)定意圖領(lǐng)域的概率,計算所述用戶查詢語句屬于預(yù)定意圖領(lǐng)域的概率,并與預(yù)定閾值相比較以判斷是否屬于所述預(yù)定意圖領(lǐng)域。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門太迪智能科技有限公司,未經(jīng)廈門太迪智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711487965.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 計算機輔助聚變堆概念設(shè)計系統(tǒng)及方法
- 經(jīng)由多個通過預(yù)定關(guān)系連接在一起的概念節(jié)點定義人造大腦的方法和裝置
- 個人大數(shù)據(jù)管理中層次概念向量化增量處理方法
- 一種概念間知識可視化方法及系統(tǒng)
- 用戶查詢意圖理解方法、系統(tǒng)及計算機終端
- 一種醫(yī)學(xué)術(shù)語庫的存儲方法和裝置
- 藥囑風(fēng)險提示方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種概念節(jié)點的生成方法、裝置及相關(guān)產(chǎn)品
- 基于知識圖譜最短路徑查詢的搜索系統(tǒng)、方法及設(shè)備
- 基于動態(tài)優(yōu)化的圖模型語義查詢擴展方法和裝置





