[發(fā)明專利]關(guān)聯(lián)關(guān)系確定方法、裝置、電子設(shè)備及可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910957640.4 | 申請日: | 2019-10-09 |
| 公開(公告)號: | CN110704578B | 公開(公告)日: | 2022-08-09 |
| 發(fā)明(設(shè)計)人: | 張佩晴 | 申請(專利權(quán))人: | 北京秒針人工智能科技有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/332;G06F40/289;G06F40/30 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 孔默 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)聯(lián) 關(guān)系 確定 方法 裝置 電子設(shè)備 可讀 存儲 介質(zhì) | ||
本申請?zhí)峁┮环N關(guān)聯(lián)關(guān)系確定方法、裝置、電子設(shè)備及可讀存儲介質(zhì),包括:對目標(biāo)類型關(guān)鍵詞以及目標(biāo)類型關(guān)鍵詞對應(yīng)的包含詞進行搜索,獲得包括有目標(biāo)類型關(guān)鍵詞或目標(biāo)類型關(guān)鍵詞對應(yīng)的包含詞的多個搜索結(jié)果文本;根據(jù)預(yù)先存儲的多個標(biāo)簽,對多個搜索結(jié)果文本中的每個搜索結(jié)果文本添加標(biāo)簽;根據(jù)標(biāo)簽,將搜索結(jié)果文本中屬于同一詞義的文本內(nèi)容作為同一詞組;對不屬于同一類型的任意兩個詞組,根據(jù)兩個詞組在搜索結(jié)果文本中的距離,確定兩個詞組分別對應(yīng)的詞義是否存在關(guān)聯(lián)關(guān)系。根據(jù)不同類型的詞組在同一搜索結(jié)果文本中的距離來判斷詞組之間是否存在關(guān)聯(lián)關(guān)系,改善現(xiàn)有技術(shù)無法較好分辨同一文本中的兩個類型分別對應(yīng)的關(guān)鍵詞是否存在關(guān)聯(lián)的問題。
技術(shù)領(lǐng)域
本申請涉及信息檢索領(lǐng)域,具體而言,涉及一種關(guān)聯(lián)關(guān)系確定方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
現(xiàn)有技術(shù)中,利用Elasticsearch存儲文本時,會將文本分成多個關(guān)鍵詞,然后以倒排索引的方式來存儲該分成多個關(guān)鍵詞的文本。這樣,用戶在使用關(guān)鍵詞查詢時,可以快捷地找到具有相應(yīng)關(guān)鍵詞的文本。
在某一文本中,若某一關(guān)鍵詞只出現(xiàn)在文本開頭,另一關(guān)鍵詞只出現(xiàn)在文本末尾,則這兩個關(guān)鍵詞通常不具備關(guān)聯(lián)關(guān)系。然而,如果用戶使用Elasticsearch進行關(guān)鍵詞查詢,由于兩個關(guān)鍵詞出現(xiàn)在同一文本中,因此會被Elasticsearch作為查詢結(jié)果返回給用戶,造成用戶誤以為兩個關(guān)鍵詞存在關(guān)聯(lián)關(guān)系的情況。
發(fā)明內(nèi)容
本申請實施例的目的在于提供一種關(guān)聯(lián)關(guān)系確定方法、裝置、電子設(shè)備及可讀存儲介質(zhì),用以改善現(xiàn)有技術(shù)中容易被用戶誤認(rèn)為存在關(guān)聯(lián)關(guān)系的問題。
第一方面,本申請實施例提供了一種關(guān)聯(lián)關(guān)系確定方法,用于對預(yù)先存儲的多個類型關(guān)鍵詞中的任一個類型關(guān)鍵詞進行處理,所述多個類型關(guān)鍵詞均屬于同一類型,所述方法包括:對目標(biāo)類型關(guān)鍵詞以及所述目標(biāo)類型關(guān)鍵詞對應(yīng)的包含詞進行搜索,獲得包括有所述目標(biāo)類型關(guān)鍵詞或所述目標(biāo)類型關(guān)鍵詞對應(yīng)的包含詞的多個搜索結(jié)果文本,其中,所述目標(biāo)類型關(guān)鍵詞以及對應(yīng)的包含詞表征同一詞義;根據(jù)預(yù)先存儲的多個標(biāo)簽,對所述多個搜索結(jié)果文本中的每個搜索結(jié)果文本添加標(biāo)簽,其中,所述標(biāo)簽表征對應(yīng)的文本內(nèi)容的類型以及詞義;根據(jù)所述標(biāo)簽,將所述搜索結(jié)果文本中屬于同一詞義的文本內(nèi)容作為同一詞組;對不屬于同一類型的任意兩個詞組,根據(jù)所述兩個詞組在所述搜索結(jié)果文本中的距離,確定所述兩個詞組分別對應(yīng)的詞義是否存在關(guān)聯(lián)關(guān)系。
在上述的實施方式中,根據(jù)不同類型的詞組在同一搜索結(jié)果文本中的距離來判斷詞組之間是否存在關(guān)聯(lián)關(guān)系,改善了現(xiàn)有技術(shù)無法較好分辨同一文本中的兩個類型分別對應(yīng)的關(guān)鍵詞是否存在關(guān)聯(lián)的問題。
在一個可能的設(shè)計中,所述根據(jù)所述兩個詞組在所述搜索結(jié)果文本中的距離,確定所述兩個詞組分別對應(yīng)的詞義是否存在關(guān)聯(lián)關(guān)系,包括:若所述兩個詞組在所述搜索結(jié)果文本中分別對應(yīng)且相距最近的兩個文本內(nèi)容的距離小于預(yù)設(shè)距離,確定所述兩個詞組分別對應(yīng)的兩個詞義存在關(guān)聯(lián)關(guān)系。
在上述的實施方式中,可以將兩個詞組在搜索結(jié)果文本中相距最近的距離與預(yù)設(shè)距離進行比較,若小于預(yù)設(shè)距離,則判定上述的兩個詞組存在關(guān)聯(lián)關(guān)系。
在一個可能的設(shè)計中,在所述確定所述兩個詞組分別對應(yīng)的兩個詞義存在關(guān)聯(lián)關(guān)系之后,所述方法還包括:分別獲取所述兩個詞義的至少一個父層詞義;確定所述兩個詞義中的一個詞義及其父層詞義與所述兩個詞義中的另一個詞義及其父層詞義存在關(guān)聯(lián)關(guān)系。
在上述的實施方式中,存在關(guān)聯(lián)關(guān)系的詞義可能是較為具體且底層的詞義,在底層的詞義存在關(guān)聯(lián)關(guān)系的情況下,若底層的詞義存在父層,則一個底層的詞義對應(yīng)的父層詞義與另一個底層的詞義對應(yīng)的父層詞義也存在關(guān)聯(lián)關(guān)系,從而提高了關(guān)聯(lián)關(guān)系的適用范圍。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京秒針人工智能科技有限公司,未經(jīng)北京秒針人工智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910957640.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 關(guān)聯(lián)裝置
- 數(shù)據(jù)關(guān)聯(lián)裝置和數(shù)據(jù)關(guān)聯(lián)方法
- 安全關(guān)聯(lián)
- 設(shè)備關(guān)聯(lián)
- 終端關(guān)聯(lián)裝置和終端關(guān)聯(lián)方法
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)方法和關(guān)聯(lián)設(shè)備
- 關(guān)聯(lián)分析方法和關(guān)聯(lián)分析系統(tǒng)
- 報文關(guān)聯(lián)方法、報文關(guān)聯(lián)裝置及報文關(guān)聯(lián)系統(tǒng)





