[發明專利]同義詞生成方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910020917.0 | 申請日: | 2019-01-09 |
| 公開(公告)號: | CN111428476B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 熊健 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F40/247 | 分類號: | G06F40/247;G06F16/33 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 同義詞 生成 方法 裝置 電子設備 存儲 介質 | ||
本申請提出一種同義詞生成方法、裝置、電子設備及存儲介質,屬于計算機技術領域。其中,該方法包括:獲取待處理同義詞簇的代表詞;根據待處理同義詞簇的代表詞及同義詞簇中包含的原始同義詞對,將同義詞簇進行同義詞對改寫處理;根據改寫后的各詞對的語義相似度,確定改寫后的同義詞簇的內聚性;若改寫后的同義詞簇的內聚性滿足預設條件,則根據改寫后的同義詞簇對預設的同義詞樣本庫進行更新。由此,通過這種同義詞生成方法,降低了改寫后的同義詞簇中各詞對不同義的概率,提高了同義詞簇合成的準確率,改善了同義資源的質量。
技術領域
本申請涉及計算機技術領域,尤其涉及一種同義詞生成方法、裝置、電子設備及存儲介質。
背景技術
互聯網搜索引擎已經成為人們獲取信息的主流工具。當用戶在使用搜索引擎進行搜索時,為了能夠將與用戶所輸入的搜索詞的同義詞相匹配的網頁也包含在搜索結果中召回,可以對用戶輸入的搜索請求進行同義擴展,即在利用用戶輸入的搜索請求進行搜索的同時,也利用搜索詞的同義詞進行搜索。為了在搜索引擎中應用該技術,同義詞的挖掘是非常重要的基礎工作。
相關技術中,在對同義詞進行挖掘之后,還可以對挖掘出的同義詞簇進行合成,即按照一定的規則確定同義詞簇中的一個詞作為同義詞簇中其他詞的代表詞。比如,A和B同義,B和C同義,那么A、B、C是一個同義詞簇,如果選取的代表詞是C,那么合成結果就是A-C、B-C。
然而,這種通過選取代表詞對同義詞簇進行合成的方法,由于同義詞在傳播過程中會出現語義衰減和失真,可能使得經過傳遞后的詞對不再同義(如上例中的A和C不一定同義),從而導致同義詞合成的準確率較低,影響了同義資源的質量。
發明內容
本申請提出的同義詞生成方法、裝置、電子設備及存儲介質,用于解決相關技術中,通過選取代表詞對同義詞簇進行合成的方法,由于同義詞在傳播過程中會出現語義衰減和失真,可能使得經過傳遞后的詞對不再同義,從而導致同義詞合成的準確率較低,影響同義資源的質量的問題。
本申請一方面實施例提出的同義詞生成方法,包括:獲取待處理同義詞簇的代表詞;根據所述待處理同義詞簇的代表詞及所述同義詞簇中包含的原始同義詞對,將所述同義詞簇進行同義詞對改寫處理;根據改寫后的各詞對的語義相似度,確定改寫后的同義詞簇的內聚性;若所述改寫后的同義詞簇的內聚性滿足預設條件,則根據所述改寫后的同義詞簇對預設的同義詞樣本庫進行更新。
本申請另一方面實施例提出的同義詞生成裝置,包括:獲取模塊,用于獲取待處理同義詞簇的代表詞;改寫模塊,用于根據所述待處理同義詞簇的代表詞及所述同義詞簇中包含的原始同義詞對,將所述同義詞簇進行同義詞對改寫處理;確定模塊,用于根據改寫后的各詞對的語義相似度,確定改寫后的同義詞簇的內聚性;更新模塊,用于若所述改寫后的同義詞簇的內聚性滿足預設條件,則根據所述改寫后的同義詞簇對預設的同義詞樣本庫進行更新。
本申請再一方面實施例提出的電子設備,其包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如前所述的同義詞生成方法。
本申請再一方面實施例提出的計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現如前所述的同義詞生成方法。
本申請又一方面實施例提出的計算機程序,該程序被處理器執行時,以實現本申請實施例所述的同義詞生成方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910020917.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:確定目標人物行動軌跡的方法和裝置
- 下一篇:一種筆記本電腦支架





