[發明專利]基于人工智能的檢索語句語義片段獲取方法、裝置及終端有效
| 申請號: | 201710466186.3 | 申請日: | 2017-06-19 |
| 公開(公告)號: | CN107357830B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 吳玉芳 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 檢索 語句 語義 片段 獲取 方法 裝置 終端 | ||
本發明提出一種基于人工智能的檢索語句語義片段獲取方法、裝置及終端,其中,該方法包括:對獲取的檢索語句進行預處理,確定檢索語句中包括的第一主體詞及語義片段集;根據歷史檢索數據,確定語義片段集中各語義片段與第一主體詞間的關聯度;根據各語義片段與第一主體詞間的關聯度,對語義片段集進行過濾處理,確定與檢索語句對應的目標語義片段集。實現了與檢索語句對應的目標語義片段集的獲取,由于不需要人工編輯抽取模板,節省了人力資源,有利于自動化實現,且語義片段的獲取方式靈活,能自適應挖掘各種粒度的語義片段,提高了語義片段的識別效果,從而使query的檢索結果可以更好的滿足用戶需求,改善了用戶體驗。
技術領域
本發明涉及計算機技術領域,尤其涉及一種基于人工智能的檢索語句語義片段獲取方法、裝置及終端。
背景技術
人工智能(Artificial Intelligence,簡稱AI),是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。
在檢索語句(query)語義理解技術中,通常用意圖和槽位的形式結構化表示query的語義信息。其中,槽位指一些語義片段;意圖,指query的需求詞即主體詞。例如,query為“找一部不用付費的搞笑英文電影”,“電影”作為需求詞表示意圖,即query的主體詞;“不用付費的”、“搞笑”、“英文”等語義片段用于限定主體詞“電影”。
語義片段的切分邊界直接影響了槽位識別結果,從而間接影響到用戶對query檢索結果的滿意度。若語義片段的切分粒度過小,可能導致結果轉義。比如,“不用付費的”被切分成“不用”和“付費的”,槽位極可能識別成“付費的”,導致結果轉義。若語義片段的切分粒度過大,則可能導致槽位維度與資源維度不匹配,從而無法檢索到能滿足條件的結果。比如,“搞笑英文”未被切分開,而“搞笑”和“英文”在知識庫資源中分屬于兩個維度,直接用“搞笑英文”去檢索資源可能無法匹配到任何滿足條件的結果。因此,如何抽取符合理想切分邊界的語義片段,具有重要意義。
現有技術,通常使用人工編輯的模板進行query的語義片段挖掘。然而,上述方法,由于需要人工編輯積累,因此浪費了人力資源,不利于自動化實現,且由于模板不夠靈活,只能識別固定格式的語句,這就導致了語義片段的識別效果差,query的檢索結果無法滿足用戶的需求。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的第一個目的在于提出一種基于人工智能的檢索語句語義片段獲取方法,實現了與檢索語句對應的目標語義片段集的獲取,由于不需要人工編輯抽取模板,節省了人力資源,有利于自動化實現,且語義片段的獲取方式靈活,能自適應挖掘各種粒度的語義片段,提高了語義片段的識別效果,從而使query的檢索結果可以更好的滿足用戶需求,改善了用戶體驗。
本發明的第二個目的在于提出一種基于人工智能的檢索語句語義片段獲取裝置。
本發明的第三個目的在于提出一種終端。
本發明的第四個目的在于提出一種計算機可讀存儲介質。
為達上述目的,本發明第一方面實施例提出了一種基于人工智能的檢索語句語義片段獲取方法,包括:對獲取的檢索語句進行預處理,確定所述檢索語句中包括的第一主體詞及語義片段集;根據歷史檢索數據,確定所述語義片段集中各語義片段與所述第一主體詞間的關聯度;根據所述各語義片段與所述第一主體詞間的關聯度,對所述語義片段集進行過濾處理,確定與所述檢索語句對應的目標語義片段集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710466186.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:縮放比例處理方法及裝置
- 下一篇:可配置的流程實例數據分布式存儲方法及系統





