[發明專利]候選搜索詞的生成方法、裝置、設備及介質在審
| 申請號: | 202011383662.3 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112507188A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 潘祿;陳玉光 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/338;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 韓?;?/td> |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選 搜索詞 生成 方法 裝置 設備 介質 | ||
本申請公開了一種候選搜索詞的生成方法、裝置、設備及介質,涉及自然語言處理和知識圖譜技術領域。具體實現方案為:獲取目標事件的事件相關文本后,根據事件相關文本生成多個焦點概率向量,并根據目標事件的結構化信息,生成目標事件的事件語義表示向量,以根據事件語義表示向量、事件相關文本的文本語義表示向量和多個焦點概率向量生成多個候選搜索詞。由此,通過引入多個焦點概率向量,多個焦點概率向量用于指導生成多個候選搜索詞,不僅有效的提高了候選搜索詞的生成效率和準確性,還提成了候選搜索詞生成的多樣性。
技術領域
本申請公開了一種候選搜索詞的生成方法、裝置、設備及介質,涉及深度學習技術領域,具體涉及自然語言處理和知識圖譜技術領域。
背景技術
隨著互聯網發展,信息量大幅增加,為了提高信息獲取效率,節約信息獲取時間,用戶可以在各類網站的搜索框中輸入搜索詞以獲取相應的資源。例如,可以在百科類網站的搜索框中輸入一個或多個搜索詞以獲取相應的百科內容。
但是,目前大部分事件都沒有搜索詞或者很少的搜索詞,從而導致用戶搜索時并未關注到該事件。為此,提供一種用于生成事件的搜索詞的方法是至關重要的。
發明內容
本申請提供了一種候選搜索詞的生成方法、裝置、設備及介質。
本申請的一方面,提供了一種候選搜索詞的生成方法,包括:
獲取目標事件的事件相關文本,并根據所述事件相關文本生成多個焦點概率向量;
根據所述目標事件的結構化信息,生成所述目標事件的事件語義表示向量;
根據所述事件語義表示向量、所述事件相關文本的文本語義表示向量和所述多個焦點概率向量生成多個候選搜索詞。
作為本申請一方面的一種可能的實現方式,所述根據所述事件相關文本生成多個焦點概率向量,包括:
將所述事件相關文本輸入至多專家模型以生成多個專家向量,其中,所述多專家模型對所述事件相關文本的關注點不同;
將所述多個專家向量輸入至連接層以生成所述多個焦點概率向量。
作為本申請一方面的另一種可能的實現方式,所述根據所述目標事件的結構化信息,生成所述目標事件的事件語義表示向量,包括:
從所述目標事件的結構化信息中提取論元信息,并根據所述論元信息生成論元語義表示向量;
根據所述論元語義表示向量生成所述目標事件的事件語義表示向量。
作為本申請一方面的另一種可能的實現方式,所述從所述目標事件的結構化信息中提取論元信息,并根據所述論元信息生成論元語義表示向量,包括:
從所述結構化信息中提取至少一組所述論元信息;其中,各組所述論元信息中包含論元角色和論元值;
將屬于同一組所論元信息的所述論元角色和所述論元值輸入第一雙向LSTM模型以生成所述論元角色向量和論元值向量;
將所述論元角色向量和所述論元向量拼接以生成所述論元語義表示向量。
作為本申請一方面的另一種可能的實現方式,所述論元信息為多組,每一組所述論元信息具有對應的所述論元語義表示向量,所述根據所述論元語義表示向量生成所述目標事件的事件語義表示向量,包括:
將各組所述論元信息所對應的論元語義表示向量輸入至第二雙向LSTM模型以生成所述事件語義表示向量。
作為本申請一方面的另一種可能的實現方式,所述根據所述事件語義表示向量、所述事件相關文本的文本語義表示向量和所述多個焦點概率向量生成多個候選搜索詞之前,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011383662.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自觸發式寵物用喂食裝置
- 下一篇:一種醫療用高效霧化器及其使用方法





