[發明專利]一種基于語言模型的目標群組檢索方法、裝置及存儲介質在審
| 申請號: | 202111152187.3 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113946667A | 公開(公告)日: | 2022-01-18 |
| 發明(設計)人: | 姚華南;聶羽丞;歐陽佳;程宜華;梁上松 | 申請(專利權)人: | 廣州密碼營地科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06N5/04 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 余凱歡 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語言 模型 目標 檢索 方法 裝置 存儲 介質 | ||
1.一種基于語言模型的目標群組檢索方法,其特征在于,包括:
獲取目標群組的查詢語句,根據所述查詢語句遍歷目標實體內部的候選群組,計算每個所述候選群組的專業能力量化指標;
對不同候選群組的所述專業能力量化指標進行排序;
根據所述排序的結果,從不同候選群組中確定目標領域下目標群組的最優檢索結果。
2.根據權利要求1所述的一種基于語言模型的目標群組檢索方法,其特征在于,所述計算每個所述候選群組的專業能力量化指標,包括:
根據所述目標實體內部文檔,通過語言模型計算所述候選群組中任一候選對象與所述查詢語句之間的第一相關度;
根據貝葉斯公式和所述第一相關度,計算所述候選對象與所述查詢語句之間的第二相關度;
計算所述候選對象與所述候選群組之間的第三相關度;
根據所述第二相關度和所述第三相關度,計算所述候選群組與所述查詢語句之間的第四相關度;
將所述第四相關度作為所述候選群組在所述查詢語句對應的領域下的專業能力量化指標。
3.根據權利要求2所述的一種基于語言模型的目標群組檢索方法,其特征在于,所述根據所述目標實體內部文檔,通過語言模型計算所述候選群組中任一候選對象與所述查詢語句之間的第一相關度,包括:
通過語言模型計算給定所述目標實體內部文檔時,文檔中各個詞匯的第一后驗概率;
通過所述語言模型計算給定所述候選對象時,所述目標實體內部文檔的第二后驗概率;
根據所述第一后驗概率和所述第二后驗概率,計算所述候選群組中任一候選對象與所述查詢語句之間的第一相關度。
4.根據權利要求3所述的一種基于語言模型的目標群組檢索方法,其特征在于,
所述語言模型包括第一語言模型和第二語言模型;
所述第一語言模型的表達式為:
p(q|ex)代表第一相關度;p(t|θd)代表給定目標實體內部文檔d時詞匯t的后驗概率;p(d|θex)代表在給定候選對象ex時目標實體內部文檔d的后驗概率;θd和θex分別是所述目標實體內部文檔和所述候選對象的分布模型;n(t,q)代表所述查詢語句q中詞匯t出現的次數;
所述第二語言模型的表達式為:
p(q|ex)代表第一相關度;p(t|θd)代表給定目標實體內部文檔d時詞匯t的后驗概率;n(t,q)代表所述查詢語句q中詞匯t出現的次數;p(d|θex)代表在給定候選對象ex時目標實體內部文檔d的后驗概率。
5.根據權利要求2所述的一種基于語言模型的目標群組檢索方法,其特征在于,所述候選對象與所述查詢語句之間的第二相關度的計算公式為:
其中,p(ex|q)代表所述第二相關度;p(q|ex)代表第一相關度;P(ex)是所述候選對象選擇的概率;p(q)為查詢語句q的概率。
6.根據權利要求1所述的一種基于語言模型的目標群組檢索方法,其特征在于,所述第三相關度的計算公式為:
其中,a(ex,g)代表第三相關度;|g|代表所述候選群組g中的人員數量。
7.一種基于語言模型的目標群組檢索裝置,其特征在于,包括:
第一模塊,用于獲取目標群組的查詢語句,根據所述查詢語句遍歷目標實體內部的候選群組,計算每個所述候選群組的專業能力量化指標;
第二模塊,用于對不同候選群組的所述專業能力量化指標進行排序;
第三模塊,用于根據所述排序的結果,從不同候選群組中確定目標領域下目標群組的最優檢索結果。
8.一種電子設備,其特征在于,包括處理器以及存儲器;
所述存儲器用于存儲程序;
所述處理器執行所述程序實現如權利要求1至6中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州密碼營地科技有限公司,未經廣州密碼營地科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111152187.3/1.html,轉載請聲明來源鉆瓜專利網。





