[發(fā)明專利]基于圖結(jié)構(gòu)的公文推薦方法、裝置、計算機(jī)設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 202010475897.9 | 申請日: | 2020-05-29 |
| 公開(公告)號: | CN111666401B | 公開(公告)日: | 2023-06-30 |
| 發(fā)明(設(shè)計)人: | 謝靜文;阮曉雯;徐亮 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F18/22 |
| 代理公司: | 深圳眾鼎專利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 結(jié)構(gòu) 公文 推薦 方法 裝置 計算機(jī) 設(shè)備 介質(zhì) | ||
1.一種基于圖結(jié)構(gòu)的公文推薦方法,其特征在于,包括:
獲取具有不同公文類型的多種公文,根據(jù)TF-IDF基于預(yù)設(shè)的詞語統(tǒng)計特征確定獲取的所述公文中的特征詞語,根據(jù)TF-IDF篩選出現(xiàn)頻率大于或等于預(yù)設(shè)頻率的特征詞語,并將篩選出的所述特征詞語記錄為與其對應(yīng)的所述公文的關(guān)鍵詞標(biāo)簽;
將所述公文輸入至預(yù)設(shè)的LDA主題模型,通過所述LDA主題模型計算所述公文中的文本主題-關(guān)鍵詞的分布概率矩陣,再獲取所述LDA主題模型根據(jù)所述公文的文本主題-關(guān)鍵詞的分布概率矩陣篩選出的選取概率大于或等于預(yù)設(shè)概率的所述文本主題,并將篩選出的所述文本主題記錄為與其對應(yīng)的所述公文的主題標(biāo)簽;所述文本主題-關(guān)鍵詞的分布概率矩陣中包含多個所述選取概率,所述選取概率是指所述公文中的關(guān)鍵詞屬于該公文的文本主題的概率;
根據(jù)所述關(guān)鍵詞標(biāo)簽和所述主題標(biāo)簽生成公文屬性;
根據(jù)每一種公文類型獲取所述公文的記錄數(shù)據(jù),通過Neo4j框架根據(jù)所述公文的所述記錄數(shù)據(jù)和所述公文屬性建立基于圖結(jié)構(gòu)的公文推薦庫;所述公文推薦庫中包含多個圖結(jié)構(gòu),一個所述圖結(jié)構(gòu)對應(yīng)至少一種所述公文類型的所述公文,一個所述圖結(jié)構(gòu)中包含相互連接的多個節(jié)點(diǎn);一個所述節(jié)點(diǎn)代表所述記錄數(shù)據(jù)、所述關(guān)鍵詞標(biāo)簽和所述主題標(biāo)簽中的一種;
接收到用戶自所述公文推薦庫中輸入的檢索內(nèi)容,依據(jù)SimRank計算出的相似度的高低次序輸出目標(biāo)公文;所述相似度是指所述檢索內(nèi)容與所述節(jié)點(diǎn)的相似度。
2.根據(jù)權(quán)利要求1所述的基于圖結(jié)構(gòu)的公文推薦方法,其特征在于,所述獲取具有不同公文類型的多種公文之前,還包括:
通過已訓(xùn)練成功的BERT模型對所述公文的整體篇章結(jié)構(gòu)進(jìn)行分析,得到一個對所述公文的整體篇章結(jié)構(gòu)的分析結(jié)果;所述整體篇章結(jié)構(gòu)是指所述公文的各個組成結(jié)構(gòu),所述分析結(jié)果是對所述公文的各個所述組成結(jié)構(gòu)的完整性和合理性進(jìn)行判斷的結(jié)果;
在所述分析結(jié)果為所述公文的其中一個組成結(jié)構(gòu)不具備所述完整性或/和所述合理性時,從所述公文中提取出所述公文中缺失的所述組成結(jié)構(gòu)或/和不合理的所述組成結(jié)構(gòu),以突出顯示的形式標(biāo)注出所述公文中缺失的所述組成結(jié)構(gòu)或/和不合理的所述組成結(jié)構(gòu),并令預(yù)設(shè)數(shù)據(jù)接收方對該公文進(jìn)行修改。
3.根據(jù)權(quán)利要求1所述的基于圖結(jié)構(gòu)的公文推薦方法,其特征在于,所述公文屬性還包括數(shù)字實(shí)體;所述通過Neo4j框架根據(jù)所述公文的所述記錄數(shù)據(jù)和所述公文屬性建立基于圖結(jié)構(gòu)的公文推薦庫之前,還包括:
通過預(yù)設(shè)規(guī)則模板中的目標(biāo)實(shí)體表達(dá)式對所述公文進(jìn)行數(shù)字實(shí)體搜索后定位出所述數(shù)字實(shí)體的目標(biāo)位置,并通過所述預(yù)設(shè)規(guī)則模板中的抓取規(guī)則表達(dá)式從所述目標(biāo)位置抓取所述數(shù)字實(shí)體。
4.根據(jù)權(quán)利要求1所述的基于圖結(jié)構(gòu)的公文推薦方法,其特征在于,所述公文屬性還包括公文來文時間和來文單位;所述通過Neo4j框架根據(jù)所述公文的所述記錄數(shù)據(jù)和所述公文屬性建立基于圖結(jié)構(gòu)的公文推薦庫之前,還包括:
獲取所述公文的公文內(nèi)容,通過NLP模型從所述公文內(nèi)容中識別出與時間組成成分對應(yīng)的所述公文來文時間以及與單位組成成分對應(yīng)的所述來文單位;
所述根據(jù)所述關(guān)鍵詞標(biāo)簽和所述主題標(biāo)簽生成公文屬性,包括:
根據(jù)所述公文來文時間、所述來文單位、所述關(guān)鍵詞標(biāo)簽和所述主題標(biāo)簽生成所述公文屬性。
5.根據(jù)權(quán)利要求1所述的基于圖結(jié)構(gòu)的公文推薦方法,其特征在于,所述通過Neo4j框架根據(jù)所述公文的所述記錄數(shù)據(jù)和所述公文屬性建立基于圖結(jié)構(gòu)的公文推薦庫,包括:
通過Neo4j框架中的創(chuàng)建節(jié)點(diǎn)語句依據(jù)節(jié)點(diǎn)屬性搭建出與所述公文對應(yīng)的各個節(jié)點(diǎn);所述節(jié)點(diǎn)屬性與所述記錄數(shù)據(jù)和所述公文屬性分別對應(yīng);
通過Neo4j框架中的創(chuàng)建關(guān)系語句依據(jù)預(yù)設(shè)關(guān)系搭建出各個所述節(jié)點(diǎn)之間的連接關(guān)系;所述預(yù)設(shè)關(guān)系與所述記錄數(shù)據(jù)和所述公文屬性分別對應(yīng);
通過Neo4j框架中的路徑語句依據(jù)所述連接關(guān)系確定出所有所述節(jié)點(diǎn)的路徑,建立完成基于圖結(jié)構(gòu)的所述公文推薦庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010475897.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





