[發(fā)明專利]一種基于NLP事件匹配政策推薦方法、系統(tǒng)及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202310088652.4 | 申請日: | 2023-02-09 |
| 公開(公告)號: | CN116108139A | 公開(公告)日: | 2023-05-12 |
| 發(fā)明(設計)人: | 郭海濤;陳恩澤;張勃濤 | 申請(專利權)人: | 安徽智侒信信息技術有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/335 |
| 代理公司: | 北京深川專利代理事務所(普通合伙) 16058 | 代理人: | 郭麗紅 |
| 地址: | 230000 安徽省合*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 nlp 事件 匹配 政策 推薦 方法 系統(tǒng) 存儲 介質(zhì) | ||
本發(fā)明提供了一種基于NLP文本多標簽分類的政策匹配方法,包括以下步驟;S1、將激勵項的每個條件看作一個事件,基于NLP技術,實現(xiàn)事件抽取,生成整個激勵項的邏輯表達式;S2、事件抽取;S3、將每個事件轉(zhuǎn)化為邏輯表達式;S4、連接所有事件邏輯表達式,生成該激勵項所對應的條件的邏輯表達式;S5.結構化,將所生成的表達式,以及該激勵項中所有事件所對應的數(shù)據(jù)庫表名和各事件各個要素所對應到的表字段名,使用一個表,組織起來,以備后面的匹配計算使用;S6、匹配引擎。本發(fā)明的優(yōu)點在于:實現(xiàn)更細粒度的匹配,有更高的匹配準確率。
技術領域
本發(fā)明涉及激勵性申報政策技術領域,尤其涉及一種基于NLP事件匹配政策推薦方法、系統(tǒng)及存儲介質(zhì)。
背景技術
近年來,面對復雜嚴峻的國際環(huán)境和疫情頻發(fā)帶來的多重考驗,各級政府出臺了一系列助企惠企政策,助力經(jīng)濟穩(wěn)進提質(zhì)。但企業(yè)如何從大量政策文件中得到自身最需要的信息,政府如何將對應的政策精準投送到目標企業(yè),是當前政府和企業(yè)共同面臨的問題。通過人工智能技術,特別是NLP技術,實現(xiàn)政策與企業(yè)的精準匹配,對企業(yè)來說,能第一時間找到對應的政策,第一時間享受政策惠企紅利;對政府來說,變“企業(yè)找政策”為“政策主動匹配企業(yè)”,實現(xiàn)政策精準及時的投送,是一件非常有意義的事情。本專利主要針對激勵性申報類的政策,也是價值最大的政策的精準匹配。
然而,政策文本本身的一些特征,使得在技術實現(xiàn)上具有很大的挑戰(zhàn)。政策文本處理本身比較復雜,具體表現(xiàn)為:
(1)政策文章通常比較長,通常為幾千字;
(2)類型比較多:政策法規(guī)、申報通知、通知公告等;每種有不同的目的,都需要單獨處理;
(3)面向群體較多:政府機構、事業(yè)單位、企業(yè)、個人等,需要根據(jù)面向的目標,進行過濾;
(4)行文雖然比較正式,但偏普通文本,表達方式比較自由;
(5)抽象概念多,且不提供出處。
當前的主要方法,大多在文檔級別上,對一個政策中的主要信息進行標簽化,然后再根據(jù)企業(yè)信息生成對應標簽,通過政策和企業(yè)側(cè)兩類標簽的相似性,來實現(xiàn)相似性的匹配。很顯然,在這種方法中,標簽之間通常是獨立的,很難考慮對具體限定條件的抽象,所以也就很難實現(xiàn)精準匹配。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術的不足,本發(fā)明提供一種實現(xiàn)更細粒度的匹配,有更高的匹配準確率的基于NLP文本多標簽分類的政策匹配方法。
為解決上述技術問題,本發(fā)明提供的技術方案為:一種基于NLP文本多標簽分類的政策匹配方法,包括以下步驟;
S1、將激勵項的每個條件看作一個事件,基于NLP技術,實現(xiàn)事件抽取,對事件的每個要素預測其邏輯表達式,預測事件內(nèi)每個要素之間的邏輯關系,連接事件內(nèi)所有要素所形成的邏輯表達式,生成事件對應的邏輯表達式,最后,預測一個激勵項內(nèi)所有事件間的邏輯關系,連接事件所對應的邏輯表達式,從而生成整個激勵項的邏輯表達式;
S2、事件抽取,將激勵項中每個條件中所涉及的要素提取出來,對信息分類組織,將每個事件所涉及的信息,放到一個數(shù)據(jù)庫表中,表名定義為事件類型,表字段為事件要素名;
S3、將每個事件轉(zhuǎn)化為邏輯表達式;
S3.1、參考事件中的要素所在的上下文,定義一個分類器,記為分類器1,判別該要素和值之間的邏輯運算類型,每個事件,將所識別出來的要素文本片段,前后加入對應的開始和結束標識符,要素和觸發(fā)詞分別用e和t開頭加數(shù)字進行編號,將這些字符對應到bert預訓練模型詞表中unused*字符。將拼接好的字符串作為詞嵌入,連同位置嵌入和segment嵌入,送入分類器1,預測出對應的邏輯運算符;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽智侒信信息技術有限公司,未經(jīng)安徽智侒信信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310088652.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





