[發明專利]一種獲取目標事件的數據處理系統有效
| 申請號: | 202210856529.8 | 申請日: | 2022-07-21 |
| 公開(公告)號: | CN114925692B | 公開(公告)日: | 2022-10-11 |
| 發明(設計)人: | 傅曉航;劉羽;張正義;劉宸 | 申請(專利權)人: | 中科雨辰科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06K9/62;G06F16/33 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 安娜 |
| 地址: | 100093 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 獲取 目標 事件 數據處理系統 | ||
1.一種獲取目標事件的數據處理系統,其特征在于,所述系統包括:數據庫、處理器和存儲有計算機程序的存儲器,其中,所述數據庫包括:初始文本集A={A1,……,Ai,……,An},Ai是指第i個事件對應的初始文本列表,i=1……n,n為事件數量,當所述計算機程序被處理器執行時,實現以下步驟:
S100、獲取目標語句且對目標語句進行分詞處理,獲取目標語句對應的目標共現詞列表D={D1,……,Dt,……,Dk},Dt是指目標語句中第t個目標共現詞,t=1……k,k是指目標語句中目標共現詞數量,其中,目標共現詞是指在目標語句中共同出現的目標詞,任一目標共現詞包括第一目標詞和第二目標詞,其中,第一目標詞和第二目標詞是從目標詞列表中獲取任意兩個目標詞且第一目標詞與第二目標詞不一致;
S200、根據Ai,獲取Ai對應的關鍵共現詞列表Hi={Hi1,……,Hiy,……,},Hiy是指Ai對應的第y個關鍵共現詞,y=1……qi,qi是指Ai中關鍵共現詞數量;
S300、根據D和Hi,獲取目標語句對應的相似度列表F={F1,……Fi,……,Fn},Fi是指目標語句與Ai對應的事件之間的相似度,Fi符合如下條件:
,其中,Ftiy是指Dt與Hiy之間的相似度,Wiy是指Hiy對應的權重值,在S300步驟中,Ftiy符合如下條件:
,其中,MKtγ是指Dt對應的詞向量中第γ位bit值,NKiyγ是指Hiy對應的詞向量中第γ位bit值,γ=1……φ,φ是指詞向量中向量維度;
其中,在S300步驟中還通過如下步驟獲取MKtγ:
S311、獲取Dt={Dt1,Dt2},其中,Dt1是指第t個目標共現詞中第一個目標詞,Dt2是指第t個目標共現詞中第二個目標詞;
S312、將Dt1和Dt2分別輸入至預訓練語言模型中,得到Dt1對應的詞向量Qt1=(Q1t1,……,Qγt1,……,Qφt1),Qγt1是指第t個目標共現詞中第一個目標詞對應的第γ位bit值,以及Dt2對應的詞向量Qt2=(Q1t2,……,Qγt2,……,Qφt2),Qγt2是指第t個目標共現詞中第二個目標詞對應的第γ位bit值;
S313、根據Qγt1和Qγt2,獲取MKtγ,其中,MKtγ符合如下條件:
MKtγ=Qγt1+Qγt2;
其中,在S300步驟中還通過如下步驟獲取NKiyγ:
S321、獲取Hiy={H1iy,H2iy},其中,H1iy是指第y個關鍵共現詞中第一個關鍵詞,H2iy是指第y個關鍵共現詞中第二個關鍵詞;
S322、將H1iy和H2iy分別輸入至預訓練語言模型中,得到H1iy對應的詞向量P1iy=(P11iy,……,P1γiy,……,P1φiy),P1γiy是指第y個關鍵共現詞中第一個關鍵詞對應的第γ位bit值,以及Dt2對應的詞向量P2iy=(P21iy,……,P2γiy,……,P2φiy),P2γiy是指第y個關鍵共現詞中第二個關鍵詞對應的第γ位bit值;
S323、根據P1γiy和P2γiy,獲取NKtγ,其中,NKtγ符合如下條件:
NKiyγ=P1γiy+P2γiy;
S400、當Fi>預設的相似度閾值時,將Fi對應的事件作為目標事件;
S500、根據目標事件對應的初始文本列表,獲取目標事件對應的事件特征集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科雨辰科技有限公司,未經中科雨辰科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210856529.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能電網智能光纖對接機械手
- 下一篇:一種代餐粉粉劑混合加工設備





