[發明專利]一種識別符號的數據處理系統有效
| 申請號: | 202210856545.7 | 申請日: | 2022-07-21 |
| 公開(公告)號: | CN115169319B | 公開(公告)日: | 2023-02-07 |
| 發明(設計)人: | 劉羽;張正義;劉宸;傅曉航 | 申請(專利權)人: | 中科雨辰科技有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/295 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 安娜 |
| 地址: | 100093 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 符號 數據處理系統 | ||
本發明涉一種識別符號的數據處理系統包括:數據庫、處理器和存儲有計算機程序的存儲器,當所述計算機程序被處理器執行時,實現以下步驟:獲取任一事件對應的第一文本列表和第二文本列表;根據每一第一文本,獲取第一文本列表對應的目標三元組;根據任一第二文本,獲取第二文本對應的關鍵三元組,當關鍵三元組中任一關鍵組元為空集時,獲取第二文本對應的的相似度且當第二文本對應的的相似度不小于預設的相似度閾值時,確定關鍵組元為目標三元組對應的組元,當第二文本對應的的相似度小于預設的相似度閾值時,將關鍵組元標記為異常符號;能夠知曉文本中符號表征的含義,進而準確的通過網絡本文內容的知曉發生的事件。
技術領域
本發明涉及實體識別技術領域,尤其涉及一種識別符號的數據處理系統。
背景技術
隨著網絡時代的到來,互聯網用戶越來越主動的獲取網絡內容并參與到內容的創建,其中的一種重要的形式就是基于社交媒體。社交媒體顧名思義是用于社交的,隨著社交用戶的增長,其內部逐漸形成了一張或重合的多張社交網絡,社交信息可以沿著該網絡在用戶之間傳播。一般說來,社交媒體用戶可以直接獲取他所關注用戶所發的社交信息,用圖論觀點來說就是能夠從鄰接用戶那里獲取信息。雖然社交網絡結構十分復雜,但根據六度分割理論,其直徑不會太大,所以通過社交用戶的轉發,信息在社交網絡上能夠突破地域限制,得到迅速的傳播,通過對社交媒體信息的獲取,人們可以最快的獲取現實生活中所發生的事件。但是,在社交媒體涉及文本中會出現通過符號代替某一詞組或單詞的情況,導致無法通過本文內容的知曉發生的事件。
發明內容
針對上述技術問題,本發明采用的技術方案為一種識別符號的數據處理系統,所述系統包括:數據庫、處理器和存儲有計算機程序的存儲器,其中,所述數據庫包括:時間的目標文本集A={A1,……,Ai,……,An},Ai是指第i個事件對應的目標文本列表,i=1……n,n為事件數量,當所述計算機程序被處理器執行時,實現以下步驟:
S100、獲取Ai對應的第一文本列表Ci={Ci1,……,Cix,……,Cip},Cix是指第i個目標事件的第x個第一文本,x=1……p,p為第i個目標事件的第一文本數量,以及Ai對應的第二文本列表Di={Di1,……,Diy,……,Diq},Diy是指第i個目標事件的第y個第二文本,y=1……q,q為第i個目標事件的第二文本數量;
S200、根據每一Cix,獲取Ci對應的目標三元組C'i={C'i1,C'i2,C'i3},其中,C'i1是指Ci的第一目標實體,C'i2是指Ci的第二目標實體,C'i3是指C'i1和C'i2之間的目標關系;
S300、根據Diy,獲取Diy對應的關鍵三元組Hiy={H1iy,H2iy,H3iy},H1iy是指Diy的第一關鍵實體,H2iy是指Diy的第二關鍵實體,H3iy是指H1iy和H2iy之間的關鍵關系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科雨辰科技有限公司,未經中科雨辰科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210856545.7/2.html,轉載請聲明來源鉆瓜專利網。





