[發明專利]一種AI智能文本處理系統在審
| 申請號: | 202110658733.4 | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113536775A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 雷果;車新奕 | 申請(專利權)人: | 深圳勝力新科技有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/279 |
| 代理公司: | 亳州速誠知識產權代理事務所(普通合伙) 34157 | 代理人: | 艾玲 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 ai 智能 文本 處理 系統 | ||
1.一種AI智能文本處理系統,其特征在于,包括文本輸入模塊、網文數據導入模塊、信息處理模塊、統計模塊、轉存模塊、信息存儲云端、檢索模塊、信息分析模塊、預警分級模塊、總控模塊與預警消息發送模塊;
其中,所述文本輸入模塊、網文數據導入模塊通信連接信息處理模塊,且信息處理模塊通信連接統計模塊,所述統計模塊通信連接轉存模塊與信息分析模塊,且轉存模塊通信連接信息存儲云端,所述信息存儲云端通信連接檢索模塊,所述信息分析模塊通信連接預警分級模塊,且預警分級模塊通信連接總控模塊,所述總控模塊通信連接預警消息發送模塊;
所述文本輸入模塊用以輸入文本信息并將文本信息輸送給信息處理模塊,所述網文數據導入模塊用以導入已公布的網文數據,并將導入的網文數據輸送給信息處理模塊,所述信息處理模塊構建非正常檢測模型,并將接收的文本信息與已公布的網文數據輸入到非正常檢測模型進行檢測,最后將檢測結果輸送給統計模塊,所述統計模塊接收檢測結果并對檢測結果中進行分類統計,將分類統計后的檢測結果復制成兩份分別輸送給轉存模塊與信息分析模塊,所述信息分析模塊接收分類統計后的檢測結果進行預警分析,并將預警分析結果輸送給預警分級模塊,所述預警分級模塊對預警分析結果進行分級并將分級結果信息輸送給總控模塊,所述總控模塊會將接收到的分級結果信息轉化為控制指令并將控制指令發送到預警消息發送模塊中,所述預警消息發送模塊在接收到控制指令后會將預警消息發送出去,所述轉存模塊接收分類統計后的檢測結果并將接收到的檢測結果發送到信息儲存云端中儲存起來,所述檢索模塊讓用戶可以隨時調取以往檢測結果;
所述非正常檢測模型的具體構建過程為:
S1:檢測文本信息是否存在抄襲現象,具體為:
S101:將文本信息中的對話語句提取出來,標記為A;
S102:將網文數據中的對話語句提取出來,標記為B;
S103:檢測A與B的文字重合度;
S104:若重合度小于45%,則輸出檢測結果為無抄襲現象;若重合度大于或等于45%,則進入下一步驟;
S105:提取A中含有的語氣詞,標記為Pi,i=1…n;
S106:提取B中含有的語氣詞,標記為Nj,j=1…n;;
S107:將Pi與Nj進行匹配,若Pi與Nj的匹配重合數量小于預設值,則輸出檢測結果為無抄襲現象;若Pi與Nj的匹配重合數量大于或等于預設值,則輸出檢測結果為存在抄襲現象;
S2:檢測文本信息是否存在重復字現象,具體為:
S201:將文本信息中任意一個字標記為C1;
S201:將文本信息中距離C1最近的相同字標記為C2;
S201:識別C1與C2之間間隔字節的數量,標記為D;
S201:若D3,則輸出檢測結果為無重復字現象;否則,進入下一步驟;
S201:通過AI識別C1與C2所在語句是否通暢,若通暢則輸出檢測結果為無重復字現象;若不通暢則輸出檢測結果為存在重復字現象;
S3:檢測文本信息是否存在錯別字現象,具體為:
S301:將文本信息中任意一個字標記為E;
S302:將E所在詞語標記為F;
S303:將用戶以往用E所組成的詞語標記為Gi,i=1…n;
S304:將F與Gi進行匹配;
S305:若F與任一一個Gi匹配,則輸出檢測結果為無錯別字現象;若F不與任一一個Gi匹配,則輸出檢測結果為存在錯別字現象。
2.根據權利要求1所述的一種AI智能文本處理系統,其特征在于,所述統計模塊的具體分類統計過程為:
步驟一:接收非正常檢測模型傳來的檢測結果;
步驟一:將檢測結果中的抄襲現象、重復字現象與錯別字現象分別區分出來;
步驟一:對區分后的抄襲現象、重復字現象與錯別字現象進行數量統計。
3.根據權利要求1所述的一種AI智能文本處理系統,其特征在于,所述信息分析模塊的預警分析具體過程為:
(1):將抄襲現象的數量標記為Z;
(2):若Z大于預設值,則發出抄襲預警;
(3):將重復字現象的數量標記為K;
(4):若K大于預設值,則發出重復字預警;
(5):將錯別字現象的數量標記為J;
(6):若J大于預設值,則發出錯別字預警;
(7):將上述預警結果發送給預警分級模塊。
4.根據權利要求3所述的一種AI智能文本處理系統,其特征在于,所述預警分級模塊在收到預警分析結果后對預警分析結果進行分級的具體過程為:
1):若收到的預警分析結果為抄襲預警、重復字預警、錯別字預警中任意一項,則發出一級預警;
2):若收到的預警分析結果為抄襲預警、重復字預警、錯別字預警中任意兩項,則發出二級預警;
3):若收到的預警分析結果為抄襲預警、重復字預警、錯別字預警中所有項,則發出三級預警;
4):若收到的預警分析結果沒有包括抄襲預警、重復字預警、錯別字預警中任意一項,則不發出預警。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳勝力新科技有限公司,未經深圳勝力新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110658733.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據傳輸的方法及裝置
- 下一篇:微球及其制備方法、檢測方法





