[發(fā)明專利]一種基于涕液特征信息語義認知系統(tǒng)及其使用方法有效
申請?zhí)枺?/td> | 202011036158.6 | 申請日: | 2020-09-27 |
公開(公告)號: | CN112182215B | 公開(公告)日: | 2022-11-15 |
發(fā)明(設計)人: | 杜登斌 | 申請(專利權)人: | 吾征智能技術(北京)有限公司 |
主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/30;G16H50/30;G16H50/70 |
代理公司: | 武漢紅觀專利代理事務所(普通合伙) 42247 | 代理人: | 李杰梅 |
地址: | 100089 北京市海*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 基于 特征 信息 語義 認知 系統(tǒng) 及其 使用方法 | ||
1.一種基于涕液特征信息語義認知系統(tǒng),其特征在于:包括輸入單元、語義識別單元、標簽集合單元和分類輸出單元,輸入單元的輸出端與語義識別單元的輸入端信號連接,語義識別單元的輸出端分別與標簽集合單元的輸入端和分類輸出單元的輸入端信號連接;標簽集合單元的輸出端與分類輸出單元的輸入端信號連接;
輸入單元,可輸入描述涕液特征的內容,根據(jù)描述涕液特征的語言,將其轉換成文本;用文本形式來描述該涕液特征;
語義識別單元,根據(jù)輸入單元輸入的描述涕液特征的文本,識別并構建統(tǒng)一格式的待測數(shù)據(jù)的涕液特征矩陣;按照涕液顏色、涕液頻次、產生時段、涕液形態(tài)和伴隨癥狀作為涕液特征的順序進行TF-IDF識別,將上述涕液特征矩陣的行向量為對應涕液特征,涕液特征矩陣的列向量為行對應涕液特征相應的值,構建涕液特征矩陣;
標簽集合單元,包括若干標簽集合,其儲存并定期更新內部的標簽集合的內容;每個標簽集合包括若干個標簽;
分類輸出單元,結合語義識別單元輸入的涕液特征矩陣,并從標簽集合單元選取標簽集合,求取涕液特征矩陣的K鄰域,并將各K鄰域對應的標簽集合中的標簽分別進行輸出,根據(jù)各K鄰域輸出的標簽結果判斷涕液特征的文本對應的標簽;
所述結合語義識別單元輸入的涕液特征矩陣,并從標簽集合單元選取標簽集合,求取涕液特征矩陣的K鄰域,是將得到涕液特征矩陣作為一個輸入數(shù)據(jù),從標簽集合單元中選取有限的標簽組成的標簽集合,將上述選取的輸入數(shù)據(jù)和標簽集合構建一個訓練集;求取其K鄰域,K鄰域包括若干實例,各實例與標簽相對應,重新用各實例與標簽的對應關系來表示涕液特征矩陣的輸入數(shù)據(jù);
該系統(tǒng)的使用方法,具體包括如下步驟:
S1:向輸入單元輸入涕液描述的文本信息;
S2:將涕液特征矩陣作為待檢測數(shù)據(jù)xi,按照TF-IDF識別提取涕液描述的文本并構建待測數(shù)據(jù)的涕液特征矩陣,涕液特征矩陣首行定義為涕液特征;其余行定義為涕液特征的值,涕液特征的值取值為取整的0或者1;
S3:求取待檢測數(shù)據(jù)xi的K鄰域,令χ=R表示輸入空間,Y表示由標簽集合單元內選取有限個標簽構成的標簽集合,實例x1,…,xn∈χ,標簽y1,…,yn∈Y,構建多標簽訓練集S={(x1,y1),(x2,y2),…,(xn,yn)},對輸入空間χ的每一個待檢測數(shù)據(jù)xi,xi={x1,…,xn},采用KNN算法得到其鄰域鄰域中每個實例相應的標簽對應的原型向量定義為P,
在得到鄰域的每個實例對應的原型向量P后,重新由鄰域的多個實例Xi表示待檢測數(shù)據(jù),每個新的實例Xi都是待檢測數(shù)據(jù)xi與原型向量P的差值:Xi=xi-P;xi={x1,…,xn};
并得到新的多標簽訓練集:
S*={(X1,y1),(X2,y2),…,(Xn,yn)};Xi={X1,…,Xn};
S4:新的多標簽訓練集S*訓練是通過兩層分類結構輸入具有m個實例的Xi,兩層分類結構的輸出是有Q個有效輸出的標簽向量y∈{y1,…,yQ};第一層結構將輸入的m個實例進一步分解為沒有交集的M個分組,各分組之間的距離用歐氏距離表示,通過分別測量分組所有實例的歐氏距離,確定各分組的中心,各分組內部具有標簽關聯(lián),形成一個聚類,每一個實例Xi都表示為M維歐氏距離的特征向量;第二層結構表示權重矩陣W,權重矩陣W與第一層結構的每一個分組的中心和每一個輸出y相對應;其中y(Xi)為實例Xi在對應標簽的實際輸出,W為權重矩陣;φM(Xi)為M維到各分組中心的歐氏距離的特征向量表示的該實例Xi;實際輸出y(Xi)的值取整為0或者1;
S5:根據(jù)鄰域內各實例Xi的實際輸出y(Xi)作為元素得到評價待檢測數(shù)據(jù)xi的Q個有效輸出標簽向量y;
S6:重復上述步驟S3—S5,選取有效輸出最多的標簽向量y作為最終結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吾征智能技術(北京)有限公司,未經(jīng)吾征智能技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011036158.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置