[發明專利]面向時空基準的觀測對象體系混合組織模型在審
申請號: | 201410836206.8 | 申請日: | 2014-12-26 |
公開(公告)號: | CN104537060A | 公開(公告)日: | 2015-04-22 |
發明(設計)人: | 付琨;許光鑾;孫顯;黃宇;王磊;宋俊;張利利 | 申請(專利權)人: | 中國科學院電子學研究所 |
主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
地址: | 100190 *** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 面向 時空 基準 觀測 對象 體系 混合 組織 模型 | ||
1.面向時空基準的觀測對象體系混合組織模型,其特征在于建立模型的方法如下步驟:
步驟1:建立觀測對象體系;搜集需要關注的觀測對象,建立觀測對象體系,觀測對象就是所關注實體或目標;
步驟2:提取觀測對象的特征,包括外部特征、邊界特征、著名人名特征、音譯名符號特征、詞性特征;
步驟3:使用統計機器學習方法來識別觀測對象,使用GIS算法進行參數估計:
計算出
計算
其中C為訓練樣本的大小;
重新計算
重復計算直至收斂,通過上面的計算過程,給數據x自動打上標簽y,即為預測過程,標簽表示的就是數據的類別;
步驟4:利用規則進行人名武器名的識別;
步驟5:根據步驟3和步驟4的識別結果建立數據與觀測對象的關聯關系。
2.按照權利要求1所述面向時空基準的觀測對象體系混合組織模型,其特征在于:所述步驟2中提取觀測對象的特征的方法為:
選用特征窗口大小為2,設潛在目標提取的中心詞與前后兩個詞為w-2w-1w0w1w2,其中w0表示當前詞,w1表示當前詞的后一個詞,w-1表示當前詞的前一個詞,w2和w-2依次類推:
外部特征:
x表示w-2w-1w0w1w2,y表示標注標簽,i表示序號,若存在這一數據和標簽的組合,則稱特征函數滿足,即值為1,反之為0,當w1=發表,y=person滿足條件,即值為1;
邊界特征:
著名人名特征:
w0在詞典庫中完全匹配、部分匹配或者片段匹配;
音譯名符號特征:含有特殊字符“·”,“·”,“-”的句子;
詞性特征:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院電子學研究所;,未經中國科學院電子學研究所;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410836206.8/1.html,轉載請聲明來源鉆瓜專利網。