[發(fā)明專利]信息提取方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810083656.2 | 申請日: | 2018-01-29 |
| 公開(公告)號: | CN110110033A | 公開(公告)日: | 2019-08-09 |
| 發(fā)明(設(shè)計(jì))人: | 范玉順;張峻旗;周婧雯 | 申請(專利權(quán))人: | 清華大學(xué) |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06Q50/14 |
| 代理公司: | 北京華進(jìn)京聯(lián)知識產(chǎn)權(quán)代理有限公司 11606 | 代理人: | 成丹 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 研究對象 信息提取 計(jì)算機(jī)設(shè)備 存儲介質(zhì) 關(guān)鍵詞庫 數(shù)據(jù)獲取 特性信息 置信度 集合 | ||
1.一種信息提取方法,其特征在于,所述方法包括:
獲取待研究對象集合中的每個待研究對象與特性關(guān)鍵詞庫中的每個特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù);其中,所述特性關(guān)鍵詞庫中包括N個用于表征待研究對象特征的特性,每個特性對應(yīng)至少一個關(guān)鍵詞;
針對每個待研究對象和每個特性,根據(jù)所述待研究對象與所述特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù),與所述待研究對象在所有識別區(qū)域內(nèi)出現(xiàn)的總次數(shù)的商值,確定所述待研究對象相對于所述特性的置信度。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取待研究對象集合中的每個待研究對象與特性關(guān)鍵詞庫中的每個特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù),包括:
獲取所述待研究對象集合中的每個所述待研究對象在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù);
獲取所述特性關(guān)鍵詞庫中的每個特性在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù);其中,一個特性在一個識別區(qū)域內(nèi)出現(xiàn)的次數(shù)等于所述一個特性對應(yīng)的每個關(guān)鍵詞在所述一個識別區(qū)域內(nèi)出現(xiàn)的次數(shù)之和;
根據(jù)每個所述待研究對象在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù)、每個所述特性在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù),獲取每個所述待研究對象與每個所述特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取所述待研究對象集合中的每個所述待研究對象在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù),包括:
獲取第一矩陣,所述第一矩陣中的αi,j表征第j個待研究對象在第i個識別區(qū)域內(nèi)出現(xiàn)的次數(shù),所述i和j均為大于0的整數(shù)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取所述特性關(guān)鍵詞庫中的每個特性在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù),包括:
獲取第二矩陣,所述第二矩陣中的βi,n表征第n個特性在第i個識別區(qū)域內(nèi)出現(xiàn)的次數(shù),所述n為大于0且小于等于N的整數(shù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)每個所述待研究對象在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù)、每個所述特性在每個識別區(qū)域內(nèi)出現(xiàn)的次數(shù),獲取每個所述待研究對象與每個所述特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù),包括:
根據(jù)公式得到每個所述待研究對象與每個所述特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù),其中,所述yj,n表征第n個特性與所述第j個待研究對象在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述針對每個待研究對象和每個特性,根據(jù)所述待研究對象與所述特性在同一識別區(qū)域內(nèi)共同出現(xiàn)的次數(shù),與所述待研究對象在所有識別區(qū)域內(nèi)出現(xiàn)的總次數(shù)的商值,確定所述待研究對象相對于所述特性的置信度,包括:
根據(jù)公式:得到第三矩陣,所述第三矩陣中的xj,n表征第n個特性與所述第j個待研究對象在所有識別區(qū)域內(nèi)共同出現(xiàn)的總次數(shù);
根據(jù)所述第三矩陣中的xj,n、第j個待研究對象在所有識別區(qū)域內(nèi)出現(xiàn)的總次數(shù)以及公式:得到第四矩陣,所述第四矩陣中的hj,n表征第j個待研究對象相對于所述第n個特性的置信度。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
根據(jù)公式:對所述第四矩陣進(jìn)行歸一化操作,得到第五矩陣,所述第五矩陣的表征第j個待研究對象相對于所述第n個特性的歸一化后的置信度;
根據(jù)所述第五矩陣中的每個元素的值,繪制雷達(dá)圖,所述雷達(dá)圖用于表征每個待研究對象相對于每個特性的置信度高低趨勢。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810083656.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 測量值分析裝置以及測量值分析方法
- 一種晶體結(jié)構(gòu)的預(yù)測方法
- 用于獲取組織的共配準(zhǔn)正交熒光光聲體積投影的儀器及其使用的方法
- 通過射線照相技術(shù)確定被研究對象的幾何參數(shù)和/或材料狀態(tài)的方法
- 信息提取方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 基于電子地圖的歷史研究對象研究裝置及方法
- 浮力模擬裝置、懸浮隧道結(jié)構(gòu)研究裝置及研究方法
- 基于時間軸的廣義歷史對象研究裝置及方法
- 一種動物實(shí)驗(yàn)用多功能保定裝置
- 一種用于電網(wǎng)建設(shè)項(xiàng)目的生態(tài)保護(hù)紅線規(guī)避方法
- 檢測特殊信息的方法、程序、裝置及存儲該程序的介質(zhì)
- 一種軟件執(zhí)行過程中定制提取運(yùn)行信息的方法及裝置
- 物流信息的可視化方法
- 一種信息提取的方法和設(shè)備以及計(jì)算機(jī)存儲介質(zhì)
- 無參考型圖像質(zhì)量評價系統(tǒng)及方法
- 信息提取方法、裝置、設(shè)備及存儲介質(zhì)
- 信息提取方法、信息提取模型訓(xùn)練方法、裝置及存儲介質(zhì)
- 模板配置方法、信息提取方法、裝置以及電子設(shè)備、介質(zhì)
- 一種終端的信息提取方法、裝置、存儲介質(zhì)及終端
- 一種結(jié)合RPA與AI的文本信息提取方法、裝置、設(shè)備及介質(zhì)
- 在分布式數(shù)據(jù)庫系統(tǒng)中管理查詢
- 設(shè)備間互動虛擬角色系統(tǒng)
- 計(jì)算機(jī)虛擬角色拿取系統(tǒng)
- 用于向計(jì)算機(jī)設(shè)備供電的燃料電池
- 虛擬角色同步更新式傳輸系統(tǒng)
- 虛擬角色自行傳輸?shù)挠?jì)算機(jī)交互系統(tǒng)
- 虛擬角色傳輸系統(tǒng)
- 計(jì)算機(jī)設(shè)備的啟動方法、裝置及計(jì)算機(jī)設(shè)備
- 一種基于區(qū)塊鏈技術(shù)的計(jì)算機(jī)設(shè)備防盜系統(tǒng)及方法
- 一種用于計(jì)算機(jī)設(shè)備管理的終端
- 用于接合與分離存儲介質(zhì)的裝置
- 存儲介質(zhì)陣列控制器、控制方法、設(shè)備、和存儲介質(zhì)驅(qū)動器
- 存儲介質(zhì)處理方法、系統(tǒng)及數(shù)據(jù)讀寫操作方法、系統(tǒng)
- 存儲裝置、存儲介質(zhì)以及存儲介質(zhì)的制造方法
- 數(shù)據(jù)存儲
- 存儲介質(zhì)之間的數(shù)據(jù)遷移
- 一種基于存儲系統(tǒng)的控制方法及裝置
- 自助設(shè)備及自助設(shè)備的介質(zhì)存儲裝置
- 融合存儲系統(tǒng)中的數(shù)據(jù)遷移方法和裝置
- 一種數(shù)據(jù)存儲方法、裝置及電子設(shè)備





