[發(fā)明專利]用于選擇用以代表表格式信息的方法和系統(tǒng)有效
申請(qǐng)?zhí)枺?/td> | 201410678045.4 | 申請(qǐng)日: | 2014-11-21 |
公開(kāi)(公告)號(hào): | CN104714931B | 公開(kāi)(公告)日: | 2019-04-12 |
發(fā)明(設(shè)計(jì))人: | D·K·比榮;S·N·格拉德;A·皮科維斯基 | 申請(qǐng)(專利權(quán))人: | 國(guó)際商業(yè)機(jī)器公司 |
主分類號(hào): | G06F17/21 | 分類號(hào): | G06F17/21 |
代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 酆迅 |
地址: | 美國(guó)紐*** | 國(guó)省代碼: | 美國(guó);US |
權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 用于 選擇 用以 表表 格式 信息 方法 系統(tǒng) | ||
1.一種用于選擇用以代表表格式信息的結(jié)構(gòu)的方法,所述方法包括:
從表格結(jié)構(gòu)的匯集中選擇與表格對(duì)應(yīng)的表格結(jié)構(gòu);
選擇表格結(jié)構(gòu)函數(shù),其中所述表格結(jié)構(gòu)函數(shù)描述所述表格結(jié)構(gòu)中的單元格配對(duì)中的單元格何時(shí)應(yīng)當(dāng)彼此相似;
選擇單元格相似度函數(shù),其中所述單元格相似度函數(shù)根據(jù)準(zhǔn)則來(lái)比較所述表格結(jié)構(gòu)中的所述單元格配對(duì)中的所述單元格并且輸出所述單元格配對(duì)包括包含有彼此相似的值的單元格的概率;
根據(jù)所述單元格相似度函數(shù)來(lái)確定所述表格結(jié)構(gòu)中的第一單元格配對(duì)中的第一單元格和第二單元格彼此相似的單元格相似概率;
使用所述單元格相似概率來(lái)調(diào)整所述表格結(jié)構(gòu)代表所述表格的計(jì)算的概率;
將所述計(jì)算的概率指示為第一模型代表所述表格的概率,其中所述第一模型是所述表格結(jié)構(gòu)和所選擇的單元格相似度函數(shù)的函數(shù);
將所述計(jì)算的概率指示為第二模型代表所述表格的概率,其中所述第二模型是第二表格結(jié)構(gòu)和所選擇的單元格相似度函數(shù)的函數(shù);
從模型的集合中選擇具有較高的計(jì)算的概率的模型以形成選擇的模型,所述模型的集合包括所述第一模型和所述第二模型。
2.根據(jù)權(quán)利要求1所述的方法,還包括:
選擇與所述表格對(duì)應(yīng)的第二表格結(jié)構(gòu);
從所述第二表格結(jié)構(gòu)中選擇第二單元格配對(duì);
根據(jù)所述單元格相似度函數(shù)確定所述第二單元格配對(duì)中的第一單元格和第二單元格彼此相似的單元格相似概率;
使用所述單元格相似概率調(diào)整所述第二表格結(jié)構(gòu)代表所述表格的第二計(jì)算的概率;
以及
根據(jù)所選擇的模型形成對(duì)所述表格的解釋,其中,所述表格是問(wèn)答系統(tǒng)(Q&A系統(tǒng))的語(yǔ)料庫(kù)的一部分,所述問(wèn)答系統(tǒng)使用所述解釋來(lái)回答自然語(yǔ)言問(wèn)題。
3.根據(jù)權(quán)利要求2所述的方法,還包括:
將第三計(jì)算的概率指示為第三模型代表所述表格的概率,其中所述第三模型是第三表格結(jié)構(gòu)和所選擇的單元格相似度函數(shù)的函數(shù),其中所述選擇從所述模型集的子集中選擇,其中所述子集包括其對(duì)應(yīng)的計(jì)算的概率超過(guò)概率閾值的那些模型。
4.根據(jù)權(quán)利要求1所述的方法,其中所述調(diào)整包括:
在對(duì)若干單元格配對(duì)計(jì)算所述表格結(jié)構(gòu)的平均單元格相似概率時(shí)使用所述單元格相似概率。
5.根據(jù)權(quán)利要求1所述的方法,其中針對(duì)所述表格結(jié)構(gòu)中存在的所有單元格配對(duì)的集合的子集執(zhí)行所述選擇所述第一單元格配對(duì)、所述確定所述單元格相似概率以及所述調(diào)整。
6.根據(jù)權(quán)利要求1所述的方法,其中所述單元格相似度函數(shù)中的所述準(zhǔn)則要求給定單元格配對(duì)中的所述單元格中的所述值的類型相匹配。
7.根據(jù)權(quán)利要求1所述的方法,其中所述單元格相似度函數(shù)中的所述準(zhǔn)則要求給定單元格配對(duì)中的所述單元格中的值在彼此的范圍內(nèi)。
8.根據(jù)權(quán)利要求1所述的方法,還包括:
標(biāo)識(shí)所述表格中的超級(jí)單元格,其中所述超級(jí)單元格包括相鄰單元格的集合,其中所述相鄰單元格的集合中的第一單元格的內(nèi)容描述所述相鄰單元格的集合中的第二單元格的內(nèi)容。
9.根據(jù)權(quán)利要求8所述的方法,其中所述第一單元格配對(duì)包括第一超級(jí)單元格和第二超級(jí)單元格。
10.根據(jù)權(quán)利要求1所述的方法,還包括:
標(biāo)識(shí)在所述表格中的行首單元格的集合;以及
標(biāo)識(shí)在所述表格中的列首單元格的集合。
11.根據(jù)權(quán)利要求10所述的方法,其中所述第一單元格配對(duì)包括在所述表格中的第一行首單元格和第二行首單元格。
12.根據(jù)權(quán)利要求10所述的方法,其中所述第一單元格配對(duì)包括在所述表格中的第一列首單元格和第二列首單元格。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國(guó)際商業(yè)機(jī)器公司,未經(jīng)國(guó)際商業(yè)機(jī)器公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410678045.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)