[發明專利]一種表格數據的主題分析的方法和系統有效
| 申請號: | 201480040217.3 | 申請日: | 2014-07-08 |
| 公開(公告)號: | CN105378732B | 公開(公告)日: | 2019-11-12 |
| 發明(設計)人: | D·K·拜倫;S·N·吉拉爾德;A·皮科夫斯基;M·B·薩恩切茨 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F17/24 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 鮑進 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表格 數據 主題 分析 | ||
本公開涉及表格數據的主題分析。在說明性實施例中提供了用于表格數據的主題分析的方法、系統和計算機程序產品。接收包含表格數據的第一文檔。選擇用于第一主題域的函數簽名庫。確定來自所選庫的閾值數量的函數簽名是否適用于表格數據,其中當表格數據中的值與函數簽名中指定的操作和表格結構相對應時,函數簽名適用于表格數據。響應于來自所選庫的閾值數量的函數簽名適用于表格數據,處理器和存儲器根據從用于相應主題域的多個處理中選出的用于第一主題域的處理來處理第一文檔。
技術領域
本發明一般涉及用于文檔的處理的方法、系統和計算機程序產品。更特別地,本發明涉及用于表格數據(tabular data)的主題分析的方法、系統和計算機程序產品。
背景技術
文檔包含任何形式的信息。例如,被配置為語句和段落的文本信息以敘述的形式傳遞信息。
一些類型的信息是在表格組織中被提供的。例如,文檔可以包含用于提供財務信息、組織信息的表格并且一般地可以包含用于提供通過一些關系彼此相關的任何數據條目的表格。
自然語言處理(NLP)是便利于人與數據處理系統之間的信息交換的技術。例如,NLP的一個分支屬于將給定的內容轉換成人可用的語言或形式。例如,NLP可接受內容是計算機特定語言或形式的文檔,并產生相應內容采取人可讀形式的文檔。
發明內容
解釋性實施例提供一種用于表格數據的主題分析的方法、系統和計算機程序產品。實施例接收包含表格數據的第一文檔。實施例選擇用于第一主題域的函數簽名庫。實施例確定來自所選庫的閾值數量的函數簽名是否適用于表格數據,其中當表格數據中的值與函數簽名中指定的操作和表格結構相對應時函數簽名適用于表格數據。實施例響應于來自所選庫的閾值數量的函數簽名適用于表格數據,根據從用于相應主題域的多個處理中選出的用于第一主題域的處理,使用處理器和存儲器來處理第一文檔。
附圖說明
在所附的權利要求中闡述了被認為是本發明的特性的新穎特征。但是,通過在結合附圖閱讀時參照解釋性實施例的以下詳細描述,可以最好地理解本發明自身以及優選的使用方式及其進一步目的和優點,其中:
圖1示出可以實現解釋性實施例的數據處理系統的網絡的圖示;
圖2示出可以實現解釋性實施例的數據處理系統的框圖;
圖3示出在其中可根據解釋性實施例識別函數關系和簽名的表格數據的示例;
圖4示出根據解釋性實施例的函數簽名的示例表示;
圖5示出根據解釋性實施例的函數簽名的示例操作的框圖;
圖6示出根據解釋性實施例的利用表格數據分類文檔的示例方式的框圖;
圖7示出根據解釋性實施例的構建函數簽名的示例處理的流程圖;
圖8示出根據解釋性實施例的創建簽名庫的示例處理的流程圖;
圖9示出根據解釋性實施例的用于使用函數簽名歸類文檔的示例處理的流程圖;
圖10示出根據解釋性實施例的使用表格數據的主題分析來響應詢問的示例處理的流程圖;以及
圖11示出根據解釋性實施例的用于創建或改善知識庫的示例處理的流程圖。
具體實施方式
解釋性實施例認識到:經受NLP的文檔一般包含表格數據,即,一個或多個表格數據結構(表格)形式的內容。表格的單元格(cell)是表格內的包含單元,使得單元格的內容可以唯一地由表格的行和列或其它適當坐標識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480040217.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于振幅調節器的螺紋套
- 下一篇:一種油耗流量計
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





