[發明專利]文本挖掘支援方法及裝置有效
| 申請號: | 201810156475.8 | 申請日: | 2018-02-24 |
| 公開(公告)號: | CN108628928B | 公開(公告)日: | 2021-12-07 |
| 發明(設計)人: | 西川康平 | 申請(專利權)人: | 株式會社斯庫林集團 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 馬爽;臧建明 |
| 地址: | 日本京都府京都市上京區堀*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 挖掘 支援 方法 裝置 | ||
一種文本挖掘支援方法及裝置,當顯示表示對應分析的結果的散布圖時,顯示包含散布圖與表示散布圖的看法的啟示的支援畫面。當顯示與單詞及變數相關的散布圖時,從不含啟示的基本畫面、含有原點附近的單詞的判斷方法作為啟示的第1支援畫面、含有對變數賦予特征的單詞的關聯度的判斷方法作為啟示的第2支援畫面、含有單詞彼此的類似度的判斷方法作為啟示的第3支援畫面、及含有變數彼此的類似度的判斷方法作為啟示的第4支援畫面中,顯示利用者所指示的畫面。由此,可有效率地進行從表示對應分析的結果的圖表中引導出見解的處理。
技術領域
本發明涉及一種數據挖掘技術,尤其涉及一種支援文本挖掘(text mining)的執行的文本挖掘支援方法及裝置。
背景技術
近年來,針對大量的數據應用統計學或模式識別等數據分析技術,并從大量的數據中引導出見解(數據中所顯現的規則等)的數據挖掘技術正受到矚目。將文本數據作為對象的數據挖掘被稱為文本挖掘。以下,考慮針對文本數據,進行作為數據分析技術的一種的對應分析(correspondence analy sis)的情況。
在對應分析中,針對復合表(cross tabulation table),進行以表頭項目與表側項目之間的關聯變成最大的方式重新排列各項目的處理。進行對應分析的結果通常使用散布圖(二維圖表)來表現。例如,若對圖2中所示的復合表進行對應分析,則可獲得圖3中所示的散布圖。
在與本申請發明相關聯的日本專利特開2005-44087號公報中,記載有一種對利用者提示使用多個分析工具時的分析流程的文本挖掘系統。若使用所述文獻中所記載的系統,則即便是與文本挖掘相關的知識或經驗少的利用者,也能夠以適宜的順序使用多個分析工具進行分析。
發明內容
[發明所要解決的問題]
在對應分析中,與求出散布圖相比,對所求出的散布圖進行考察,并引導出見解更重要。但是,與文本挖掘相關的知識或經驗少的利用者不懂散布圖的看法,因此即便觀看散布圖,也不懂首先進行什么才好。因此,知識或經驗少的利用者無法有效率地進行從散布圖中引導出見解的處理。
專利文獻1中所記載的系統雖然對利用者提示分析流程,但并不支援從分析結果中引導出見解的處理。因此,即便使用專利文獻1中所記載的系統,也無法解決所述課題。
因此,本發明的目的在于提供一種用以有效率地進行從表示對應分析的結果的圖表中引導出見解的處理的文本挖掘支援方法及裝置。
[解決問題的技術手段]
為了達成所述目的,本發明具有以下的特征。
本發明的第1實施例是一種文本挖掘支援方法,其顯示由對應分析所得的分析結果,其包括
輸入所述分析結果的步驟;
輸入來自利用者的指示的步驟;
生成包含表示所述分析結果的圖表的畫面的畫面數據的步驟;以及
根據所述畫面數據,顯示畫面的步驟;且
所述生成畫面數據的步驟對應于所述指示,生成包含所述圖表與表示所述圖表的看法的啟示(hint)的支援畫面的畫面數據。
本發明的第2實施例是在本發明的第1實施例中,
所述生成畫面數據的步驟生成從多個支援畫面與包含所述圖表且不含所述啟示的基本畫面之中,對應于所述指示所選擇的畫面的畫面數據。
本發明的第3實施例是在本發明的第2實施例中,
在所述輸入分析結果的步驟中,輸入將第1項目與第2項目建立對應的結果,即包含所述第1項目的第1成分及第2成分與所述第2項目的第1成分及第2成分的結果作為所述分析結果,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社斯庫林集團,未經株式會社斯庫林集團許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810156475.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:社交系統、方法及電子裝置
- 下一篇:用于智能存檔和分析的方法和裝置





