[發明專利]用于提取新復合詞的系統和方法無效
| 申請號: | 200710088125.4 | 申請日: | 2007-03-15 |
| 公開(公告)號: | CN101093504A | 公開(公告)日: | 2007-12-26 |
| 發明(設計)人: | 村上明子;渡邊日出雄 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 李德山 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 提取 復合詞 系統 方法 | ||
技術領域
本發明涉及用于從多個文本中提取短語的系統。具體而言,本發明涉及基于短語出現頻率提取短語的系統
背景技術
顧客可以將他們關于公司及其貨物和服務的批評、抱怨等張貼到在Internet上的公告牌和網絡日志(weblog)上。與例如在呼叫中心收集信息或收集對問卷的應答信息的傳統情形相比,這樣的信息量更大,且很容易收集。此外,顧客往往將坦誠的意見張貼到公告牌和網絡日志上。如果使用這樣的信息,公司將進一步提升公司策略的規劃。
顧客可以以任何樣式向公告牌和網絡日子張貼文本。用于從這樣各種樣式的文本中提取有用信息的技術稱為“文本挖掘(text?mining)”等,已對該技術進行了研究(參看非專利文獻4至6和專利文獻2至5)。在文本挖掘中,通常對所要關注的關鍵詞在文本中出現的頻率以及頻率隨時間的變化進行分析。在該文本中的關鍵詞不僅可以為單個單詞,還可為由多個單詞組合而成的復合詞。然而,要適當確定出要關注的關鍵詞卻并非容易,該確定可導致文本挖掘結果大相徑庭。
[專利文獻1]日本專利申請公開No.2002-245062
[專利文獻2]日本專利申請公開No.2001-325272
[專利文獻3]日本專利申請公開No.2004-206391
[專利文獻4]日本專利申請公開No.2002-251402
[專利文獻5]日本專利申請公開No.2005-165748
[非專利文獻1]S.Ananiadou?1994.A?Methodology?For?AutomaticTerm?Recognition.CLOING?1994:1034-1038
[非專利文獻2]Nakagawa?H.And?Mori?T.2003?Automatic?TermRecognition?based?on?Statistics?of?Compound??Nouns?and?theirComponents.Terminology,Vol.9?No.2,pp.201-219
[非專利文獻3]Nakagawa?Hiroshi.and?Mori?Tatsunori,YumotoHiroaki.2003.SYUTUGEN-HIND?TO?RENSETU-HINDO?NIMOTODUKU?SENMON-YOUGO?CHUUSHUTSU?SIZEN-GENGO-SYORI(Terminology?Extraction?and?Natural?Language?Processing?basedon?Appearing?Frequency?and?Linking?Frequency),Vol.10?No.1,pp.27-45
[非專利文獻4]J.Kleinberg?2002?Bursty?and?HierarchicalStructure?in?Streams.KDD?2002,pp.91-101
[非專利文獻5]Sato?Yoshihide.,Kawashima?Harumi,SasakiTsutomu.,and?Oku?Masahiro.2005?ZIKEIRETSU?NYUSU?NI?OKERUSAISHIN-WADAIGO-CHUUSHUTSU-HOUHOU(Method?forExtracting?Terms?of?Current?Information?of?Temporal?News.)Information?Processing?Society?of?Japan.Special?Interest?Group?ofNatural?Language?Processing.NL168,pp.1-12
[非專利文獻6]Sekiguchi?Yuuichiro,Sato?Yoshihide,KawashimaHarumi,Okuda?Hidenori?and?Oku?Masahiro?2005?BLOG-PEZI-SYUUGOU?NI?TAISURU?WADAIGoKU?CHUUSHUTSU?SYUHOU(Method?for?Extracting?Terms?of?Current?Topics?in?Blog?Page?Assembly).Information??processing?Society?of?Japan,Special?Interest?Group?ofNatural?Language?Processing?NL170,pp27-32
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710088125.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可加工的填充固化性鹵化異烯烴彈性體
- 下一篇:磁性多層膜的制造方法





