[發(fā)明專利]信息聚合方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210018912.2 | 申請(qǐng)日: | 2012-01-20 |
| 公開(公告)號(hào): | CN103218371B | 公開(公告)日: | 2017-04-26 |
| 發(fā)明(設(shè)計(jì))人: | 周均揚(yáng) | 申請(qǐng)(專利權(quán))人: | 華為終端有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)44285 | 代理人: | 唐華明 |
| 地址: | 518129 廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 聚合 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,具體涉及一種信息聚合方法及裝置。
背景技術(shù)
信息聚合是將具有內(nèi)在聯(lián)系的不同信息組合成一個(gè)結(jié)構(gòu)體,例如人名、電話號(hào)碼、郵件地址,如果這些信息都是屬于某個(gè)人的資料,那么就可以將該人名、電話號(hào)碼、郵件地址組成一個(gè)大的信息塊,它是一個(gè)結(jié)構(gòu)體:(人名,電話號(hào)碼,郵件地址)。利用信息聚合技術(shù),可以為用戶提供多來源信息的一站式的個(gè)性化服務(wù)。比如,終端設(shè)備監(jiān)測(cè)用戶的郵件或者短信息,自動(dòng)地從郵件或者短信息中提取感興趣的信息,如聯(lián)系人資料、事件信息等,然后就生成一個(gè)日程表事件、事務(wù)提醒事件、或者通訊錄聯(lián)系人,然后將信息存放在對(duì)應(yīng)的位置,例如日程表、事務(wù)提醒器、聯(lián)系人列表等,以幫助用戶處理信息,提升工作效率。
信息聚合是信息提取的必要前提,利用一種可量化的標(biāo)準(zhǔn)聚合信息是信息聚合的核心工作。選用不同的衡量準(zhǔn)則會(huì)影響到信息聚合的效果,從而影響到信息提取的最終結(jié)果。
在現(xiàn)有技術(shù)中,信息聚合的常用方法是利用語法結(jié)構(gòu)分析。語法結(jié)構(gòu)分析利用語法原理,根據(jù)不同的語法成分合并信息。例如,以漢語語法為例,句子成分有主語、謂語、賓語、定語、狀語、補(bǔ)語。每個(gè)成分對(duì)詞匯屬性都有要求,例如,名詞可以充當(dāng)主語,動(dòng)詞可以作謂語,形容詞修飾名詞等等。根據(jù)詞匯的不同屬性,就可以聚合句子成分。然而,句子的復(fù)雜性以及成分的多樣性,使得語法結(jié)構(gòu)分析不易量化。例如語法分析中的就近原則,對(duì)于終端設(shè)備而言,就是一個(gè)非常復(fù)雜的問題,因?yàn)檫h(yuǎn)近沒有量化定義,終端設(shè)備不知道什么是遠(yuǎn),什么是近。由于語法結(jié)構(gòu)分析難以量化,因此,信息聚合的準(zhǔn)確度較低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例針對(duì)上述現(xiàn)有技術(shù)存在的問題,提供一種信息聚合方法及裝置,以提高信息聚合的準(zhǔn)確度。
為此,本發(fā)明實(shí)施例提供如下技術(shù)方案:
一種信息聚合方法,包括:
確定信息量在文件中的相關(guān)信息;
根據(jù)所述相關(guān)信息計(jì)算不同信息量之間的距離;
根據(jù)計(jì)算得到的不同信息量之間的距離對(duì)不同的信息量進(jìn)行聚合。
一種信息聚合裝置,包括:
信息確定單元,用于確定信息量在文件中的相關(guān)信息;
計(jì)算單元,用于根據(jù)所述相關(guān)信息計(jì)算不同信息量之間的距離;
聚合單元,用于根據(jù)計(jì)算得到的不同信息量之間的距離對(duì)不同的信息量進(jìn)行聚合。
本發(fā)明實(shí)施例提供的信息聚合方法及裝置,通過確定信息量在文件中的相關(guān)信息,并根據(jù)所述相關(guān)信息計(jì)算不同信息量之間的距離,從而對(duì)文件中的不同信息量之間的距離進(jìn)行量化處理,利用量化后的距離對(duì)不同的信息量進(jìn)行聚合,有效地提高了信息聚合的準(zhǔn)確度。
附圖說明
為了更清楚地說明本申請(qǐng)實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例信息聚合方法的流程圖;
圖2是本發(fā)明實(shí)施例信息聚合裝置的結(jié)構(gòu)示意圖;
圖3是本發(fā)明實(shí)施例中聚合單元的一種結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明實(shí)施例作進(jìn)一步的詳細(xì)說明。
本發(fā)明實(shí)施例信息聚合方法及裝置,通過確定信息量在文件中的相關(guān)信息,并根據(jù)所述相關(guān)信息計(jì)算不同信息量之間的距離,從而對(duì)文件中的不同信息量之間的距離進(jìn)行量化處理,利用量化后的距離對(duì)不同的信息量進(jìn)行聚合,有效地提高信息聚合的準(zhǔn)確度。
本發(fā)明實(shí)施例信息聚合方法可以應(yīng)用于終端設(shè)備或服務(wù)器,比如,終端設(shè)備監(jiān)測(cè)用戶的郵件或者短信息,自動(dòng)實(shí)現(xiàn)對(duì)其中用戶關(guān)注的信息的聚合。
如圖1所示,是本發(fā)明實(shí)施例信息聚合方法的流程圖,包括以下步驟:
步驟101,確定信息量在文件中的相關(guān)信息。
所述信息量是指用戶關(guān)注的信息,例如,可以是人名、電話號(hào)碼、郵箱地址,也可以是會(huì)議主題、會(huì)議地點(diǎn)、會(huì)議內(nèi)容等等。每個(gè)信息量包括由一個(gè)或多個(gè)字符串組成,每個(gè)信息量都有它對(duì)應(yīng)的相關(guān)信息。在本實(shí)施例中,該步驟可以是確定不同信息量在文件中的相關(guān)信息。也可以理解為,獲取文件中用戶關(guān)注的信息對(duì)應(yīng)的相關(guān)相息,或是獲取文件中信息量對(duì)應(yīng)的相關(guān)信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為終端有限公司,未經(jīng)華為終端有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210018912.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





