[發明專利]信息聚合方法及裝置有效
申請號: | 201210018912.2 | 申請日: | 2012-01-20 |
公開(公告)號: | CN103218371B | 公開(公告)日: | 2017-04-26 |
發明(設計)人: | 周均揚 | 申請(專利權)人: | 華為終端有限公司 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 深圳市深佳知識產權代理事務所(普通合伙)44285 | 代理人: | 唐華明 |
地址: | 518129 廣東省*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 信息 聚合 方法 裝置 | ||
1.一種信息聚合方法,其特征在于,包括:
確定信息量在文件中的相關信息,其中,所述信息量是指用戶關注的信息,所述相關信息包括位置信息;
根據所述相關信息計算不同信息量之間的距離;
根據計算得到的不同信息量之間的距離對不同的信息量進行聚合;
其中,所述根據所述相關信息計算不同信息量之間的距離包括:
根據所述相關信息計算所述信息量的標簽數值,以獲得不同信息量對應的標簽數值,所述不同信息量對應的標簽數值具有唯一性;
根據所述標簽數值計算不同信息量之間的距離。
2.根據權利要求1所述的方法,其特征在于,所述位置信息包括:段落位置,起始位置,結束位置,其中,所述段落位置表示所述信息量在文件中的自然段落位置,所述起始位置和結束位置表示所述信息量在文件中所在句子中的位置。
3.根據權利要求2所述的方法,其特征在于,
所述根據所述相關信息計算所述信息量的標簽數值包括:
利用以下公式計算所述信息量的標簽數值:L=段落位置*標簽系數+(起始位置+結束位置)/2;
所述根據所述標簽數值計算不同信息量之間的距離包括:
將不同信息量對應的標簽數值的差值的絕對值作為所述不同信息量之間的距離。
4.根據權利要求3所述的方法,其特征在于,所述標簽系數大于或等于所述文件中所有段落中包含字符數最多的段落中的字符數的最大值。
5.根據權利要求1至4任一項所述的方法,其特征在于,所述根據計算得到的不同信息量之間的距離對不同的信息量進行聚合包括:
確定不同信息量之間是否有指代關系和/或對等關系;
當確定不同信息量之間有指代關系和/或對等關系時,根據所述指代關系和/或對等關系對所述距離進行修正;
將修正后的距離中最小距離對應的信息量進行聚合。
6.根據權利要求5所述的方法,其特征在于,所述根據計算得到的不同信息量之間的距離對不同的信息量進行聚合進一步包括:
當確定不同信息量之間沒有指代關系和/或對等關系時,則將計算得到的不同信息量之間的距離中最小距離對應的信息量進行聚合。
7.根據權利要求6所述的方法,其特征在于,所述確定不同信息量之間是否有指代關系和/或對等關系包括:
根據各信息量的語法屬性判斷不同信息量之間的指代關系和/或對等關系。
8.根據權利要求6所述的方法,其特征在于,所述確定不同信息量之間是否有指代關系和/或對等關系進一步包括:
根據各信息量的語法屬性和距離關系判斷不同信息量之間的指代關系和/或對等關系。
9.一種信息聚合裝置,其特征在于,包括:
信息確定單元,用于確定信息量在文件中的相關信息,其中,所述信息量是指用戶關注的信息,所述相關信息包括位置信息;
計算單元,用于根據所述相關信息計算不同信息量之間的距離;
聚合單元,用于根據計算得到的不同信息量之間的距離對不同的信息量進行聚合;
所述計算單元包括:
第一計算子單元,用于根據所述相關信息計算所述信息量的標簽數值,以獲得不同信息量對應的標簽數值,所述不同信息量對應的標簽數值具有唯一性;
第二計算子單元,用于根據所述標簽數值計算不同信息量之間的距離。
10.根據權利要求9所述的裝置,其特征在于,所述位置信息包括:段落位置,起始位置,結束位置;所述段落位置表示所述信息量在文件中的自然段落位置;所述起始位置和結束位置表示所述信息量在文件中所在句子中的位置,所述信息量為用戶關注的信息。
11.根據權利要求10所述的裝置,其特征在于,
所述第一計算子單元,具體用于利用以下公式計算所述信息量的標簽數值:L=段落位置*標簽系數+(起始位置+結束位置)/2;
所述第二計算子單元,具體用于將不同信息量對應的標簽數值的差值的絕對值作為所述不同信息量之間的距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為終端有限公司,未經華為終端有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210018912.2/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置