[發明專利]信息定向推送方法和系統無效
| 申請號: | 201010042818.1 | 申請日: | 2010-01-13 |
| 公開(公告)號: | CN102129440A | 公開(公告)日: | 2011-07-20 |
| 發明(設計)人: | 萬春曉 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/08 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;曾旻輝 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 定向 推送 方法 系統 | ||
【技術領域】
本發明涉及網絡信息處理技術領域,特別是涉及一種信息定向推送方法和系統。
【背景技術】
信息定向推送是指針對用戶需要和感興趣的內容,向用戶發送相應的信息,包括小知識、新聞、天氣預報、廣告等。
傳統的互聯網信息定向推送技術中,基于用戶輸入特征的方法主要是根據用戶在聊天的對話框中輸入的信息,提取出用戶感興趣的關鍵詞,對用戶的特征進行分析,從而得到用戶的感興趣點,進而實現信息的定向推送。
傳統的互聯網信息定向推送技術存在兩個缺點:(1)用戶輸入特征不完整。軟件的豐富性和多樣性使得單純通過聊天對話框進行的特征提取面過于狹窄,無法全面挖掘用戶的特征信息。(2)用戶輸入特征提取不準確。復雜語句中準確提取關鍵詞的技術存在缺陷,使得通過從語句中提取的用戶特征的準確性較低。
上述的兩個缺點最終會導致向用戶推送的定向信息不準確的問題,也就是推送的定向信息不是用戶感興趣的、需要的信息。
【發明內容】
為了解決傳統基于用戶輸入特征的信息定向推送方法推送釣定向信息不準確的問題,有必要提供一種準確的信息定向推送方法。
一種信息定向推送方法,包括如下步驟:采集用戶的輸入信息,所述輸入信息包括通過輸入法輸入的詞語;根據所述詞語統計詞頻,根據詞頻對所述詞語進行排序;查找與排序后的詞語相匹配的定向信息;將所述匹配的定向信息輸出給用戶。
優選的,所述統計詞頻的步驟為:判斷用戶通過輸入法輸入的詞語是否是名詞,若是,則根據用戶輸入的名詞統計詞頻。
優選的,采用大根堆統計用戶輸入的詞語的詞頻并進行排序,所述大根堆的每個節點統計用戶輸入的詞語及其詞頻。
優選的,所述查找定向信息的步驟具體是只對詞頻最高的50~100個詞語進行查找。
優選的,所述用戶的輸入信息還包括用戶標識號,所述用戶標識號對應惟一用于統計用戶輸入詞語及其詞頻的大根堆。
還有必要提供一種準確的信息定向推送系統。
一種信息定向推送系統,包括輸入采集模塊、詞頻統計及排序模塊、定向信息匹配模塊以及定向信息輸出模塊;輸入采集模塊用于采集用戶的輸入信息,所述輸入信息包括通過輸入法輸入的詞語;詞頻統計及排序模塊統計輸入的詞語的詞頻,并根據詞頻對所述詞語進行排序;定向信息匹配模塊查找與排序后的詞語相匹配的定向信息;定向信息輸出模塊接收所述定向信息匹配模塊查找到的定向信息,并將該定向信息輸出給用戶。
優選的,所述詞頻統計及排序模塊采用大根堆統計用戶輸入的詞語的詞頻并進行排序,所述大根堆的每個節點統計用戶輸入的詞語及其詞頻。
優選的,該系統還包括詞性判斷模塊,所述詞性判斷模塊用于判斷所述輸入采集模塊采集到的詞語是否是名詞;若是,則將該詞語傳輸到詞頻統計及排序模塊中,采用大根堆統計其詞頻,然后根據詞頻對所述詞語進行排序。
優選的,所述輸入采集模塊采集的輸入信息還包括用戶標識號,所述用戶標識號對應惟一用于統計用戶輸入詞語及其詞頻的大根堆,所述系統還包括用于存儲所述大根堆的詞頻堆存儲模塊。
優選的,所述定向信息匹配模塊只對詞頻最高的50~100個詞語進行查找。
上述信息定向推送方法和系統,通過輸入法采集用戶輸入的詞語,不受聊天對話框的局限,提高了用戶輸入特征提取的全面性;從而能提高推送的信息的準確性,推送的信息用戶更需要、更感興趣。
通過判斷輸入的詞是否是名詞,提高了用戶輸入特征提取的準確性。
采用大根堆對詞頻數據進行統計和排序,時間復雜度為O(nlogn),復雜度低,排序效率高。
只對詞頻較高的50~100個詞語進行匹配,能更準確的抓住用戶的感興趣點,提高推送的信息的準確性。
【附圖說明】
圖1是一個實施例中信息定向推送方法的流程圖;
圖2是一個實施例中信息定向推送方法服務器的流程圖;
圖3是一個實施例中信息定向推送方法客戶端的流程圖;
圖4是一個實施例中信息定向推送系統的示意圖;
圖5是一個實施例中客戶端的結構示意圖;
圖6是一個實施例中服務器的結構示意圖。
【具體實施方式】
圖1是一個實施例中信息定向推送方法的流程圖。該方法預先建立定向信息列表,還包括以下步驟:
S110,采集用戶的輸入信息。用戶的輸入信息包括用戶標識號和通過輸入法輸入的詞語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010042818.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種在線專題地圖動態構建方法
- 下一篇:一種詞關系挖掘方法和裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





