[發明專利]一種在互聯網上確定用戶特征的方法和系統在審
| 申請號: | 201110280907.4 | 申請日: | 2011-09-10 |
| 公開(公告)號: | CN102999540A | 公開(公告)日: | 2013-03-27 |
| 發明(設計)人: | 祁勇 | 申請(專利權)人: | 祁勇 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518053 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 互聯網 確定 用戶 特征 方法 系統 | ||
技術領域
本發明涉及互聯網領域,具體來說涉及一種在互聯網上確定用戶特征的方法和系統。
背景技術
在互聯網上,搜索引擎和社交網絡是使用較多的獲取網絡信息的工具。但是這兩種工具都存在一些缺點。
對搜索引擎而言,當用戶輸入關鍵字進行網頁搜索時,搜索引擎返回的網頁鏈接數量經常達到幾萬甚至幾千萬,這給用戶搜索目標網頁帶來很大困擾。有統計分析表明用戶平均查看的搜索結果不超過兩頁,這說明搜索引擎得到的絕大多數搜索結果用戶是沒有看到的。即使是用戶看到的部分,搜索結果也常常包含很多相關度較低或者根本不相關的網頁。
對社交網絡而言,社交網絡每天發布的信息已達數億條。雖然在社交網絡中用戶可以通過添加個人關系網絡來過濾和篩選信息,例如通過加“關注(follow)”來獲得他人信息或者通過加好友來分享朋友“喜歡(like)”的信息等等,但是目前在微博和臉書(Facebook)等社交網絡中已經出現了信息過載現象。由于擔心有重要或者有趣信息遺漏,用戶通常會在社交網絡中加入過多的關系網絡,例如關注更多的人或者加入更多的好友等等。這就使得社交網絡逐漸成為一種對用戶進行“信息轟炸”的服務。美國圣何塞州立大學的研究表明,信息過載的結果是加大了用戶掃描和略讀的比重,82%的受訪者表示更多是在瀏覽和掃瞄,85%的讀者表示更多地進行“非線性閱讀”。
上述問題的一個共同點是沒有考慮到用戶的個性化特征在信息過濾和篩選中所起到的作用。例如,在搜索引擎中不同的用戶使用相同的關鍵字進行網頁搜索時得到的搜索結果是相同的,與提交搜索查詢的用戶的個性化特征無關。而在社交網絡中,每個用戶獲得的信息只與其關系網絡有關,而與用戶自身的個性化特征無關。用戶得到的信息是其關系網絡中每個用戶發布的所有信息,而用戶卻不能有選擇地接收這些信息。例如你只要關注一個人,即使你只對他發布的某類信息感興趣,你也不得不接收來自這個人的全部信息。
解決上述問題的一個思路是在計算機系統中獲取用戶的個性化信息,以及根據用戶的個性化信息對獲取的網絡信息進行有效地過濾和篩選,減少用戶對無效信息的掃描和瀏覽。
但是在獲取用戶個性化信息的過程中存在以下幾個問題:
第一是個性化信息的準確性問題。用戶通常不愿意在互聯網上提供準確的個性化信息。雖然部分用戶在臉書(Facebook)等社交網絡中提供了用戶年齡、教育程度、畢業學校、地理位置、專業領域和偏好等個人信息,但是相當多的用戶對提供個人信息心存疑慮,很多用戶在社交網絡上使用虛假的個人信息,使得系統獲得的個人信息不夠準確。第二是個性化信息的全面性問題。用戶通常是難以全面地表達其個性化特征的,例如社交網絡中,用戶愛好一欄通常的描述是喜歡莫扎特、打棒球或看書等,而這些往往只代表用戶的部分特征,而要求每個用戶全面地填寫其個性化特征是困難的。第三是個性化信息的結構化表達問題。文字表述不同但語義相同的特征,在互聯網上難以將他們進行結構化分類,比如有的用戶填寫喜歡莫扎特、有的填寫喜歡古典音樂,可能這兩個用戶的愛好是相同的,但是由于文字表達的不同,因此難以把他們進行有效歸類。第四是個性化信息的更新問題。隨著時間的推移,用戶的個人信息以及興趣愛好可能會發生改變,但是要求所有用戶動態地更新這些信息是困難的。
獲得用戶個性化特征有許多有益的應用。例如結合用戶的個性化特征和網頁個性化特征,可以對搜索到的網頁進行過濾和篩選。利用用戶的個性化特征,可以實現用戶的聚類分析以確定具有特定特征的用戶群,包括在互聯網上尋找具有相同興趣愛好的個人和群組、尋找具有某項才能的專家、尋找經銷某種產品的商家以及商家尋找具有特定特征的用戶群以便定向投放廣告等。
綜上所述,如何獲得用戶的個性化特征,并根據這些個性化特征在海量的“噪聲”中過濾出有用的信息,以及根據用戶的個性化特征將合適的信息在合適的時間發送給合適的人,是當前互聯網亟待解決的一個問題。
發明內容
鑒于上述現有技術存在的問題,本發明的目的在于提供一種在互聯網上確定用戶特征的方法和系統來自動獲取用戶和文檔的個性化特征,并據此對在搜索引擎和社交網絡中獲得的信息內容進行有效地過濾和篩選。
本發明的另一個目的在于提供一種在互聯網上確定用戶特征的方法和系統來自動獲取用戶的個性化特征,以及根據用戶個性化特征在社交網絡中尋找具有給定特征的用戶群。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于祁勇,未經祁勇許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110280907.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:魚肉魚刺分離設備的采肉裝置
- 下一篇:一種結合FAP的多肽





