[發(fā)明專利]一種基于領(lǐng)域本體的多源個(gè)性化新聞網(wǎng)頁(yè)推薦方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410797816.1 | 申請(qǐng)日: | 2014-12-19 |
| 公開(kāi)(公告)號(hào): | CN104484431A | 公開(kāi)(公告)日: | 2015-04-01 |
| 發(fā)明(設(shè)計(jì))人: | 吳信東;謝飛;胡學(xué)鋼;宮雪;郭建波 | 申請(qǐng)(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 安徽省合肥新安專利代理有限責(zé)任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 領(lǐng)域 本體 個(gè)性化 新聞 網(wǎng)頁(yè) 推薦 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于個(gè)性化推薦領(lǐng)域,具體地說(shuō)是一種基于領(lǐng)域本體的多源個(gè)性化新聞推薦方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)規(guī)模的迅速發(fā)展,人們獲取信息的方式越來(lái)越多,信息呈爆炸式增長(zhǎng),用戶逐漸由信息匱乏走向了信息過(guò)載時(shí)代——海量信息使得用戶難以尋找到各自所需的信息。為了方便用戶從海量信息中尋找其所需的內(nèi)容,出現(xiàn)了很多解決方案:包括分類目錄和搜索引擎。分類目錄是把常用熱門(mén)網(wǎng)站分門(mén)別類,便于用戶查找信息。但是,隨著互聯(lián)網(wǎng)規(guī)模的擴(kuò)大,分類目錄只能覆蓋少量熱門(mén)網(wǎng)站。搜索引擎使得用戶只需把自己的需求轉(zhuǎn)換成關(guān)鍵詞的不同組合,再在網(wǎng)絡(luò)中尋找其所需的需求。然而,由于成本、版面等原因的限制,往往只能將網(wǎng)站或信息分為數(shù)個(gè)或十?dāng)?shù)個(gè)類別,這樣的分類粒度往往并不能滿足用戶的需求。搜索引擎則是只需用戶把自己的需求轉(zhuǎn)換成關(guān)鍵詞的組合在網(wǎng)絡(luò)中查找所需的信息。然而由于搜索引擎面向的是所有用戶,它返回的結(jié)果往往具有通用性,不能滿足出于不同維度上的查詢要求。
個(gè)性化推薦技術(shù)正是在這樣的背景下應(yīng)運(yùn)而生的,它是今后網(wǎng)站發(fā)展的整體趨勢(shì),同時(shí)也是互聯(lián)網(wǎng)領(lǐng)域的一個(gè)研究熱點(diǎn)。所謂個(gè)性化新聞推薦就是將個(gè)性化推薦技術(shù)應(yīng)用于新聞資訊領(lǐng)域的推薦。它可以幫助用戶從海量的新聞資訊中輕松快速地發(fā)掘自己可能感興趣的資訊,為用戶節(jié)省了大量的時(shí)間和精力。著名電子商務(wù)網(wǎng)站Amazon銷售額中的35%是來(lái)自推薦系統(tǒng)。由此可見(jiàn),推薦系統(tǒng)在提高了用戶的滿意度的同時(shí),也提高了網(wǎng)站的黏性,增加了網(wǎng)站訪問(wèn)量,為網(wǎng)站帶來(lái)巨大的商業(yè)利益。
在個(gè)性化推薦領(lǐng)域中,網(wǎng)頁(yè)這類文本內(nèi)容的推薦又是一個(gè)非常重要的領(lǐng)域,如何從海量的信息中計(jì)算得到海量用戶可能感興趣的內(nèi)容推薦給用戶,是一個(gè)極具挑戰(zhàn)性的技術(shù)領(lǐng)域。現(xiàn)有的技術(shù)主要有兩種技術(shù)方案比較流行,具體來(lái)說(shuō),包括:
(1)基于協(xié)同過(guò)濾的個(gè)性化推薦方法
基于協(xié)同過(guò)濾的推薦算法(Collaborative?Filtering?Recommendation)是通過(guò)一組用戶的偏好來(lái)向其他用戶進(jìn)行推薦的。這種方法的推薦對(duì)象可以是新聞、圖書(shū)、音樂(lè)、視頻以及實(shí)物等任意對(duì)象。根據(jù)機(jī)器學(xué)習(xí)理論,基于協(xié)同過(guò)濾的推薦算法隸屬于實(shí)例的學(xué)習(xí)范疇。同時(shí),該推薦方法對(duì)于一些特殊品味的用戶不能給予很好的推薦。這類用戶首先具有特殊性,其次,其想要獲得新聞、圖書(shū)等也具有特殊性。
(2)基于內(nèi)容的個(gè)性化推薦算法
基于內(nèi)容的推薦(Content-based?Recommendation)主要是根據(jù)分析用戶已經(jīng)讀取過(guò)的內(nèi)容與待推薦內(nèi)容之間的相似性進(jìn)行推薦的。隨著機(jī)器學(xué)習(xí)等技術(shù)的不斷完善,基于內(nèi)容的推薦方法又可以對(duì)用戶和內(nèi)容分別建立對(duì)應(yīng)的配置文件,通過(guò)分析用戶已經(jīng)讀取過(guò)的內(nèi)容,建立或更新用戶的配置文件。基于內(nèi)容的推薦算法的根本在于信息獲取和信息過(guò)濾。因?yàn)樵谖谋拘畔@取與過(guò)濾方法的研究較為成熟,現(xiàn)有很多基于內(nèi)容的推薦系統(tǒng)都是通過(guò)分析產(chǎn)品的文本信息進(jìn)行推薦。該方法的不足之處是:如何對(duì)新用戶的推薦,因?yàn)樾掠脩魶](méi)有歷史信息,無(wú)法構(gòu)建其對(duì)應(yīng)的配置文件。
與此同時(shí),在研究如何根據(jù)用戶興趣偏好進(jìn)行個(gè)性化推薦的過(guò)程中,構(gòu)建語(yǔ)義概念網(wǎng)絡(luò)就顯得十分重要,本體(Ontology)是目前應(yīng)用十分廣泛的方法。
本體的構(gòu)成主要包括實(shí)例(Instance/Individual)、概念(Concept/Class)、屬性(Attribute)和關(guān)系(Relation),更完整的本體還會(huì)包括限制(Restriction)和定理(Axioms)等。實(shí)例描述領(lǐng)域中的相關(guān)個(gè)體;概念則是實(shí)例的類別和集合,歸類領(lǐng)域中的個(gè)體類別;屬性是用戶描述實(shí)例和類別的特征;而關(guān)系用于描述實(shí)例或類別與其他實(shí)例或類別之間的關(guān)聯(lián)。廣義的本體包括從簡(jiǎn)單到復(fù)雜多種形式的知識(shí)描述系統(tǒng)。分類系統(tǒng)(Taxonomy)是一種最簡(jiǎn)單的本體,所有的概念依據(jù)is-a關(guān)系構(gòu)成一個(gè)樹(shù)狀(或者森林)結(jié)構(gòu),比如生物的分類系統(tǒng),門(mén)綱目屬種中的生物類別根據(jù)is-a構(gòu)成所有已知生物的關(guān)系樹(shù)。在構(gòu)建不同領(lǐng)域的本體時(shí),可能出現(xiàn)非常復(fù)雜的推理規(guī)則,而這往往也是構(gòu)建本體需要領(lǐng)域?qū)<业脑蛑弧1倔w的構(gòu)建為計(jì)算和聯(lián)想提供邏輯上的支持,因?yàn)槁?lián)想具有關(guān)聯(lián)性。考慮到本體自身的特點(diǎn),通過(guò)本體(Ontology)去尋找這種關(guān)聯(lián)更加符合語(yǔ)義邏輯關(guān)系和聯(lián)想的過(guò)程。
發(fā)明內(nèi)容
本發(fā)明為解決現(xiàn)有技術(shù)存在的不足之處,提出一種基于領(lǐng)域本體的多源個(gè)性化新聞推薦方法,以期能挖掘用戶的興趣度,從而提高推薦結(jié)果的準(zhǔn)確性和召回率,提升用戶的滿意度。
本發(fā)明為達(dá)到上述發(fā)明目的所采用如下技術(shù)方案:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410797816.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 頻道信息生成、訪問(wèn)控制、交付方法、IPTV系統(tǒng)及裝置
- 向個(gè)性化回鈴音用戶提供網(wǎng)絡(luò)閃鈴的方法
- 一種個(gè)性化設(shè)置的控制方法、系統(tǒng)及設(shè)備
- 個(gè)性化配置應(yīng)用功能的方法和裝置
- 瀏覽器新建標(biāo)簽頁(yè)的展現(xiàn)方法和瀏覽器客戶端
- 一觸式設(shè)備個(gè)性化
- 一種跨媒介個(gè)性化推薦方法和系統(tǒng)
- 基于大數(shù)據(jù)的證券資訊個(gè)性化服務(wù)系統(tǒng)
- 一種個(gè)性化的交易員教學(xué)自動(dòng)推薦方法和系統(tǒng)
- 實(shí)物禮品的個(gè)性化處理方法、裝置、設(shè)備和可讀存儲(chǔ)介質(zhì)





