[發明專利]對象級垂直搜索引擎個性化排序算法iRank無效
| 申請號: | 201010150965.0 | 申請日: | 2010-04-20 |
| 公開(公告)號: | CN102236646A | 公開(公告)日: | 2011-11-09 |
| 發明(設計)人: | 倪毅;張惟師 | 申請(專利權)人: | 得利在線信息技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對象 垂直 搜索引擎 個性化 排序 算法 irank | ||
1.對象級垂直搜索引擎個性化排序算法iRank包括:
行業本體庫模型:用于構建本行業對象級信息庫,包括每個對象的基本結構化信息和對象之間的相似度信息。
語義分析模型:用于對輸入關鍵詞進行語義級搜索匹配,包括切詞、同義詞、查找匹配和相關度排序模型等子模型。
用戶興趣模型:用于構建用戶和本體庫對象之間喜好興趣關系,并對語義模型排序結進行基于用戶興趣模型的個性化推薦排序,包括情感分析器和eyetrack分析器。
相似用戶模型:用于構建結構化用戶之間的相似度信息,并對用戶興趣模型排序結果再進行基于用戶相似度模型的個性化推薦排序,包括user-item矩陣和協同過濾個性化推薦器。
2.根據權利要求1所述的算法,其特征是該行業本體庫模型通過正則表達式和字符串匹配算法從抓取網頁中抽取以上信息,構建item餐館對象。
3.根據權利要求2所述的算法,其特征是該行業本體庫模型通過向量相似度計算法方法構建item-item的相似矩陣。
4.根據權利要求3所述的算法,其特征是該語義分析模型通過使用stanford-postagger和ictclas工具對輸入的Query進行切詞。
5.根據權利要求4所述的算法,其特征是該查找匹配模型對切詞集合和同義詞集合在本體庫對象的各個域(名稱、地址和簡介等)上進行關鍵字匹配。
6.根據權利要求5所述的算法,其特征是該相關度排序模型通過匹配程度和詞頻等信息進行對匹配結果進行排序并返回給用戶。
7.根據權利要求6所述的算法,其特征是該用戶興趣模型中的情感分析器通過使用Text-Miner?Software?Kit(TMSK)和Rule?Induction?Kit?for?Text(RIKTEXT)工具來自動得到用戶對餐館整體和各個feature的喜好評價結果。
8.根據權利要求7所述的算法,其特征是該用戶興趣模型通過eyetrack技術(互聯網用戶在當前頁面的停留時間)來計算沒有發表評論的user對item的喜好評價結果。
9.根據權利要求8所述的算法,其特征是該相似用戶模型的協同過濾器通過user-based的推薦方法進行個性化推薦。
10.根據權利要求9所述的算法,其特征是iRank算法采用語義分析模型、用戶興趣模型和相似用戶模型三層架構方式,對每個模型的排序結果進行遞進式個性化推薦排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于得利在線信息技術(北京)有限公司,未經得利在線信息技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010150965.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分片式混凝土風電塔架
- 下一篇:一種大型風力發電機熱水儲能專用設備





