[發(fā)明專利]針對社交媒體的觀點檢索系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201711343978.8 | 申請日: | 2017-12-15 |
| 公開(公告)號: | CN108038204A | 公開(公告)日: | 2018-05-15 |
| 發(fā)明(設(shè)計)人: | 廖祥文;陳國龍;馬飛翔;楊定達(dá) | 申請(專利權(quán))人: | 福州大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q50/00 |
| 代理公司: | 福州元創(chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 蔡學(xué)俊;丘鴻超 |
| 地址: | 350116 福建省福州市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 針對 社交 媒體 觀點 檢索系統(tǒng) 方法 | ||
1.一種針對社交媒體的觀點檢索系統(tǒng),其特征在于:包括:
一文本實體鏈接模塊,用于將用戶查詢和待查詢文檔進(jìn)行分詞處理,同時鏈接到指定的知識圖譜,利用知識圖譜中的實體間關(guān)系,增加系統(tǒng)對用戶查詢和文檔的理解程度;
一查詢擴展模塊,用于根據(jù)用戶的查詢,結(jié)合知識圖譜實體描述文本,通過分類得到查詢擴展詞;
一觀點檢索得分計算模塊,用于結(jié)合用戶查詢和查詢擴展詞,分別計算用戶查詢與文檔間的主題相關(guān)度得分、觀點相關(guān)度得分以及文檔類別得分,并根據(jù)三個部分得分得到該文檔的綜合得分;
一文檔排序輸出模塊,根據(jù)文檔綜合得分從高到低排序,得到查詢的觀點檢索結(jié)果并輸出。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于:還包括:
一數(shù)據(jù)預(yù)處理模塊,用于去除文本中的鏈接、特殊字符及標(biāo)點符號,對英文數(shù)據(jù)進(jìn)行詞干還原處理,過濾文本中的停用詞。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于:所述查詢擴展模塊的分類器包括擴展詞分布、共現(xiàn)頻率、鄰近關(guān)系、文檔集頻率四類特征,以及一個標(biāo)注候選擴展詞類別的公式。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于:所述觀點檢索得分計算模塊包括一帶有擴展詞的產(chǎn)生式觀點檢索模型,該模型通過查詢和文檔之間的關(guān)系計算文檔綜合評分。
5.根據(jù)權(quán)利要求1或4所述的系統(tǒng),其特征在于:所述觀點相關(guān)度得分部分的觀點詞是帶有權(quán)重的,不同查詢中的觀點詞權(quán)重不同。
6.一種針對社交媒體的觀點檢索方法,其特征在于:實現(xiàn)如下,
由文本實體鏈接模塊將分詞后的用戶查詢和待查詢文檔鏈接到指定的知識圖譜,通過知識圖譜中的實體間關(guān)系,增加系統(tǒng)對用戶查詢和文檔的理解程度;以及
由查詢擴展模塊根據(jù)用戶的查詢,結(jié)合知識圖譜中的實體描述文本,通過分類得到用戶查詢的擴展詞;以及
由觀點檢索得分計算模塊結(jié)合原始用戶查詢和查詢擴展詞,計算用戶查詢與文檔間的主題相關(guān)度得分、觀點相關(guān)度得分、以及文檔類別得分,并根據(jù)三個部分得分得到文檔的綜合得分;以及
由文檔排序輸出模塊根據(jù)文檔綜合得分從高到低排序,輸出排序后的文檔列表。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于:還包括如下步驟,
由數(shù)據(jù)預(yù)處理模塊去除文本中的鏈接、特殊字符及標(biāo)點符號,對英文數(shù)據(jù)進(jìn)行詞干還原處理,過濾文本中的停用詞。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于:所述查詢擴展模塊的分類器使用擴展詞分布、共現(xiàn)頻率、鄰近關(guān)系、文檔集頻率四類特征作為分類依據(jù),同時使用一個標(biāo)注候選擴展詞類別的公式對候選詞類別進(jìn)行標(biāo)注。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于:所述觀點檢索得分計算模塊用一帶有擴展詞的產(chǎn)生式觀點檢索模型通過查詢和文檔之間的關(guān)系計算文檔綜合評分。
10.根據(jù)權(quán)利要求6或9所述的方法,其特征在于:所述觀點相關(guān)度得分部分的觀點詞是帶有權(quán)重的,不同查詢中的觀點詞權(quán)重不同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711343978.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲介質(zhì)
- 動態(tài)社交圈確定方法、裝置、設(shè)備及存儲介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計算機設(shè)備及存儲介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲介質(zhì)





