[發明專利]基于知識問答平臺的回答排重方法及裝置有效
| 申請號: | 201210185394.3 | 申請日: | 2012-06-06 |
| 公開(公告)號: | CN102750344A | 公開(公告)日: | 2012-10-24 |
| 發明(設計)人: | 趙鵬偉 | 申請(專利權)人: | 新浪網技術(中國)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 趙景平;王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 知識 問答 平臺 回答 方法 裝置 | ||
技術領域
本發明涉及問答平臺開發技術領域,具體涉及一種基于知識問答平臺的回答排重方法及裝置。
背景技術
知識問答平臺,例如新浪愛問、百度知道、搜搜問問等,相比于被動的搜索而言,更注重主動知識分享和經驗交流。近幾年,這種更為人性化、實用性更強的問答平臺,已被越來越多的用戶關注和使用。
目前知識問答平臺中,一些用戶為了獲得積分,往往利用復制粘貼單個用戶已回答的內容或者拼接剪輯多個用戶已回答的內容,來提交自己的答案,給后臺審核管理員審核時造成了很大的障礙,大量重復的答案白白耗費了網絡資源,嚴重影響了知識問答平臺的正常良性運作。因此,在知識問答平臺中,如何及時、有效地針對提問進行回答排重,成為現有技術中亟待解決的技術問題之一。
發明內容
本發明實施例針對上述現有技術存在的問題,提供一種基于知識問答平臺的回答排重方法及裝置,以實現及時、有效的回答排重,節省網絡資源。
為此,本發明實施例提供如下技術方案:
一種基于知識問答平臺的回答排重方法,包括:
獲取當前用戶提交的回答內容;
確定所述回答內容的長度;
如果所述長度小于或等于預設的長度閾值,則判斷所述回答內容是否為預先生成的字符串的子串,所述字符串包括其他用戶已提交到回答數據庫中的已回答內容和問題標題;如果是,則禁止將所述回答內容提交到所述回答數據庫中;否則,將所述回答內容提交到所述回答數據庫中;
如果所述長度大于所述長度閾值,則將所述回答內容按所述長度閾值順序切割為多個子段;
判斷所述多個子段中是否有任意一個子段為所述字符串的子串,如果是,則禁止將所述回答內容提交到所述回答數據庫中;否則,將所述回答內容提交到所述回答數據庫中。
優選地,所述方法還包括:
在確定所述回答內容的長度之前,生成所述字符串。
可選地,所述獲取當前用戶提交的回答內容包括:
在瀏覽器上采用腳本程序解析超文本標記語言HTML頁面的方式獲取當前用戶提交的回答內容;
所述判斷所述回答內容是否為所述字符串的子串包括:
利用頁面腳本語言中判斷字符位置的函數確定所述回答內容在所述字符串中的位置;
如果所述位置大于或等于0,則確定所述回答內容是所述字符串的子串;否則,確定所述回答內容不是所述字符串的子串。
可選地,所述獲取當前用戶提交的回答內容包括:
在服務器上采用嵌入HTML文檔的腳本程序從對應所述當前用戶的數據庫中提取所述當前用戶提交的回答內容;
所述判斷所述回答內容是否為所述字符串的子串包括:
利用服務器腳本語言中的切割函數,以所述回答內容為正則表達式切割所述字符串;
如果所述切割函數的結果大于1,則確定所述回答內容是所述字符串的子串;否則,確定所述回答內容不是所述字符串的子串。
一種基于知識問答平臺的回答排重裝置,包括:
獲取單元,用于獲取當前用戶提交的回答內容;
長度計算單元,用于確定所述回答內容的長度;
第一判斷單元,用于判斷所述長度是否小于或等于預設的長度閾值;
第二判斷單元,用于在所述第一判斷單元判斷所述長度小于或等于預設的長度閾值后,判斷所述回答內容是否為預先生成的字符串的子串,所述字符串包括其他用戶已提交到回答數據庫中的已回答內容和問題標題;
提交控制單元,用于在所述第二判斷單元判斷所述回答內容是所述字符串的子串后,禁止將所述回答內容提交到所述回答數據庫中;在所述第二判斷單元判斷所述回答內容不是所述字符串的子串后,將所述回答內容提交到所述回答數據庫中;
切割單元,用于在所述第一判斷單元判斷所述長度大于所述長度閾值后,將所述回答內容按所述長度閾值順序切割為多個子段;
所述第二判斷單元,還用于判斷所述切割單元切割得到的所述多個子段中是否有任意一個子段為所述字符串的子串;
所述提交控制單元,還用于在所述第二判斷單元判斷所述多個子段中有任意一個子段為所述字符串的子串后,禁止將所述回答內容提交到所述回答數據庫中;在所述第二判斷單元判斷所述多個子段中沒有子段為所述字符串的子串后,將所述回答內容提交到所述回答數據庫中。
優選地,所述裝置還包括:
字符串生成單元,用于在確定所述回答內容的長度之前,生成所述字符串。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新浪網技術(中國)有限公司,未經新浪網技術(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210185394.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:驅動制動傳動滾筒一體式抽油機
- 下一篇:地效式超低空兩用飛行汽車





