[發明專利]一種自動問答方法及裝置有效
| 申請號: | 201210128360.0 | 申請日: | 2012-04-27 |
| 公開(公告)號: | CN103377245B | 公開(公告)日: | 2018-09-11 |
| 發明(設計)人: | 路彥雄;賀翔;焦峰 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 問答 方法 裝置 | ||
1.一種自動問答方法,其特征在于,該方法包括:
根據用戶終端輸入的問題串獲取相關的現有用戶問答數據;
統計所述現有用戶問答數據的摘要部分的中心詞的詞頻;其中,如果所述摘要部分有帶有區別標識的詞,則在統計所述詞頻時采用加權計算;
根據所述各個中心詞的詞頻和預先統計出的所述各個中心詞的逆文檔頻率,計算所述各個中心詞的詞權重,將詞權重最大的中心詞確定為答案詞;
根據所述答案詞確定所述問題串對應的自動問答的答案。
2.如權利要求1所述的自動問答方法,其特征在于,所述根據用戶終端輸入的問題串獲取相關的現有用戶問答數據,包括:
將所述問題串作為檢索串,輸入到問答社區的搜索引擎,獲得與所述檢索串對應的查詢結果,每條查詢結果包括標題部分和帶有區別標識的摘要部分。
3.如權利要求2所述的自動問答方法,其特征在于,統計所述現有用戶問答數據的摘要部分的中心詞的詞頻,包括:
逐條統計每一條查詢結果的摘要部分的中心詞詞頻,直至所有查詢結果都統計完成;
其中,針對每一條查詢結果,將其摘要部分以句號切分為句子,針對每個句子統計其中各中心詞的詞頻,將所有句子中的中心詞的詞頻進行累加,得到摘要中所有中心詞的詞頻。
4.如權利要求3所述的自動問答方法,其特征在于,所述將所有句子中的中心詞的詞頻進行累加,得到摘要中所有中心詞的詞頻,包括:
如果句子中有帶有區別標識的詞,則該句子中各個中心詞的詞頻按3倍標準權重累加;如果該句子前或后相鄰的句子中有帶有區別標識的詞,則該句子中各個中心詞的詞頻按2倍標準權重累加;否則,該句子中各個中心詞的詞頻按標準權重累加,從而得到該句子中所有中心詞的加權詞頻。
5.如權利要求3所述的自動問答方法,其特征在于,所述逐條統計每一條查詢結果的摘要部分的中心詞詞頻,直至所有查詢結果都統計完成,包括:
比較每一條查詢結果的標題部分與所述問題串之間的相似度,如果當前查詢結果的標題和所述問題串的相似度大于預設的閾值,則執行所述統計中心詞詞頻的步驟,否則跳過當前查詢結果的統計中心詞詞頻的步驟。
6.如權利要求1所述的自動問答方法,其特征在于,所述計算各個中心詞的詞權重,包括:
中心詞的詞權重=該中心詞的詞頻×該中心詞的逆文檔頻率。
7.如權利要求2所述的自動問答方法,其特征在于,所述根據答案詞確定所述問題串對應的自動問答的答案,包括:
在所述查詢結果的摘要中找到出現答案詞最多的前s個摘要;s為大于等于1的整數;
將所述s個摘要各按句號分成多個句子;在這些句子中找到出現答案詞和用戶問題串的中心詞個數最多的句子,作為所述問題串對應的自動問答的答案。
8.一種自動問答裝置,其特征在于,該裝置包括:
問答數據獲取模塊,用于根據用戶終端輸入的問題串獲取相關的現有用戶問答數據;
詞頻統計模塊,用于統計所述現有用戶問答數據的摘要部分的中心詞的詞頻;其中,如果所述摘要部分有帶有區別標識的詞,則在統計所述詞頻時采用加權計算;
答案詞確定模塊,用于根據所述各個中心詞的詞頻和預先統計出的所述各個中心詞的逆文檔頻率,計算所述各個中心詞的詞權重,將詞權重最大的中心詞確定為答案詞;
自動問答答案確定模塊,用于根據所述答案詞確定所述問題串對應的自動問答的答案。
9.如權利要求8所述的自動問答裝置,其特征在于,所述問答數據獲取模塊,包括:
檢索單元,用于將所述問題串作為檢索串,輸入到問答社區的搜索引擎;
獲取單元,用于獲取與所述檢索串對應的查詢結果,每條查詢結果包括標題部分和帶有區別標識的摘要部分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210128360.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:割草機用旋轉切割器
- 下一篇:一種便捷式鋼筋定位裝置





