[發明專利]問答語料的收集方法及裝置有效
| 申請號: | 201610099108.X | 申請日: | 2016-02-23 |
| 公開(公告)號: | CN107103005B | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 魏洪平;阮征 | 申請(專利權)人: | 創新先進技術有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06N5/02 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽 |
| 地址: | 開曼群島大開曼島*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問答 語料 收集 方法 裝置 | ||
本申請實施例涉及一種問答語料的收集方法及裝置,是在機器人輔助問答平臺實時對用戶的文本問題進行解答的過程中來自動收集問答語料的,從而避免了現有技術中通過人工收集問答語料而帶來的收集效率低以及成本高的問題;此外,由于用戶實時提問的問題多種多樣,因此,通過對用戶實時提問的文本問題以及對應答案進行收集,可以提高問答語料收集的全面性;根據收集的問答語料對問答模型進行訓練之后,從而可以進一步提高自動問答平臺解答問題的準確性。
技術領域
本申請涉及計算機技術領域,尤其涉及一種問答語料的收集方法及裝置。
背景技術
隨著互聯網的迅速發展,越來越多的用戶通過互聯網獲取信息或進行相互通訊,如,問答平臺作為一種網絡中獲取信息和進行信息交流的平臺普遍流行起來,然而隨著問答平臺的普遍流行,尤其是自動問答平臺的普遍流行,用戶對自動問答平臺回答問題的準確性要求也越來越高。而本領域技術人員公知,自動問答平臺主要是通過具有即時通訊功能的問答機器人來對用戶的問題進行解答,其中,問答機器人是在對大量預先收集的問答語料學習的基礎上來對實時接收的用戶問題進行解答的,此處的問答語料是指用戶的問題以及對應的答案的一個問答對。因此,預先收集的問答語料的質量和數量對提高自動問答平臺回答問題的準確性起著關鍵性的作用。
現有技術中,主要是通過人工來收集問答語料,之后再通過人工將收集的問答語料標記為準確語料和不準確語料來供問答機器人進行學習,然而該方法會耗費大量的人力資源,這增加了問答機器人學習的成本;此外,通過人工收集問答語料會極大的影響問答語料收集的效率,且人工收集的問答語料比較有限,從而影響問答機器人學習的問答語料的全面性,進而會影響自動問答平臺解答用戶問題的準確性。
發明內容
本申請實施例提供了一種問答語料的收集方法及裝置,可以提高問答語料收集的效率和全面性。
第一方面,提供了一種問答語料的收集方法,該方法包括:
在問答平臺根據接收的用戶的文本問題,輸出與所述文本問題對應的至少一個答案時,判斷是否接收到用于從所述至少一個答案中選取目標答案的選擇指令;
若接收到所述選擇指令,則將所述文本問題與所述目標答案收集為第一語料,并為所述第一語料添加第一標識信息,其中,所述第一標識信息用于標識所述文本問題與所述目標答案為正確問答對;
若未接收到所述選擇指令,則將所述文本問題與所述至少一個答案收集為第二語料,并為所述第二語料添加第二標識信息,其中,所述第二標識信息用于標識所述文本問題與所述至少一個答案中的每個答案為不正確問答對。
第二方面,提供了一種問答語料的收集裝置,該裝置包括:判斷單元和收集單元;
所述判斷單元,用于在問答平臺根據接收的用戶的文本問題,輸出與所述文本問題對應的至少一個答案時,判斷是否接收到用于從所述至少一個答案中選取目標答案的選擇指令;
所述收集單元,用于若所述判斷單元判斷接收到所述選擇指令,則將所述文本問題與所述目標答案收集為第一語料,并為所述第一語料添加第一標識信息,其中,所述第一標識信息用于標識所述文本問題與所述目標答案為正確問答對;
所述收集單元,還用于若所述判斷單元判斷未接收到所述選擇指令,則將所述文本問題與所述至少一個答案收集為第二語料,并為所述第二語料添加第二標識信息,其中,所述第二標識信息用于標識所述文本問題與所述至少一個答案中的每個答案為不正確問答對。
本申請提供的問答語料的收集方法及裝置,是在機器人輔助問答平臺實時對用戶的文本問題進行解答的過程中來自動收集問答語料的,從而避免了現有技術中通過人工收集問答語料而帶來的收集效率低以及成本高的問題;此外,由于用戶實時提問的問題多種多樣,因此,通過對用戶實時提問的文本問題以及對應答案進行收集,可以提高問答語料收集的全面性;根據收集的問答語料對問答模型進行訓練之后,從而可以進一步提高自動問答平臺解答問題的準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新先進技術有限公司,未經創新先進技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610099108.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:網頁中的數據處理方法、裝置及系統
- 下一篇:信息發送方法和裝置





