[發明專利]基于問答系統的對話處理方法、裝置和系統及移動設備在審
| 申請號: | 201710065940.2 | 申請日: | 2017-02-06 |
| 公開(公告)號: | CN108399169A | 公開(公告)日: | 2018-08-14 |
| 發明(設計)人: | 邱明輝;李鳳麟;黃俊;高星;褚崴 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話處理 候選答案 檢索模型 生成模型 問答系統 移動設備 答案 自動問答系統 準確度 技術獲取 訓練模型 可控性 搜索 輸出 評估 | ||
本發明公開了一種基于問答系統的對話處理方法、裝置和系統及移動設備。其中,該方法包括:接收當前輸入的問題;基于檢索模型獲取問題的至少一個候選答案,并基于生成模型獲取問題的第一答案,其中,檢索模型為基于搜索技術獲取結果的模型,生成模型為基于訓練模型獲取結果的模型;至少根據第一答案和至少一個候選答案進行評估處理,生成問題的輸出答案。本發明解決了現有的自動問答系統準確度低、可控性差的技術問題。
技術領域
本發明涉及信息技術領域,具體而言,涉及一種基于問答系統的對話處理方法、裝置和系統及移動設備。
背景技術
隨著網絡和信息技術的快速發展,互聯網成為人們獲取信息的主要手段,從互聯網上獲取信息的手段大致有兩種:一種是通過搜索引擎搜索關鍵詞來獲取相關信息;另一種是通過向網站或社交軟件提供的客服來詢問問題并獲取相應的答案。前者基于關鍵詞搜索,用戶很難將自己的檢索意圖表達清楚,搜索引擎返回的相關網頁很多,用戶很難快速定位到所需的信息;后者基于自然語言來提問,可以清楚地表達出用戶的意圖,但是人工問答需要提供大量的客服來解答,造成人力成本的急劇增長。為了解決人力成本問題,各大網站或產品廠商采取“自動回復”的聊天機器人來為用戶解答問題,例如,韓國的simsimi、蘋果的Siri、京東客服、小i機器人、微軟小冰、微軟小娜(Cortana)等。
語聊,不僅是微軟小冰這種以嘗鮮逗樂為主的問答系統的核心,在面向電子商務等垂直領域的對話系統中也發揮著重要作用。良好的聊天回復能力,可以提高自助問答的趣味性,使人機交互更加流暢,是機器智能的重要體現。對于簡單的用戶問題,例如機器人自身的設定信息和寒暄類問題,可以通過預設知識點,在交互過程中通過模板匹配或分類來定位和解答。對于其他比較復雜的問題,現有技術通常有兩種處理方法:
第一種,基于檢索模型的處理。即依托已有的問答庫做出回復。對于通用/開放領域的知識問答,可以通過維護大量通用/開放領域知識,使用檢索的方式找出最匹配答案;
第二種,基于生成模型的處理。即根據提問直接生成回復。這里的回復生成并非基于模板填充屬性后的答案生成,而是指使用基于Google Cho等人的文章《Learning PhraseRepresentations using RNN Encoder-Decoder for Statistical MachineTranslation》提出的Sequence-to-Sequence序列建模方法,利用Recursive NeuralNetwork模型對輸入的問題進行「編碼」得到其語義向量表示,再根據該語義來「解碼」生成回復。由于編碼模型和解碼模型已預先經過大規模問答數據的訓練,因此具有編碼語義、生成流暢表述的能力。生成模型能接受各種形式的自然語言輸入,并依此生成相關且流暢的回復。
但是,上述兩種方案都存在一些缺陷,例如,檢索模型依賴于問答庫,對于問答庫可覆蓋的用戶問題,效果不錯,而對于無法覆蓋的用戶問題,難以給出合理的回復;生成模型要大量高質量的問答對來訓練,對于同一個問題,輸出結果可能存在差異,可控性較差,無法保證質量。
針對上述現有的自動問答系統準確度低、可控性差的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種基于問答系統的對話處理方法、裝置和系統及移動設備,以至少解決現有的自動問答系統準確度低、可控性差的技術問題。
根據本發明實施例的一個方面,提供了一種基于問答系統的對話處理方法,包括:接收當前輸入的問題;基于檢索模型獲取問題的至少一個候選答案,并基于生成模型獲取問題的第一答案,其中,檢索模型為基于搜索技術獲取結果的模型,生成模型為基于訓練模型獲取結果的模型;至少根據第一答案和至少一個候選答案進行評估處理,生成問題的輸出答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710065940.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于IOS平臺的旅游網站查詢系統
- 下一篇:數據挖掘方法以及裝置





