[發明專利]一種數據處理方法、裝置及計算機存儲介質和電子設備有效
| 申請號: | 202010060935.4 | 申請日: | 2020-01-19 |
| 公開(公告)號: | CN111274374B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 林鳳綠;王東升;范紅杰;雷欣 | 申請(專利權)人: | 出門問問信息科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F18/24;G06N3/044;G06N3/09;G06N3/0442;G06N3/084 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 江宇 |
| 地址: | 100044 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 計算機 存儲 介質 電子設備 | ||
本發明公開了一種數據處理方法、裝置及計算機存儲介質和電子設備,方法包括:獲取初始語料,所述初始語料至少包括對話目標和歷史語料;對所述初始語料進行詞向量轉換,得到語料詞向量;根據所述語料詞向量進行分類訓練,得到分類結果;根據所述分類結果判斷所述對話目標是否完成。本發明提供的數據處理方法、裝置及計算機存儲介質和電子設備,通過引入對話目標來約束對話,并把對話目標的完成與否當作分類任務來進行分類訓練判斷對話目標是否完成,若完成則不再對同一對話目標進行無意義的回復;若對話目標未完成,則據此生成更為符合對話目標的回復文本來約束對話,以產生更有價值的對話,最終有助于提高對話機器人的用戶滿意度,提高商業價值。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種數據處理方法、裝置及計算機存儲介質和電子設備。
背景技術
近年來,聊天機器人受到了廣泛的關注和發展,聊天機器人是一種通過自然語言模擬人類進行對話的程序,其中,開放域聊天機器人在生活中發揮著重要作用。
傳統的開放域對話一般沒有明確的目標,機器人基于對話生成模型所生成的回復語句中經常出現沒有實際意義的萬能回復,比如中文里的“哈哈哈哈”等回復非常容易被選中,而且一旦用戶向機器輸入這種沒有意義的語句時,機器與人之間的多輪對話就有很高概率會陷入死循環。人和機器之間沒有目的的閑聊,這樣的聊天一方面很難深入,商業價值較小,而且另一方面用戶體驗感也較差。
發明內容
本發明實施例為了有效克服現有技術所存在的上述缺陷,創造性地提供一種數據處理方法,包括:獲取初始語料,所述初始語料至少包括對話目標和歷史語料;對所述初始語料進行詞向量轉換,得到語料詞向量;根據所述語料詞向量進行分類訓練,得到分類結果;根據所述分類結果判斷所述對話目標是否完成。
在一可實施方式中,所述方法還包括:根據所述語料詞向量進行文本回復訓練,得到回復文本;當所述對話目標未完成時,輸出所述回復文本。
在一可實施方式中,通過棧式雙向循環神經網絡根據所述語料詞向量進行分類訓練。
在一可實施方式中,通過神經網絡根據所述語料詞向量進行文本回復訓練。
在一可實施方式中,根據所述語料詞向量進行二分類訓練;所述根據所述分類結果判斷對話目標是否完成包括:當所述分類結果大于第一閾值時,所述對話目標完成;當所述分類結果小于第一閾值時,所述對話目標未完成。
本發明實施例另一方面提供一種數據處理裝置,包括:語料獲取模塊,用于獲取初始語料,所述初始語料至少包括對話目標和歷史語料;向量轉換模塊,用于對所述初始語料進行詞向量轉換,得到語料詞向量;分類訓練模塊,用于根據所述語料詞向量進行分類訓練,得到分類結果;結果判斷模塊,用于根據所述分類結果判斷所述對話目標是否完成。
在一可實施方式中,所述裝置還包括:回復訓練模塊,用于根據所述語料詞向量進行文本回復訓練,得到回復文本;輸出模塊,用于當所述對話目標未完成時,輸出所述回復文本。
在一可實施方式中,所述分類訓練模塊包括:分類訓練單元,用于通過棧式雙向循環神經網絡根據所述語料詞向量進行分類訓練。
在一可實施方式中,所述分類訓練模塊還包括:二分類單元,用于根據所述語料詞向量進行二分類訓練。
本發明實施例另一方面提供一種計算機可讀存儲介質,所述計算機存儲介質中存儲有計算機可執行指令,當所述指令被執行時用于執行上述中任一項所述的數據處理方法。
本發明實施例另一方面提供一種電子設備,包括存儲器和處理器,所述存儲器中儲存有計算機程序指令,所述指令由所述處理器加載并執行以實現上述中任一項所述的數據處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于出門問問信息科技有限公司,未經出門問問信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010060935.4/2.html,轉載請聲明來源鉆瓜專利網。





