[發明專利]機器學習方法、裝置、設備及存儲介質在審
| 申請號: | 201811030112.6 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN109256122A | 公開(公告)日: | 2019-01-22 |
| 發明(設計)人: | 葉俊鵬;徐易楠;劉云峰;吳悅;陳正欽;楊振宇;胡曉;汶林丁 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L15/07 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 葛鐘 |
| 地址: | 518000 廣東省深圳市南山區粵海*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 任務處理 反饋數據 指令 用戶請求數據 機器學習 訓練數據 存儲介質 模型訓練 請求數據 數據包括用戶 行為習慣 匹配 反饋 申請 | ||
本發明涉及一種機器學習方法、裝置、設備及存儲介質。其中,機器學習方法包括:獲取用戶請求數據;獲取基于用戶請求數據生成的指令;指令經由預先訓練的任務處理模型基于作為輸入數據的用戶請求數據得到;獲取用戶對指令的執行結果的反饋數據;以用戶請求數據、指令和反饋數據作為訓練數據,訓練任務處理模型。由于本申請提供的方法中,任務處理模型訓練用的數據包括用戶請求數據、指令和反饋數據作為訓練數據,其中,反饋數據是用戶對指令的執行結果的反饋的數據,由于任務處理模型訓練用的訓練數據包括:反饋數據。在對任務處理模型進行訓練的過程中,可以使得任務處理模型基于用戶的請求數據生成的指令與用戶的行為習慣匹配。
技術領域
本發明涉及智能設備技術領域,具體涉及一種機器學習方法、裝置、設備及存儲介質。
背景技術
隨著科技水平的提高,越來越多的智能設備進入人們的生活。其中,機器客服就是一種可以為人們生活帶來極大便利的智能設備。機器客服主要用于為用戶解答常見的問題,查詢資料或完成一些特定的任務。機器客服在用于上述用途時,需要調用后臺的任務處理模型以完成與用戶的交互。
但是,為了使任務處理模型更加智能,需要向任務處理模型輸入預先采集的數據,以進行訓練。但是,由于為預先采集的數據包括請求數據和指令,訓練數據的來源與用戶無關,所以訓練后的任務處理模型基于用戶的請求數據生成的指令與用戶的行為習慣并不匹配。
發明內容
有鑒于此,本發明的目的在于克服訓練后的任務處理模型局域用戶的請求數據生成的指令與用戶的行為習慣并不匹配的問題,提供一種機器學習方法、裝置、設備及存儲介質。
根據本申請實施例的第一方面,提供一種機器學習方法,包括:
獲取用戶請求數據;
獲取基于所述用戶請求數據生成的指令;所述指令經由預先訓練的任務處理模型基于作為輸入數據的所述用戶請求數據得到;
獲取用戶對所述指令的執行結果的反饋數據;
以所述用戶請求數據、所述指令和所述反饋數據作為訓練數據,訓練所述任務處理模型。
可選的,所述用戶請求數據為音頻請求數據。
所述任務處理模型包括:詞向量模型、語音識別模型、實體識別模型、狀態追蹤模型、詞槽預測模型、指令生成模型:
所述預先訓練的任務處理模型基于所述用戶請求數據得到所述指令的過程,包括:
通過所述語音識別模型,提取所述音頻請求數據的特征,以及將所述音頻進行識別,得到用戶請求語句;
通過所述詞向量模型,轉化所述用戶請求語句為詞向量;
通過所述狀態追蹤模型,根據當前用戶請求語句和所述詞向量及歷史請求語句及詞向量,生成新的對話狀態特征,并記錄用戶請求語句和詞向量形成歷史請求語句及詞向量;其中,所述歷史請求語句及詞向量為本次用戶請求語句之前的歷史請求語句及詞向量;
通過所述實體識別模型,對所述用戶請求問句進行實體識別得到所述用戶請求問句對應的實體識別標簽;
通過詞槽預測模型,根據所述對話狀態特征和所述實體識別標簽,生成任務詞槽,并對任務詞槽進行填充,
通過指令生成模型,根據所述對話狀態特征和所述已填充任務詞槽,生成指令。
可選的,所述詞向量模型、所述特征提取模型、所述實體識別模型、所述狀態追蹤模型、所述詞槽預測模型和所述指令生成模型為深度學習模型。
可選的,所述預先訓練的任務處理模型基于預先采集的訓練用的用戶請求數據、訓練用的指令和訓練用的反饋數據作為訓練數據訓練得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811030112.6/2.html,轉載請聲明來源鉆瓜專利網。





