[發(fā)明專利]機器學習方法、裝置、設備及存儲介質在審
| 申請?zhí)枺?/td> | 201811030112.6 | 申請日: | 2018-09-05 |
| 公開(公告)號: | CN109256122A | 公開(公告)日: | 2019-01-22 |
| 發(fā)明(設計)人: | 葉俊鵬;徐易楠;劉云峰;吳悅;陳正欽;楊振宇;胡曉;汶林丁 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/06;G10L15/07 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 葛鐘 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 任務處理 反饋數據 指令 用戶請求數據 機器學習 訓練數據 存儲介質 模型訓練 請求數據 數據包括用戶 行為習慣 匹配 反饋 申請 | ||
1.一種機器學習方法,其特征在于,包括:
獲取用戶請求數據;
獲取基于所述用戶請求數據生成的指令;所述指令經由預先訓練的任務處理模型基于作為輸入數據的所述用戶請求數據得到;
獲取用戶對所述指令的執(zhí)行結果的反饋數據;
以所述用戶請求數據、所述指令和所述反饋數據作為訓練數據,訓練所述任務處理模型。
2.根據權利要求1所述的方法,其特征在于,所述用戶請求數據為音頻請求數據。
3.根據權利要求2所述的方法,其特征在于,
所述任務處理模型包括:詞向量模型、語音識別模型、實體識別模型、狀態(tài)追蹤模型、詞槽預測模型、指令生成模型:
所述預先訓練的任務處理模型基于所述用戶請求數據得到所述指令的過程,包括:
通過所述語音識別模型,提取所述音頻請求數據的特征,以及將所述音頻進行識別,得到用戶請求語句;
通過所述詞向量模型,轉化所述用戶請求語句為詞向量;
通過所述狀態(tài)追蹤模型,根據當前用戶請求語句和所述詞向量及歷史請求語句及詞向量,生成新的對話狀態(tài)特征,并記錄用戶請求語句和詞向量形成歷史請求語句及詞向量;
通過所述實體識別模型,對所述用戶請求問句進行實體識別得到所述用戶請求問句對應的實體識別標簽;
通過詞槽預測模型,根據所述對話狀態(tài)特征和所述實體識別標簽,生成任務詞槽,并對任務詞槽進行填充;
通過指令生成模型,根據所述對話狀態(tài)特征和所述已填充任務詞槽,生成指令。
4.根據權利要求3所述的方法,其特征在于,所述詞向量模型、所述語音識別模型、所述實體識別模型、所述狀態(tài)追蹤模型、所述詞槽預測模型和所述指令生成模型為深度學習模型。
5.根據權利要求1所述的方法,其特征在于,所述預先訓練的任務處理模型基于預先采集的訓練用的用戶請求數據、訓練用的指令和訓練用的反饋數據作為訓練數據訓練得到。
6.根據權利要求5所述的方法,其特征在于,預先采集所述訓練用的用戶請求數據、所述訓練用的指令和所述訓練用的反饋數據采集的方法包括:
獲取并采集所述訓練用的用戶請求數據;
獲取并采集基于所述訓練用的用戶請求數據生成的訓練用的指令;所述訓練用的指令經由規(guī)則模型基于作為輸入數據的所述訓練用的用戶請求數據得到;
獲取并采集用戶對所述訓練用指令的執(zhí)行結果的反饋數據。
7.一種機器學習裝置,其特征在于,包括:
第一獲取模塊,用于獲取用戶請求數據;
第二獲取模塊,用于獲取基于所述用戶請求數據生成的指令;所述指令經由預先訓練的任務處理模型基于作為輸入數據的所述用戶請求數據得到;
第三獲取模塊,用于獲取用戶對所述指令的執(zhí)行結果的反饋數據;
訓練模塊,用于以所述用戶請求數據、所述指令和所述反饋數據作為訓練數據,訓練所述任務處理模型。
8.根據權利要求7所述的裝置,其特征在于,所述用戶請求數據為音頻請求數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811030112.6/1.html,轉載請聲明來源鉆瓜專利網。





