[發明專利]針對頭銜標準化的與語言無關的機器學習模型在審
| 申請號: | 201910909805.0 | 申請日: | 2019-09-25 |
| 公開(公告)號: | CN110956253A | 公開(公告)日: | 2020-04-03 |
| 發明(設計)人: | S·A·喬爾;U·默哈夫;D·沙查姆 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06F16/9532 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 張立達 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 頭銜 標準化 語言 無關 機器 學習 模型 | ||
1.一種系統,包括:
具有存儲在其上的指令的計算機可讀介質,其中,所述指令當由處理器執行時,使得所述系統執行包括以下項的操作:
獲得第一組訓練數據,所述第一組訓練數據包括職位頭銜與標準化的職位頭銜標識的對;
獲得第二組訓練數據,所述第二組訓練數據包括職位頭銜與技能的對;
將所述第一組訓練數據饋送到深度卷積神經網絡(DCNN)中,所述DCNN被設計為訓練預測模型以輸出預測分數,所述預測分數指示輸入候選職位頭銜與輸入職位頭銜標識相匹配的可能性;
將所述第二組訓練數據饋送到所述DCNN中,以便再次訓練所述預測模型;
將第一候選職位頭銜和多個候選職位頭銜標識饋送到所述預測模型中,以產生針對所述第一候選職位頭銜與候選職位頭銜標識的每個配對的預測分數;以及
保存所述第一候選職位頭銜與來自所述多個候選職位頭銜標識中具有最高預測分數的候選職位頭銜標識之間的映射。
2.根據權利要求1所述的系統,其中,所述將所述第一組訓練數據饋送到所述DCNN中包括:
將所述第一組訓練數據傳遞至所述DCNN的卷積層,所述卷積層包括具有動態可調節的權重的一個或多個過濾器,所述一個或多個過濾器被配置為過濾所述第一組訓練數據以產生針對所述第一組訓練數據的每個片段的輸出容量,所述輸出容量針對所述一個或多個過濾器中的每個過濾器包括不同的特征映射;
將來自所述卷積層的輸出容量傳遞通過非線性層,所述非線性層對來自所述卷積層的輸出容量應用非線性函數;
將來自所述非線性層的輸出容量傳遞通過池化層,所述池化層降低來自所述非線性層的輸出容量的維度;
將來自所述池化層的輸出容量傳遞通過分類層,所述分類層包括專用卷積層,所述專用卷積層具有過濾器,所述過濾器被設計為基于來自所述池化層的輸出容量來輸出針對所述第一組訓練數據的每個片段的預測分數;
將所述第一組訓練數據傳遞通過損失層,所述損失層對所述第一組訓練數據應用損失函數,以得出對誤差水平的指示,所述誤差水平是來自所述分類層的、針對所述第一組訓練數據的每個片段的所述預測分數與來自所述第一組訓練數據的每個片段的標簽的預測分數的比較;
確定針對所述第一組訓練數據的所述誤差水平的組合是否超過預設閾值;以及
響應于確定所述誤差水平的所述組合超過所述預設閾值,更新所述DCNN的所述卷積層中的所述一個或多個過濾器的所述權重,以降低所述誤差水平的所述組合并且使用不同的一組訓練數據來重復對所述DCNN的所述訓練。
3.根據權利要求1所述的系統,其中,所述第一組訓練數據是從頭銜標識的分類法獲得的,所述分類法具有所述頭銜標識與頭銜之間的存儲的映射。
4.根據權利要求1所述的系統,其中,所述第一組訓練數據是從在線服務的成員的成員簡檔獲得的,所述成員簡檔中的每個成員簡檔是以至少兩種語言書寫的。
5.根據權利要求1所述的系統,其中,所述第一組訓練數據是從機器翻譯的頭銜獲得的。
6.根據權利要求1所述的系統,其中,所述第一組訓練數據是從頭銜的群組獲得的,所述頭銜的群組與其他頭銜在字符方面是類似的。
7.根據權利要求1所述的系統,其中,所述第二組訓練數據是從在線服務的成員的成員簡檔獲得的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910909805.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車身前部結構
- 下一篇:用于半自主車輛的操控信號的確定





