[發明專利]一種多頻道聯合處理方法和裝置在審
| 申請號: | 202010047500.6 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111274392A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 宋彥;田元賀;王詠剛 | 申請(專利權)人: | 創新工場(廣州)人工智能研究有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/253 |
| 代理公司: | 北京啟坤知識產權代理有限公司 11655 | 代理人: | 李琛 |
| 地址: | 510700 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 頻道 聯合 處理 方法 裝置 | ||
1.一種用于分詞和詞性標注系統的多頻道聯合處理方法,其中,所述方法包括以下步驟:
獲取輸入序列中包含的字序列和字序列對應的長度信息;
根據所述長度信息將各個字序列對應于多個頻道,使得相同長度的字序列集合對應于一個頻道;
通過在各個頻道中,分別針對不同長度的字序列集合對于聯合標簽的貢獻大小分別建模并進行加權計算,得到各個頻道對應的針對特定長度的加權字序列向量;
通過將各個頻道對應的長度加權向量進行加權串聯,得到輸入序列對應的加權字序列向量,其中,所述加權字序列向量用于反映輸入序列包含的不同長度的不同字序列集合對于聯合標簽的貢獻。
2.根據權利要求1所述的方法,其中,所述通過在各個頻道中,分別針對不同長度的字序列集合對于聯合標簽的貢獻大小分別建模并進行加權計算,得到各個頻道對應的針對特定長度的加權字序列向量的步驟包括:
對于每個頻道,計算該頻道對應的字序列集合相對于輸入序列中每個字的權重;
根據得到的字序列集合相對于輸入序列中每個字的權重,通過計算其加權和來得到該頻道對應的針對特定長度的加權字序列向量。
3.根據權利要求1所述的方法,其中,所述方法包括以下步驟:
將所述加權字序列向量與輸入序列的字向量串聯;
基于串聯后的向量,在分詞和詞性標注系統中得到輸入序列的預測標簽;
通過得到的各個分詞的預測標簽和對應的真實標簽來計算并優化目標函數,進而訓練聯合標簽的模型。
4.根據權利要求1至3中任一項所述的方法,其中,所述方法包括以下步驟:
使用訓練好的聯合標簽的模型,對輸入的中文序列進行分析,從而獲得該中文序列的分詞和詞性標注的聯合標注結果。
5.根據權利要求1中所述的方法,其中,所述獲取輸入序列中包含的字序列和其對應的長度信息的步驟包括:
通過預存儲的包含長度信息的詞表,獲取輸入序列中包含的字序列和字序列對應的長度信息。
6.一種用于分詞和詞性標注系統的多頻道聯合處理裝置,其中,所述多頻道聯合處理裝置包括:
獲取模塊,用于獲取輸入序列中包含的字序列和字序列對應的長度信息;
頻道對應模塊,用于根據所述長度信息將各個字序列對應于多個頻道,使得相同長度的字序列集合對應于一個頻道;
多頻道計算模塊,用于通過在各個頻道中,分別針對不同長度的字序列集合對于聯合標簽的貢獻大小分別建模并進行加權計算,得到各個頻道對應的針對特定長度的加權字序列向量;
加權串聯模塊,用于通過將各個頻道對應的長度加權向量進行加權串聯,得到輸入序列對應的加權字序列向量,其中,所述加權字序列向量用于反映輸入序列包含的不同長度的不同字序列集合對于聯合標簽的貢獻。
7.根據權利要求6所述的多頻道聯合處理裝置,其中,所述多頻道計算模塊用于:
對于每個頻道,計算該頻道對應的字序列集合相對于輸入序列中每個字的權重;
根據得到的字序列集合相對于輸入序列中每個字的權重,通過計算其加權和來得到該頻道對應的針對特定長度的加權字序列向量。
8.根據權利要求6所述的多頻道聯合處理裝置,其中,所述多頻道聯合處理裝置包括:
向量串聯模塊,用于將所加權字序列向量與輸入序列的字向量進行串聯;
標簽預測模塊,用于基于串聯后的向量,在分詞和詞性標注系統中得到輸入序列的預測標簽;
函數計算模塊,用于通過得到的各個分詞的預測標簽和對應的真實標簽來計算并優化目標函數,進而訓練聯合標簽的模型。
9.根據權利要求6至8中任一項所述的多頻道聯合處理裝置,其中,所述多頻道聯合處理裝置包括:
標注結果模塊,用于使用訓練好的聯合標簽的模型,對輸入的中文序列進行分析,從而獲得該中文序列的分詞和詞性標注的聯合標注結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新工場(廣州)人工智能研究有限公司,未經創新工場(廣州)人工智能研究有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010047500.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種計算機通訊設備抗干擾裝置
- 下一篇:一種計算機網絡身份驗證系統





