[發明專利]一種知識嵌入的領域識別方法、計算機設備及存儲介質有效
| 申請號: | 202011504511.9 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112507085B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 葉季 | 申請(專利權)人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F40/242;G06N3/04 |
| 代理公司: | 四川省成都市天策商標專利事務所(有限合伙) 51213 | 代理人: | 郭會 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 嵌入 領域 識別 方法 計算機 設備 存儲 介質 | ||
1.一種知識嵌入的領域識別方法,其特征在于,包括:利用分詞詞典對指令詞語進行詞性標注,將特殊名詞的詞性標注為目的領域詞性,在提取詞向量時判斷指令詞語的詞性是否屬于目的領域詞性,如果是就對屬于目的領域詞性的指令詞語進行詞性提取轉換,并將值傳給分詞結果的Token.flag參數,在生成詞向量時,將非空的Token.flag與該指令詞語原本的詞向量進行合并后,再輸入卷積神經網絡進行計算;
具體包括以下步驟:
步驟1.構造目的領域轉換字典、一般詞性檢索列表及分詞詞典;
步驟2.獲取指令語句并通過分詞詞典進行分詞得到若干檢索詞語及其對應的詞性;
步驟3.判斷檢索詞語的詞性是否在一般詞性檢索列表中,若是,則進入步驟4,否則,進入步驟5;
步驟4.將分詞結果賦值給Token.word參數,并將空字符賦值給Token.flag參數;進入步驟6;
步驟5.將分詞結果賦值給Token.word參數,并將詞性對應的中文字符賦值給Token.flag參數;進入步驟6;
步驟6.生成詞向量時,先判斷Token.flag參數是否有值,若是,則進入步驟7,否則,進入步驟9;
步驟7.判斷檢索詞語的詞性是否包含于目的領域轉換字典中,若是,則進入步驟8,否則,進入步驟9;
步驟8.將檢索詞語的原始詞向量和Token.flag參數的詞向量進行合并后輸入卷積神經網絡進行計算;
步驟9.將檢索詞語的原始詞向量輸入卷積神經網絡進行計算。
2.根據權利要求1所述的一種知識嵌入的領域識別方法,其特征在于,所述分詞詞典用于存儲詞語和詞語出現的詞頻還有詞性,且在分詞詞典中可進行特殊名詞添加,并將其詞性標注為想要其被識別成的領域。
3.根據權利要求2所述的一種知識嵌入的領域識別方法,其特征在于,所述目的領域轉換字典用于存放特殊名詞的詞性的中文轉換詞。
4.根據權利要求1至3中任一所述的一種知識嵌入的領域識別方法,其特征在于,所述一般詞性檢索列表用于存儲詞語的一般詞性。
5.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至4中任一項所述知識嵌入的領域識別方法的步驟。
6.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至4中任一項所述知識嵌入的領域識別方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川長虹電器股份有限公司,未經四川長虹電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011504511.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:撒播器以及無人機
- 下一篇:數據質量評估方法、裝置、計算機設備及存儲介質





