[發明專利]數據處理方法、裝置、存儲介質及設備有效
| 申請號: | 202010037213.7 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111258995B | 公開(公告)日: | 2022-11-11 |
| 發明(設計)人: | 吳旭輝;荊寧;張紅林 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/28;G06F16/36;G06F16/45;G06F40/295;G06F40/30;G06K9/62;G06N3/04 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 存儲 介質 設備 | ||
1.一種數據處理方法,其特征在于,包括:
將待識別的目標對象的關鍵信息集合輸入至父分類模型,所述父分類模型與至少兩個子分類模型之間具有類別映射關系;所述目標對象的關鍵信息集合包括文本類型的基礎關鍵信息、文本類型的結構化關鍵信息以及文本類型的屬性關鍵信息,所述基礎關鍵信息用于描述所述目標對象的基本信息,所述結構化關鍵信息用于描述所述目標對象的屬性與屬性值之間的對應關系,所述屬性關鍵信息用于描述所述目標對象具有的屬性;
采用所述父分類模型對所述目標對象的關鍵信息集合進行領域屬性識別,得到所述目標對象的領域屬性類別;
根據所述類別映射關系從所述至少兩個子分類模型中選擇與所述目標對象的領域屬性類別匹配的子分類模型,作為目標子分類模型;
將所述父分類模型進行特征提取得到的所述目標對象的關鍵信息集合對應的特征向量,作為父特征向量;所述父特征向量用于粗略地描述目標對象的屬性特征;所述父特征向量是根據所述基礎關鍵信息對應的全量詞向量、所述結構化關鍵信息對應的全量詞向量、所述屬性關鍵信息對應的全量詞向量以及屬性關鍵詞向量確定得到的,所述基礎關鍵信息對應的全量詞向量、所述結構化關鍵信息對應的全量詞向量、所述屬性關鍵信息對應的全量詞向量是由所述父分類模型的全量詞向量層分別對所述基礎關鍵信息、所述結構化關鍵信息以及所述屬性關鍵信息進行全量特征提取得到的,所述屬性關鍵詞向量是由所述父分類模型的關鍵詞向量層對所述屬性關鍵信息進行特征提取得到的;
調用所述目標子分類模型對所述目標對象的關鍵信息集合進行特征提取,得到所述目標對象的關鍵信息集合對應的特征向量,作為子特征向量;所述子特征向量用于精細地描述目標對象的屬性特征;
調用所述目標子分類模型對所述父特征向量和所述子特征向量進行對象屬性識別,得到所述目標對象的對象屬性類別。
2.如權利要求1所述的方法,其特征在于,所述根據所述類別映射關系從所述至少兩個子分類模型中選擇與所述目標對象的領域屬性類別匹配的子分類模型,作為目標子分類模型,包括:
獲取知識圖譜,所述知識圖譜包括父分類層級和子分類層級,所述父分類層級與所述父分類模型對應,所述子分類層級與所述至少兩個子分類模型對應,
所述父分類層級包括至少兩個領域屬性類別,所述知識圖譜用于指示所述至少兩個子分類模型中的每個子分類模型與所述父分類層級中的領域屬性類別之間的類別映射關系;
根據所述知識圖譜從所述至少兩個子分類模型中選擇與所述目標對象的領域屬性類別具有類別映射關系的子分類模型,作為所述目標子分類模型。
3.如權利要求2所述的方法,其特征在于,所述目標對象的關鍵信息集合包括關鍵詞,所述方法還包括:
建立所述關鍵詞分別與所述目標對象的領域屬性類別和對象屬性類別之間的詞映射關系;
根據所述詞映射關系將所述關鍵詞添加至所述知識圖譜中。
4.如權利要求1所述的方法,其特征在于,所述父分類模型包括至少兩個輸出接口,所述父分類模型通過所述輸出接口與每個所述子分類模型相連接;所述根據所述類別映射關系從所述至少兩個子分類模型中選擇與所述目標對象的領域屬性類別匹配的子分類模型,作為目標子分類模型,包括:
從所述至少兩個輸出接口中獲取輸出所述目標對象的領域屬性類別的輸出接口,作為目標輸出接口;
將與所述目標輸出接口相連接的子分類模型,作為目標子分類模型。
5.如權利要求1所述的方法,其特征在于,所述采用所述父分類模型對所述目標對象的關鍵信息集合進行領域屬性識別,得到所述目標對象的領域屬性類別,包括:
調用所述父分類模型對所述目標對象的關鍵信息集合進行特征提取,得到所述目標對象的關鍵信息集合對應的特征向量;
調用所述父分類模型對所述目標對象的關鍵信息集合對應的特征向量進行領域屬性識別,得到所述目標對象的領域屬性類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010037213.7/1.html,轉載請聲明來源鉆瓜專利網。





