[發明專利]基于人工智能的資源池對象數據挖掘方法及系統有效
| 申請號: | 202210135879.5 | 申請日: | 2022-02-15 |
| 公開(公告)號: | CN114201973B | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 張建明;王海靈 | 申請(專利權)人: | 深圳博士創新技術轉移有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06K9/62 |
| 代理公司: | 廣州博聯知識產權代理有限公司 44663 | 代理人: | 梁志標 |
| 地址: | 518000 廣東省深圳市南山區粵海街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 資源 對象 數據 挖掘 方法 系統 | ||
1.一種基于人工智能的資源池對象數據挖掘方法,其特征在于,應用于對象數據挖掘系統,所述方法至少包括:
查找目標對象數據,所述目標對象數據包括設定對象標簽中的M個對象語義提取數據,M為正整數;
將所述目標對象數據解析為M個單元對象數據,每個單元對象數據包括一個對象語義提取數據;
對于每個單元對象數據,基于所述單元對象數據的第一技術語義向量序列和參考對象數據的第二技術語義向量序列,確定所述單元對象數據中的對象語義提取數據是否為設定技術標簽的對象語義提取數據;其中,所述參考對象數據是事先用于進行比較配置的,且所述參考對象數據包括設定技術標簽的對象語義提取數據;
基于設定技術標簽的對象語義提取數據的有效語義向量數量確定所述設定技術標簽的對象語義提取數據的技術匹配性;
所述將所述目標對象數據解析為M個單元對象數據,包括:
將所述目標對象數據傳遞到完成權重指示優化的AI訓練模型,并基于所述AI訓練模型分別游走所述目標對象數據的每個對象段落數據,并確定所述對象段落數據的對象語義向量是否對應有技術標簽屬性,如果確定是,則將所述對象段落數據解析為一個單元對象數據;其中,在AI訓練模型的模型權重指示優化流程中,將參考對象標定數據序列傳遞到AI訓練模型,所述參考對象標定數據序列包括多個參考對象數據,所述參考對象數據包括設定對象標簽中的不少于一個對象語義提取數據,每個對象語義提取數據具有記錄向量信息,所述記錄向量信息標定有技術標簽屬性,以使AI訓練模型基于所述參考對象標定數據序列進行模型權重指示優化,得到記錄向量信息的對象語義向量與技術標簽屬性的關聯學習向量;
所述基于所述單元對象數據的第一技術語義向量序列和參考對象數據的第二技術語義向量序列,確定所述單元對象數據中的對象語義提取數據是否為設定技術標簽的對象語義提取數據,包括:
如果事先用于進行比較配置的參考對象數據的數量為不少于兩個,確定所述單元對象數據的第一技術語義向量序列與每個參考對象數據的第二技術語義向量序列的匹配程度;
如果最大匹配程度大于預設匹配程度,則確定所述單元對象數據中的對象語義提取數據為所述最大匹配程度對應的參考對象數據中的設定技術標簽的對象語義提取數據;
所述單元對象數據的第一技術語義向量序列的提取步驟,包括:
獲取所述單元對象數據的對象語句分段數據,獲取所述單元對象數據的對象關鍵詞聯系數據;
基于所述單元對象數據的對象語句分段數據和所述單元對象數據的對象關鍵詞聯系數據,確定所述單元對象數據的第一技術語義向量序列;
所述參考對象數據的第二技術語義向量序列的提取步驟,包括:
獲取參考對象數據的對象語句分段數據,獲取參考對象數據的對象關鍵詞聯系數據;
基于參考對象數據的對象語句分段數據和參考對象數據的對象關鍵詞聯系數據,確定所述參考對象數據的第二技術語義向量序列;
所述預設匹配程度的提取步驟,包括:
確定參考對象語義提取數據對象數據的技術語義向量序列與參考對象數據的技術語義向量序列的第一匹配程度;
確定參考對象標定數據的技術語義向量序列與參考對象數據的技術語義向量序列的第二匹配程度;
基于所述第一匹配程度和所述第二匹配程度確定所述預設匹配程度,所述預設匹配程度小于所述第一匹配程度,所述預設匹配程度大于所述第二匹配程度;其中,所述參考對象語義提取數據對象數據中的設定技術標簽的對象語義提取數據與所述參考對象數據中的設定技術標簽的對象語義提取數據相同;
所述參考對象標定數據未包括設定技術標簽的對象語義提取數據,或者,所述參考對象標定數據中的設定技術標簽的對象語義提取數據與所述參考對象數據中的設定技術標簽的對象語義提取數據不同;
所述查找目標對象數據包括:
從對象數據挖掘系統獲取基礎對象數據,所述基礎對象數據包括設定對象標簽中的M個對象語義提取數據;
確定所述基礎對象數據中的對象語義提取數據是否無效;
如果確定否,則將所述基礎對象數據確定為所述目標對象數據;
如果確定是,則提示所述對象數據挖掘系統再次獲取基礎對象數據;
所述確定所述基礎對象數據中的對象語義提取數據是否無效,包括:
基于所述基礎對象數據和公告對象數據確定差異對象數據;其中,所述公告對象數據是所述設定對象標簽中未包括對象語義提取數據時解析到的對象數據;
將所述基礎對象數據解析為M個單元對象數據,每個單元對象數據包括一個對象語義提取數據,并確定所述M個單元對象數據對應的聯系對象數據;
確定所述差異對象數據與所述聯系對象數據的關聯信息;
基于所述關聯信息確定所述基礎對象數據中的對象語義提取數據是否無效。
2.一種基于人工智能的資源池對象數據挖掘系統,其特征在于,包括互相之間通信的處理器和存儲器,所述處理器用于從所述存儲器中調取計算機程序,并通過運行所述計算機程序實現權利要求1所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳博士創新技術轉移有限公司,未經深圳博士創新技術轉移有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210135879.5/1.html,轉載請聲明來源鉆瓜專利網。





