[發(fā)明專利]基于Voronoi圖的訓練樣本遮掩方法、裝置及相關設備有效
| 申請?zhí)枺?/td> | 202110556622.2 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113191158B | 公開(公告)日: | 2021-10-26 |
| 發(fā)明(設計)人: | 王偉;黃勇其;于翠翠;張黔 | 申請(專利權)人: | 潤聯(lián)軟件系統(tǒng)(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/36;G06F40/279;G06F16/35 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 武志峰 |
| 地址: | 518000 廣東省深圳市福田區(qū)梅林街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 voronoi 訓練 樣本 遮掩 方法 裝置 相關 設備 | ||
1.一種基于Voronoi圖的訓練樣本遮掩方法,其特征在于,包括:
獲取訓練語料的單詞集合和主題詞集合,其中,所述主題詞集合中的單詞均為主題詞,所述單詞集合中的單詞包含主題詞和非主題詞;
基于所述單詞集合和主題詞集合的單詞屬性構建Voronoi圖,并將所述單詞集合中的非主題詞劃分到所述Voronoi圖的網(wǎng)格中,其中,所述Voronoi圖中每一主題詞對應一個網(wǎng)格,一個網(wǎng)格至少包含一個非主題詞;
根據(jù)網(wǎng)格影響力對所述Voronoi圖中的網(wǎng)格進行排序,得到網(wǎng)格排序隊列;
對所述網(wǎng)格排序隊列各網(wǎng)格內(nèi)的單詞進行隨機遮掩,得到訓練樣本隊列;
所述基于所述單詞集合和主題詞集合的單詞屬性構建Voronoi圖,包括:
根據(jù)所述單詞集合中每個單詞的TF-IDF值及余弦相似度,構建2-D平面;
將所述主題詞集合中每個主題詞映射到所述2-D平面,以每個主題詞在所述2-D平面上對應的主題點構建所述Voronoi圖;
基于所述單詞集合與主題詞集合的差集,得到非主題詞集合;
計算所述非主題詞集合中每一非主題詞的詞向量與所有主題點對應主題詞詞向量之間的距離,確定所述非主題詞的最短距離主題點;
將所述非主題詞映射到所述Voronoi圖中,得到所述非主題詞對應的非主題點,并將所述非主題點劃分到對應最短距離主題點的網(wǎng)格中。
2.根據(jù)權利要求1所述的基于Voronoi圖的訓練樣本遮掩方法,其特征在于,所述獲取訓練語料的單詞集合和主題詞集合,包括:
對所述訓練語料進行分詞處理,得到所述訓練語料的單詞集合;
對所述訓練語料進行主題詞提取,得到所述訓練語料的主題詞集合。
3.根據(jù)權利要求1所述的基于Voronoi圖的訓練樣本遮掩方法,其特征在于,所述根據(jù)網(wǎng)格影響力所述Voronoi圖中的網(wǎng)格進行排序,得到網(wǎng)格排序隊列,包括:
按網(wǎng)格面積對所述Voronoi圖中每個網(wǎng)格進行降序排序,得到網(wǎng)格面積隊列;
獲取所有主題詞的詞嵌入向量,根據(jù)所述詞嵌入向量對所有主題詞進行聚類,得到主題詞簇;
根據(jù)所述主題詞簇中每一主題詞對應網(wǎng)格間的關系構建鄰居關系矩陣,計算所述主題詞簇中每一主題詞相對所述鄰居關系矩陣的貢獻值,根據(jù)所述貢獻值對所述主題詞簇中的主題詞進行降序排序,得到貢獻排序隊列;
根據(jù)每一網(wǎng)格在所述網(wǎng)格面積隊列和貢獻排序隊列中的位序之和,對每一網(wǎng)格進行降序排序,得到網(wǎng)格排序隊列。
4.根據(jù)權利要求3所述的基于Voronoi圖的訓練樣本遮掩方法,其特征在于,所述按網(wǎng)格面積對所述Voronoi圖中每個網(wǎng)格進行降序排序,得到網(wǎng)格面積隊列,包括:
確定所述Voronoi圖中每一網(wǎng)格的鄰居網(wǎng)格,所述鄰居網(wǎng)格包括直接鄰居網(wǎng)格和間接鄰居網(wǎng)格;
計算每一網(wǎng)格與對應的鄰居網(wǎng)格之間的面積和;
根據(jù)所述面積和對所有網(wǎng)格進行降序排序,得到所述網(wǎng)格面積隊列。
5.根據(jù)權利要求3所述的基于Voronoi圖的訓練樣本遮掩方法,其特征在于,所述按網(wǎng)格面積對所述Voronoi圖中每個網(wǎng)格進行降序排序,得到網(wǎng)格面積隊列,包括:
確定所述Voronoi圖中每一網(wǎng)格對應鄰居網(wǎng)格內(nèi)的節(jié)點數(shù)量,所述節(jié)點包括主題點和非主題點;
根據(jù)所述節(jié)點數(shù)量計算每一網(wǎng)格與對應的鄰居網(wǎng)格之間的面積和;
根據(jù)所述面積和對所有網(wǎng)格進行降序排序,得到所述網(wǎng)格面積隊列。
6.根據(jù)權利要求3所述的基于Voronoi圖的訓練樣本遮掩方法,其特征在于,所述根據(jù)所述主題詞簇中每一主題詞對應網(wǎng)格間的關系構建鄰居關系矩陣,包括:
獲取所述主題詞簇中每一主題詞對應網(wǎng)格之間的網(wǎng)格關系,所述網(wǎng)格關系包括直接鄰居關系、間接鄰居關系和非鄰居網(wǎng)格關系;
根據(jù)所述網(wǎng)格關系計算對應網(wǎng)格之間的關系值,其中,直接鄰居關系的關系值為;間接鄰居關系的關系值為,其中,,分別為兩個網(wǎng)格對應主題詞的詞向量;非鄰居網(wǎng)格關系的關系值為;
根據(jù)各網(wǎng)格之間的關系值構建鄰居關系矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于潤聯(lián)軟件系統(tǒng)(深圳)有限公司,未經(jīng)潤聯(lián)軟件系統(tǒng)(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110556622.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 基于QTM雙向掃描的球面Voronoi圖生成算法
- 基于sub-Voronoi圖面積法的動態(tài)傳感器網(wǎng)絡覆蓋空洞檢測修復方法
- 一種用于大數(shù)據(jù)測試的加權Voronoi圖生成方法
- 一種基于Voronoi圖的室內(nèi)布局評價方法及系統(tǒng)
- 一種基于Voronoi樹圖的信息檢索可視化系統(tǒng)及方法
- 一種電子地圖的放大裁剪方法及裝置
- 重心Voronoi圖的規(guī)整性提升方法
- 基于Voronoi圖的多無人機編隊隊形可靠變換方法
- 三維裁剪Voronoi圖的多線程并行計算方法、系統(tǒng)
- 基于Voronoi動態(tài)圖優(yōu)化基站維護資源配置的方法





