日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]指標數據入庫方法、裝置、設備及存儲介質有效

專利信息
申請號: 202111022190.3 申請日: 2021-09-01
公開(公告)號: CN113722460B 公開(公告)日: 2023-10-24
發明(設計)人: 李勇 申請(專利權)人: 平安國際智慧城市科技股份有限公司
主分類號: G06F16/332 分類號: G06F16/332;G06F16/35;G06F16/951;G06F40/289;G06Q10/0639
代理公司: 北京市京大律師事務所 11321 代理人: 姚維
地址: 518000 廣東省深圳市前海深港合*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 指標 數據 入庫 方法 裝置 設備 存儲 介質
【權利要求書】:

1.一種指標數據入庫方法,其特征在于,所述指標數據入庫方法包括:

獲取預設的自定義詞庫,其中,所述自定義詞庫包含指標關鍵詞;

對所述自定義詞庫中的所有指標關鍵詞進行聚類,得到所有指標關鍵詞對應的N個指標類別,以及所述指標類別對應的聚類中心,其中,N為不小于1的整數;

將所述聚類中心作為指標名,并根據所述指標關鍵詞與對應的指標名構建映射關系表;

獲取目標文本,并將所述目標文本進行分詞和數據預處理,得到對應的文本分詞組,其中,所述文本分詞組包括名詞分詞和數詞分詞;

通過所述映射關系表,確定所述文本分詞組中的名詞分詞對應的指標名,并將對應的數詞分詞作為指標值;

將所述目標文本對應的指標名和指標值作為指標數據錄入預設的指標數據庫中。

2.根據權利要求1所述的指標數據入庫方法,其特征在于,所述對所述自定義詞庫中的所有指標關鍵詞進行聚類,得到所有指標關鍵詞對應的N個指標類別,以及所述指標類別對應的聚類中心包括:

設定聚類中心集,其中,所述聚類中心集為空;

將所述自定義詞庫中的第一個指標關鍵詞作為聚類中心加入所述聚類中心集中;

計算第二個指標關鍵詞與所述聚類中心集中每個聚類中心之間的相似度,并判斷最小的相似度是否小于預設閾值;

若是,則將所述第二個指標關鍵詞與最小的相似度對應的聚類中心作為同一指標類別;

若否,則將所述第二個指標關鍵詞作為新的聚類中心加入所述聚類中心集中;

循環上述過程,直至所有指標關鍵詞完成聚類,得到所有指標關鍵詞對應的N個指標類別,以及所述指標類別對應的聚類中心。

3.根據權利要求2所述的指標數據入庫方法,其特征在于,所述計算第二個指標關鍵詞與所述聚類中心集中每個聚類中心之間的相似度包括:

獲取音碼映射規則和形碼映射規則;

通過所述音碼映射規則對所有指標關鍵詞進行轉換,得到對應的音碼,并通過所述形碼映射規則對所有指標關鍵詞進行轉換,得到對應的形碼;

將所述指標關鍵詞對應的音碼和對應的形碼進行拼接,得到對應的指標音形碼;

根據所述指標音形碼,計算所述第二個指標關鍵詞與所述聚類中心集中每個聚類中心之間的編輯距離,并根據所述編輯距離計算所述第二個指標關鍵詞與所述聚類中心集中每個聚類中心的相似度。

4.根據權利要求3所述的指標數據入庫方法,其特征在于,所述計算所述第二個指標關鍵詞與所述聚類中心集中每個聚類中心之間的編輯距離,并根據所述編輯距離計算所述第二個指標關鍵詞與所述聚類中心集中每個聚類中心的相似度包括:

計算所述第二個指標關鍵詞與所述聚類中心集中所有聚類中心之間的編輯距離;

根據所述編輯距離構造對應的編輯距離矩陣;

將所述編輯距離矩陣中最右下角的值作為對應的最短編輯距離;

根據預設的相似度公式和所述最短編輯距離計算所述編輯距離計算所述第二個指標關鍵詞與對應的聚類中心的相似度。

5.根據權利要求1所述的指標數據入庫方法,其特征在于,所述對所述自定義詞庫中的所有指標關鍵詞進行聚類,得到所有指標關鍵詞對應的N個指標類別,以及所述指標類別對應的聚類中心還包括:

將所述指標關鍵詞轉換成對應的詞向量,并設定聚類個數N個;

在所述自定義詞庫中隨機選擇N個指標關鍵詞作為初始聚類中心;

分別計算所述自定義詞庫中的指標關鍵詞到每一個初始聚類中心的余弦距離;

將與初始聚類中心的余弦距離在預設的誤差范圍內的指標關鍵詞劃分為同一指標類別;

計算所述指標類別中詞向量的均值向量,并就所述均值向量重新選擇當前聚類中心,以及計算所述當前聚類中心與對應的初始聚類中心的余弦距離;

若所述當前聚類中心與對應的初始聚類中心的余弦距離小于或等于預設閾值,則得到所有指標關鍵詞對應的N個指標類別,以及所述指標類別對應的聚類中心;

若所述當前聚類中心與對應的初始聚類中心的余弦距離大于預設閾值,則以當前聚類中心進行重新聚類,直到當前聚類中心與上一聚類中心的余弦距離小于或等于預設閾值,得到所有指標關鍵詞對應的N個指標類別,以及所述指標類別對應的聚類中心。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202111022190.3/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产乱xxxxx国语对白| 亚洲乱小说| 久久天堂国产香蕉三区| 欧美日韩精品中文字幕| 一区不卡av| 国产精品视频二区三区| 国内少妇自拍视频一区| 中文字幕a一二三在线| 97精品久久久午夜一区二区三区| 国产精品乱战久久久| 精品国产乱码久久久久久a丨| 亚洲va国产| 精品一区二区在线视频| 欧美一区二区色| 91丝袜诱惑| 国产精品九九九九九九九| 中文字幕a一二三在线| 久久国产精品首页| 国产精品对白刺激久久久| 免费毛片**| 国产一区二区三区的电影| 97精品国产97久久久久久粉红 | 国产日韩欧美不卡| 欧美精品一区二区三区在线四季| 中文字幕欧美一区二区三区 | 久久久久亚洲精品视频| 欧美一区免费| 久久人人爽爽| 亚洲国产99| 激情久久影院| 国久久久久久| 精品国产乱码久久久久久虫虫| 午夜影院一区| 高清欧美精品xxxxx在线看| 国产在线不卡一| 扒丝袜网www午夜一区二区三区| 日韩av在线免费电影| 午夜看片网站| 欧美日韩国产在线一区二区三区 | 欧美日韩一区二区三区不卡| 国产美女三级无套内谢| 国产99视频精品免视看芒果| 窝窝午夜精品一区二区| 在线国产一区二区| 三级电影中文| 羞羞免费视频网站| 国产高清一区二区在线观看| 视频一区二区国产| 精品国产18久久久久久依依影院| 国产在线精品一区二区| 99久久免费毛片基地| 欧美福利三区| 欧美髙清性xxxxhdvid| 日本精品99| 国内久久精品视频| 国产视频一区二区三区四区| 日本一区二区三区在线视频| 最新国产精品久久精品| 狠狠色噜噜狠狠狠狠米奇7777| 欧洲另类类一二三四区| 国产suv精品一区二区4| 日本一区二区三区免费视频| 丰满少妇高潮惨叫久久久一| 68精品国产免费久久久久久婷婷| 日韩美一区二区三区| 精品欧美一区二区在线观看| 性色av色香蕉一区二区三区| 一区二区国产盗摄色噜噜| 福利片午夜| 午夜剧场伦理| 久久精品国产一区二区三区| 午夜叫声理论片人人影院| 97久久超碰国产精品红杏| 国产一区精品在线观看| 欧美二区在线视频| 挺进警察美妇后菊| 精品久久久综合| 亚洲区在线| 国产www亚洲а∨天堂| 国产一区二区极品| 国产区二区| 精品国产一区二区三区高潮视 |