[發(fā)明專利]一種NQI指標(biāo)自動生成方法有效
| 申請?zhí)枺?/td> | 202010625675.0 | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN111767401B | 公開(公告)日: | 2023-04-28 |
| 發(fā)明(設(shè)計(jì))人: | 馮蕾;劉思悅 | 申請(專利權(quán))人: | 中國標(biāo)準(zhǔn)化研究院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/951;G06F40/284;G06F18/2411 |
| 代理公司: | 北京方韜法業(yè)專利代理事務(wù)所(普通合伙) 11303 | 代理人: | 朱麗華 |
| 地址: | 100000*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 nqi 指標(biāo) 自動 生成 方法 | ||
本發(fā)明公開了一種NQI指標(biāo)自動生成方法,包括:建立初級文本庫;對文本全模式分詞,運(yùn)用TF?IDF向量化方法構(gòu)造詞條矩陣,通過多項(xiàng)式樸素貝葉斯分類器和訓(xùn)練模型,選出一級指標(biāo);采用文本挖掘和中文分詞技術(shù),通過Jieba分詞工具,對文本全模式分詞處理,統(tǒng)計(jì)頻數(shù)排前的詞;再通過層次聚類方法遍歷頻數(shù)排前的詞,計(jì)算每兩個(gè)詞的最短距離,將距離最小的兩個(gè)詞匯合為一個(gè)簇,形成二級指標(biāo)選取參考組;結(jié)合參考組優(yōu)先篩選出與頻數(shù)排前詞對應(yīng)的非專有名詞,確定二級指標(biāo);將二級指標(biāo)出現(xiàn)過的文本所在行的句子,重復(fù)上述步驟確定測量指標(biāo)。本發(fā)明NQI指標(biāo)自動生成方法解決了各行業(yè)NQI指標(biāo)選取的主觀性問題,能更科學(xué)的確定NQI指標(biāo)。
技術(shù)領(lǐng)域
本發(fā)明涉及NQI技術(shù)領(lǐng)域,特別是涉及一種NQI指標(biāo)自動生成方法。
背景技術(shù)
2006年,聯(lián)合國工業(yè)發(fā)展組織和國際標(biāo)準(zhǔn)化組織正式提出國家質(zhì)量基礎(chǔ)設(shè)施(NQI)的概念,稱國際質(zhì)量基礎(chǔ)的三大支柱,即計(jì)量、標(biāo)準(zhǔn)和合格評定,共同構(gòu)成一個(gè)完整的技術(shù)鏈條,支撐政府和企業(yè)生產(chǎn)力的提高、生命健康的維護(hù)、消費(fèi)者權(quán)利的保護(hù)、環(huán)境保護(hù)、安全維護(hù)和質(zhì)量提升,發(fā)揮著改善社會福利、完善國際貿(mào)易,和維護(hù)可持續(xù)發(fā)展的重要作用。經(jīng)過十幾年發(fā)展,NQI支撐并服務(wù)于國民經(jīng)濟(jì)的各個(gè)領(lǐng)域,具有較強(qiáng)的技術(shù)性、科學(xué)性、系統(tǒng)性和專業(yè)性。其中,計(jì)量、標(biāo)準(zhǔn)、認(rèn)證認(rèn)可、檢驗(yàn)檢測是國際公認(rèn)的國家質(zhì)量技術(shù)基礎(chǔ)核心要素,以這4個(gè)核心要素為基礎(chǔ),構(gòu)建質(zhì)量基礎(chǔ)設(shè)施能力指標(biāo)體系對評估NQI各要素的發(fā)展現(xiàn)狀具有重要意義。其中,指標(biāo)選取是尤為重要的一環(huán),在指標(biāo)選取的基礎(chǔ)上收集相關(guān)數(shù)據(jù),可以衡量不同行業(yè)、地區(qū)、企業(yè)的NQI相對水平。
目前,關(guān)于NQI的研究,主要圍繞三個(gè)層面展開,一是基于某一行業(yè)的NQI大數(shù)據(jù)系統(tǒng),如一種電網(wǎng)設(shè)備NQI大數(shù)據(jù)系統(tǒng)的發(fā)明(專利號CN201910560682.4);二是基于特定行業(yè)NQI的云平臺系統(tǒng),如一種電網(wǎng)設(shè)備NQI一站式服務(wù)云平臺系統(tǒng)專利(專利號CN201910560691.3);三是有關(guān)質(zhì)量基礎(chǔ)設(shè)施發(fā)展水平宏觀評估方法。上述三個(gè)層面的研究,均存在NQI評價(jià)的技術(shù)針對性不強(qiáng),特別是無法針對特定行業(yè),無法體現(xiàn)行業(yè)特征。當(dāng)前,從行業(yè)領(lǐng)域來看,國民經(jīng)濟(jì)的各行各業(yè)和NQI領(lǐng)域的交叉存在大量技術(shù)空白。其次,現(xiàn)有關(guān)于NQI一般評價(jià)的技術(shù)指標(biāo)在選取方面缺乏科學(xué)論證,導(dǎo)致評測結(jié)果主觀性較強(qiáng)。
由此可見,上述現(xiàn)有的NQI技術(shù)指標(biāo)的選取仍存在有不便與缺陷,而亟待加以進(jìn)一步改進(jìn)。如何能創(chuàng)設(shè)一種新的NQI指標(biāo)自動生成方法,使其有效解決NQI指標(biāo)選取困難,增強(qiáng)指標(biāo)選取過程的科學(xué)性和結(jié)論的客觀性,為NQI評價(jià)提供可靠數(shù)據(jù),成為當(dāng)前業(yè)界極需改進(jìn)的目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種NQI指標(biāo)自動生成方法,使其有效解決NQI指標(biāo)選取困難,增強(qiáng)指標(biāo)選取過程的科學(xué)性和結(jié)論的客觀性,為NQI評價(jià)提供可靠數(shù)據(jù),從而克服現(xiàn)有的NQI技術(shù)指標(biāo)選取不足的問題。
為解決上述技術(shù)問題,本發(fā)明提供一種NQI指標(biāo)自動生成方法,所述方法包括步驟:
(1)通過網(wǎng)絡(luò)爬蟲技術(shù)爬取所需研究行業(yè)的NQI主要管理單位的技術(shù)公開規(guī)范和產(chǎn)業(yè)文件,建立所述行業(yè)的NQI指標(biāo)初級文本庫;
(2)對所述NQI指標(biāo)初級文本庫中文本進(jìn)行清洗,將清洗后的文本進(jìn)行全模式分詞處理,并保存,再運(yùn)用TF-IDF向量化方法,將處理過的全模式分詞所對應(yīng)的字符串轉(zhuǎn)換成數(shù)值向量,構(gòu)造詞條矩陣,并將所述詞條矩陣內(nèi)的所有數(shù)值向量劃分為訓(xùn)練集和測試集,構(gòu)造多項(xiàng)式樸素貝葉斯分類器和訓(xùn)練模型,將訓(xùn)練好的模型運(yùn)用到測試集上,挑選出預(yù)測正確的數(shù)值向量標(biāo)簽,作為NQI一級指標(biāo),并按所述數(shù)值向量標(biāo)簽將所述NQI指標(biāo)初級文本庫中所對應(yīng)的文本分類存放,作為各類數(shù)值向量標(biāo)簽的文本分析樣本;
(3)對每類數(shù)值向量標(biāo)簽的所述文本分析樣本進(jìn)行清洗,得到每類數(shù)值向量標(biāo)簽的素材文本庫;
(4)采用文本挖掘和中文分詞技術(shù),通過Jieba分詞工具,對每類數(shù)值向量標(biāo)簽的素材文本庫的文本進(jìn)行全模式分詞處理,再采用單詞統(tǒng)計(jì)編碼方法,計(jì)算每類數(shù)值向量標(biāo)簽下出現(xiàn)頻數(shù)排在前10位的詞;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國標(biāo)準(zhǔn)化研究院,未經(jīng)中國標(biāo)準(zhǔn)化研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010625675.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)傳輸?shù)姆椒捌溲b置
- 一種電網(wǎng)設(shè)備NQI大數(shù)據(jù)系統(tǒng)
- 一種電網(wǎng)設(shè)備NQI一站式服務(wù)云平臺系統(tǒng)
- NQI質(zhì)量服務(wù)的方法、平臺、用戶終端及可讀存儲介質(zhì)
- 一種NQI指標(biāo)自動生成方法
- 一種基于NQI的進(jìn)出口消費(fèi)品數(shù)據(jù)采集與風(fēng)險(xiǎn)評估系統(tǒng)
- 一種基于NQI的紡織品數(shù)據(jù)采集與風(fēng)險(xiǎn)評估系統(tǒng)及方法
- 一種數(shù)據(jù)傳輸?shù)姆椒捌溲b置
- 基于PESTS分析的NQI成果動力模型及使用方法
- 一種基于地方NQI資源的一站式集成服務(wù)平臺





