[發明專利]一種指數計算平臺和方法在審
| 申請號: | 201710391942.0 | 申請日: | 2017-05-27 |
| 公開(公告)號: | CN107315775A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 馬寧;段立新;王肅 | 申請(專利權)人: | 國信優易數據有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q10/06;G06N3/04;G06N3/08 |
| 代理公司: | 北京青松知識產權代理事務所(特殊普通合伙)11384 | 代理人: | 鄭青松 |
| 地址: | 100070 北京市豐臺*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 指數 計算 平臺 方法 | ||
技術領域
本發明涉及數據挖掘技術領域,具體涉及一種指數計算平臺和方法。
背景技術
現實生活中,經常涉及對某一事物的量化評價,如對某一區域的經濟能力的評價,以確切知道該區域的經濟狀態。這種評價一般是采取構建指數體系并對計算指數的形式來進行評價。
現有的指數編制的一般流程包括:抽樣統計方法獲取數據;通過人工進行指標體系制定;通過人工從指標體系確定的指標中進行特征選擇;通過選擇的特征對應的特征值訓練指數計算模型;基于指數計算模型進行指數計算,得到指數值。
在上述流程中,指數值通過指數計算模型確定,而指數計算模型通過特征值進行訓練,由于特征的選擇是通過人工的方式進行,難免存在偏差,而在確定各特征的特征值時也可能存在誤差,那么在前置流程充滿偏差誤差的前提下訓練的模型的準確性也無法得到保障,最終導致得到的指數值也可能無法反映對應事物的真實情況,準確性低。
發明內容
本發明提出一種指數計算平臺和方法,旨在解決指數計算模型準確性低導致通過該模型計算的指數準確性低的問題。
本發明采用的技術方案為:
本發明的一方面提供一種指數計算平臺,包括:數據獲取模塊,用于獲取進行指數計算的數據;指標體系構建模塊,用于基于獲取的數據構建指標體系;特征選擇模塊,用于對所述指標體系確定的指標進行特征選擇,確定指數計算使用的特征;權重確定模塊,用于將確定的特征對應的第一特征值以及作為目標變量的初始指數值輸入預設深度學習模型,采用深度神經網絡進行迭代訓練,得到以各特征為變量的函數結構以及各特征分別對應的權重;權重和指數調整模塊,用于按照預設周期執行如下調整步驟:收集表征當前指數與其所表征現實情況之間偏差的監督信息;并對收集的監督信息進行解析生成反饋標簽;根據所述反饋標簽表征的當前指數值的偏差方向確定對應的調整規則,并對當前指數值進行調整,得到調整后的新的當前指數值;將所述新的當前指數值輸入所述預設深度學習模型,采用深度神經網絡再次進行迭代訓練,得到調整后的以各特征為變量的函數結構以及各特征分別對應的權重。
可選地,還包括:指數確定模塊;所述指數確定模塊,用于在所述權重確定模塊確定出各特征分別對應的權重之后,或者在所述權重和指數調整模塊得到調整后的權重之后,將確定的特征對應的第二特征值輸入所述預設深度學習模型,并基于對應的權重確定指數值。
可選地,所述權重和指數調整模塊,具體用于采用如下一種或多種方式收集針對當前指數值的監督信息:通過預設接口接收指定用戶提供的監督信息;或者,通過爬蟲程序從與當前指數所涉及領域的相關網站獲取文本信息;通過解析所述文本信息確定監督信息;或者,對用戶在發布當前指數的指數發布平臺的訪問行為進行監控,通過用戶訪問行為解析出監督信息;或者,通過發布當前指數的指數發布平臺向用戶提供問卷信息,并通過用戶反饋的答復信息收集監督信息。
可選地,所述指標體系構建模塊,具體用于通過指定接口接收指定用戶提供的一級指標;以及基于所述一級指標,采用知識圖譜生成二級指標:針對每個一級指標,確定該一級指標的同義詞,并生成由該一級指標以及該一級指標的同義詞構成的第一關鍵詞詞包;從所述數據獲取模塊獲取的數據中提取與所述第一關鍵詞詞包相關的第一數據;基于所述第一數據生成第一知識圖譜;將所述第一關鍵詞詞包作為鍵映射到所述第一知識圖譜中,并從所述第一知識圖譜中篩選與所述第一關鍵詞詞包相關聯的節點;采用預設算法對篩選出的節點進行去冗余處理,將處理后得到的節點確定為二級指標。
可選地,所述特征選擇模塊,具體用于基于所述二級指標,采用知識圖譜進行特征選擇:針對每個二級指標,確定該二級指標的同義詞,并生成由該二級指標以及該二級指標的同義詞構成的第二關鍵詞詞包;從所述數據獲取模塊獲取的數據中提取與所述第二關鍵詞詞包相關的第二數據;基于所述第二數據生成第二知識圖譜;將所述第二關鍵詞詞包作為鍵映射到所述第二知識圖譜中,并從所述第二知識圖譜中篩選與所述第二關鍵詞詞包相關聯的節點;采用預設算法對篩選出的節點進行去冗余處理,將處理后得到的節點確定為指數計算使用的特征。
可選地,所述特征選擇模塊,還用于在對篩選出的節點進行去冗余處理之后,執行如下降維處理的步驟:采用主成分分析法對所述第二知識圖譜進行解析;針對每個第二關鍵詞詞包,確定與該第二關鍵詞詞包相關聯的節點分別與該第二關鍵詞詞包之間的關聯強度指標;響應于任一節點與對應第二關鍵詞詞包之間的關聯強度指標的指標值達到預設關聯強度閾值,將該任一節點確定為指數計算使用的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據有限公司,未經國信優易數據有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710391942.0/2.html,轉載請聲明來源鉆瓜專利網。





