[發明專利]一種調研數據標準化方法及系統有效
| 申請號: | 202110678640.8 | 申請日: | 2021-06-18 |
| 公開(公告)號: | CN113342793B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 張鴻翔;徐曉;唐亞;宋保樹 | 申請(專利權)人: | 立信(重慶)數據科技股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/28;G06Q30/0201 |
| 代理公司: | 重慶強大凱創專利代理事務所(普通合伙) 50217 | 代理人: | 冉劍俠 |
| 地址: | 401120 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 調研 數據 標準化 方法 系統 | ||
1.一種調研數據標準化方法,其特征在于,包括:
標準庫建立步驟,根據行業、調研方向及調查方法,劃分市場調研的研究領域,并制定各研究領域的調研標準指標及指標標準選項,形成標準庫;其中,在形成標準庫之前完成調研標準指標分類;所述調研標準指標分類具體為,按照執行指標、身份指標、價值指標和其他指標進行分類;所述其他指標包括無法標準化的調研問題;所述價值指標包括調研內容部分和調研方向部分;所述指標標準選項為多個含義固定的數字;
獲取步驟,獲取調研數據及調研數據描述,其中,調研數據包括調研問題及問題選項;
建立映射步驟,根據調研數據描述確定對應的研究領域,根據調研問題與該研究領域對應的調研標準指標建立第一映射關系,根據問題選項與對應的指標標準選項建立第二映射關系;
標準化處理步驟,根據第一映射關系將調研問題轉化為標準指標,根據第二映射關系將問題選項轉化為標準選項;
存儲步驟,將轉化為標準指標及標準選項后的調研數據進行存儲。
2.根據權利要求1所述的調研數據標準化方法,其特征在于,還包括:
調研參數項制定步驟,根據各研究領域所屬的行業標準,制定各研究領域的調研參數項及各調研參數項的權重,并存入調研推薦庫中;
調研參數項推薦步驟,根據待調研項目所屬的研究領域,從調研推薦庫中匹配出對應的調研參數項及每項調研參數項的權重;
行業信息分析步驟,按照預設的頻率從預設渠道獲取行業信息,并對獲取的行業信息進行關鍵詞提取,關鍵詞包括主題及類型,再根據關鍵詞判斷是否有涉及行業標準更新的信息,若有則轉到調研參數分析步驟;
調研參數分析步驟,判斷行業標準更新的信息為頒布稿還是征求稿,若是征求稿,則從調研推薦庫中匹配出與該主題對應的調研參數項,并根據征求稿的內容對該調研參數項的權重值進行調整并標記;若是頒布稿,則從調研推薦庫中匹配出與該主題對應的調研參數項,并判斷是否有對應的征求稿修改標記,若有則根據頒布稿的內容按照第一預設規則對其進行權重修改并標記,若無則根據頒布稿的內容按照第二預設規則對其進行權重修改并標記。
3.根據權利要求2所述的調研數據標準化方法,其特征在于:行業信息分析步驟中,對獲取的信息進行關鍵詞提取時,還判斷是否有行業通知公告,若有則轉到通知分析步驟;
通知分析步驟,通過語義分析分析通知的性質,若語義分析的結果為處理,則用預設的模型分析處理程度并得到處理權重值,并在匹配出該主題對應的調研參數項后,用處理權重值對該調研參數項的權重進行相應調整。
4.根據權利要求3所述的調研數據標準化方法,其特征在于:通知分析步驟中,若語義分析的結果為號召,則分析最近預設時間段內該行業同樣主題的號召的次數是否達到預設值,若達到,則匹配出該主題對應的調研參數項后,用預設的號召權重值調整該調研參數項的權重。
5.根據權利要求4所述的調研數據標準化方法,其特征在于:通知分析步驟中,用預設的號召權重值調整該調研參數項的權重時,還將該行業對應主題的號召統計次數清零。
6.一種調研數據標準化系統,其特征在于:應用于權利要求1—5任一項所述的調研數據標準化方法,包括錄入單元、處理單元和存儲單元;
錄入單元用于錄入調研數據以及調研數據描述,調研數據包括調研問題及問題選項;存儲單元內存儲有標準庫,標準庫內存儲有各研究領域的各調研標準指標及指標標準選項;
處理單元用于根據調研數據描述確定對應的研究領域,根據調研問題與該研究領域下對應的調研標準指標建立第一映射關系,根據問題選項與對應指標標準選項建立第二映射關系;處理單元還用于根據第一映射關系將調研問題轉化為標準指標,根據第二映射關系將問題選項轉化為標準選項;存儲單元還用于存儲轉化為標準指標及標準選項后的調研數據。
7.根據權利要求6所述的調研數據標準化系統,其特征在于:存儲單元內還存儲有調研推薦庫,調研推薦庫中存儲有各研究領域的調研參數項及各調研參數項的權重;還包括爬取單元、分析單元、審核單元和權重處理單元;
爬取單元用于按照預設的頻率從預設的渠道獲取行業信息;分析單元用于對獲取的行業信息進行關鍵詞提取,提取的關鍵詞包括主題及類型,并判斷關鍵詞中是否有涉及行業標準更新的信息或關于通知的信息,若有涉及行業標準更新的信息則將對應的行業信息發送給審核單元,若有關于通知的信息則將該信息及對應的關鍵詞發送給權重處理單元;
審核單元用于接收到行業標準更新的信息后進行顯示,還用于輸入對調研參數項權重的修改值及修改原因,審核單元還用于根據輸入的修改值對對應的調研參數項進行修改,并根據修改原因對對應的調研參數項進行標記;權重處理單元用于接收到行業通知的關鍵詞后,用語義分析的方式分析該通知是否屬于號召或處理;若屬于號召,則權重處理單元按照發布時間及發布行業進行存儲,并判斷該行業最近預設時間段內同樣主題的號召的次數是否達到預設值,若達到,則權重處理單元匹配出該主題對應的調研參數項后,用預設的號召權重值調整該調研參數項的權重,并將該行業對應主題的號召統計次數清零;若屬于處理,則權重處理單元結合信息用預設的模型分析處理的程度得到處理權重值,并在匹配出該主題對應的調研參數項后,用處理權重值對該調研參數項的權重進行調整。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于立信(重慶)數據科技股份有限公司,未經立信(重慶)數據科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110678640.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





