[發明專利]一種基于元組粒度的個人大數據定價方法在審
| 申請號: | 201610875681.5 | 申請日: | 2016-10-07 |
| 公開(公告)號: | CN107918875A | 公開(公告)日: | 2018-04-17 |
| 發明(設計)人: | 郭兵;沈艷;申云成;曹亞波;段旭良;張洪;董祥千;黃義純;王丹;張鵬博 | 申請(專利權)人: | 成都數銀科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 粒度 人大 數據 定價 方法 | ||
所屬技術領域
本發明涉及大數據技術領域,尤其是涉及一種基于元組粒度的個人大數據定價方法。
背景技術
隨著大數據的巨大價值被重新認識以及計算機存儲成本的下降,對個人信息的收集數量達到前所未有的水平。這些數據的經濟價值恰好驗證了了許多互聯網公司從搜索引擎、社會媒體網站以及銷售這些信息等方面所取得的成功。但是,由于隱私等相關問題,大量潛在的有用私有數據不能被利益相關者所訪問。
無論是對于數據擁有者還是企圖分析它的機構來說,個人大數據本身具有很大的價值。通常,個人大數據是指涉及個人隱私的特征行為數據,是個人生活活動或工作中產生的、個人可以擁有或控制的數據。個人大數據具有快速的數據流轉、多樣的數據類型、復雜的數據來源等特點,主要包括個人基礎信息以及個人收支、財產、朋友圈、健康、教育、觀點以及個人感知數據等信息。雖然個人大數據本身蘊藏著巨大的商業價值,但往往被個人所忽略。數字技術的使用本應該使個人成為商業、經濟系統中服務和商品的參與提供者和共同創造者。然而,目前的數據產品、定價和交易機制幾乎完全繞開個人用戶。
基于此,本發明提出了一種基于元組粒度的個人大數據定價方法。通過對影響數據價值的數據屬性進行調查,然后分析了信息熵、價值權重、數據引用指數、數據成本等因素對數據元組價值的影響,推導出一個數據元組價值計算方法,該方法可根據參數動態調整,隨著數據規模的增加、數據成本的降低以及數據質量的提高。從而使得個人、數據交易平臺和數據需求方都能從數據交易中受益,實現一個互惠共贏、數據普惠的數據交易生態系統。
發明內容
本發明旨在提出一種基于元組粒度的個人大數據定價方法。
本發明解決其技術難題所采用的技術方案如下:
1)度量個人大數據數據元組價格的特征量:本發明根據數據包的整體價格,利用數據的信息熵、引用指數、價值權重三個特征量來反向推出數據包每個數據元組的價格:
●信息熵:信息熵是一個與事物發生的可能性相關的屬性,它是概率分布的非負函數,刻畫了信息的不確定性;信息的不確定性越大,信息的熵越大;
●數據引用指數:數據引用指數是指某個用戶的數據元組至少有r條被購買r次,把這個最大值稱作用戶的數據引用指數;數據引用指數越大,用戶的數據元組價值越大;
●價值權重:價值權重是一個體現數據元組價值的屬性;價值權重越大,數據元組的價值越大;
2)獲取每一個數據元組的信息熵qi:假設數據包有n條數據元組,每條數據元組有k個屬性,則第i條數據元組的第j個數據項出現的概率為:
數據包第i條數據元組的熵為:
其中,xij表示第i條數據元組的第j個數據項出現的次數;
3)獲取每一個用戶的數據引用指數:根據步驟1)中定義可知,每個用戶的數據引用指數可以從數據包中直接得出;
4)獲取每一個數據元組的價值權重w:每一個數據元組的價值權重w由確定,且滿足約束條件:
其中,第i條數據元組的價值權重為wi,憑經驗設置,數據包所有元組的價值權重之和為w;
5)獲取每一個數據元組的價格:
,i=1...n,j=1...m
其中,pi表示第i條數據元組的價格,Ps表示數據包的供給價格,等于wi表示第i條數據元組的價值權重,w表示數據包中所有數據元組的價值權重之和,等于qi表示第i條數據元組的信息熵,q表示數據包中所有數據元組的信息熵之和,等于rj表示第j條數據元組所屬用戶的數據引用指數,r表示數據包中所有用戶的數據引用指數值之和,等于α為價值權重因子、β為信息熵因子、γ為數據引用指數因子,它們是手動設置的且和為1。
附圖說明
圖1影響因子和價格比較圖
圖2平均定價與本文定價比較
具體實施方式
根據上述對個人大數據數據元組價格的特征量的描述和獲取,本發明通過一個具體實例驗證定價該方法的正確性和有效性,步驟如下:
1)假設交易平臺有一個數據包,其包含10條數據元組,每條數據元組有5個數據項。假定收集、分析和共享此數據包的成本是20元,此數據包的需求價格是60元,這個數據包的具體情況如表1所示;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都數銀科技有限公司,未經成都數銀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610875681.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





