[發明專利]用于數據處理的方法、裝置和介質在審
| 申請號: | 201910335036.8 | 申請日: | 2019-04-24 |
| 公開(公告)號: | CN111861519A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 馮璐;崔綠葉;衛文娟;劉春辰 | 申請(專利權)人: | 日本電氣株式會社 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06N20/00 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 王茂華 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 數據處理 方法 裝置 介質 | ||
1.一種用于數據處理的方法,包括:
獲取關于多個因素的觀測樣本集合,所述觀測樣本集合中的一個觀測樣本包括所述多個因素的相應觀測值;
針對所述多個因素中的每個因素,基于所述觀測樣本集合來估計所述因素的觀測值與所述因素的估計值之間的差所服從的分布,所述估計值基于所述多個因素中的至少一個其他因素的觀測值和所述至少一個其他因素對所述因素的影響來確定;以及
至少基于估計的所述分布來確定表示所述多個因素間的因果關系的因果結構。
2.根據權利要求1所述的方法,其中所述多個因素包括目標因素,并且所述方法還包括:
基于確定的所述因果結構,從所述多個因素中確定作為所述目標因素的原因的至少一個因素;以及
通過改變所述至少一個因素的觀測值來影響所述目標因素的觀測值。
3.根據權利要求2所述的方法,還包括:
獲取關于所述多個因素的經改變的觀測樣本集合,所述經改變的觀測樣本集合中的至少一個觀測樣本包括所述至少一個因素的經改變的觀測值;以及
基于所述經改變的觀測樣本集合,優化所述因果結構。
4.根據權利要求1所述的方法,其中估計所述分布包括:
估計所述至少一個其他因素對所述因素的所述影響;以及
基于所述影響、所述觀測樣本集合中的所述因素的觀測值和所述至少一個其他因素的觀測值來估計所述分布。
5.根據權利要求4所述的方法,其中估計所述影響包括:
使用B樣條回歸算法來估計所述影響。
6.根據權利要求4所述的方法,其中估計所述分布包括:
使用核密度估計算法來估計所述分布。
7.根據權利要求1所述的方法,其中所述分布不同于高斯分布。
8.根據權利要求1所述的方法,其中確定所述因果結構包括:
基于所述分布,生成用于確定所述因果結構的目標函數,所述目標函數不包括懲罰項;以及
通過使所述目標函數最小化來確定所述因果結構。
9.根據權利要求1所述的方法,其中所述因果結構利用有向無環圖來表示,所述有向無環圖包括與所述多個因素相對應的多個節點,并且確定所述因果結構包括:
基于所述分布,確定與所述多個因素中的多個因素對相關聯的多個因果關系得分,其中所述多個因素對中的第一因素對的因果關系得分指示所述第一因素對中的一個因素是另一因素的原因的似然度;以及
迭代地執行以下操作,直到迭代次數達到閾值數目:
通過比較所述多個因果關系得分來確定所述多個因素對中與最大似然度相關聯的第二因素對,所述第二因素對指示所述第二因素對中的第一因素是所述第二因素對中的第二因素的原因;
向所述有向無環圖添加從對應于所述第一因素的第一節點指向對應于所述第二因素的第二節點的邊緣;以及
更新所述多個因果關系得分中與所述第二因素相關聯的一個或多個因果關系得分。
10.根據權利要求9所述的方法,其中所述閾值數目基于所述多個因素對的數目來確定。
11.根據權利要求9所述的方法,還包括:
從所述多個因素中確定可能存在因果關系的兩個因素,以作為所述多個因素對之一。
12.根據權利要求9所述的方法,還包括:
使用稀疏回歸算法對所述有向無環圖中的邊緣進行優化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于日本電氣株式會社,未經日本電氣株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910335036.8/1.html,轉載請聲明來源鉆瓜專利網。





