[發明專利]用于創建預測模型的方法在審
| 申請號: | 202010040634.5 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111489794A | 公開(公告)日: | 2020-08-04 |
| 發明(設計)人: | 勝木孝行 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G16C20/70;G16C60/00 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 劉都;于靜 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 創建 預測 模型 方法 | ||
提供了一種用于創建預測模型的方法,該預測模型從作為描述化合物的特征向量的序列數據中預測化合物的化學性質。序列數據包括多個數據序列。該方法包括:生成用于預測目標變量y并使用貝葉斯準則和變分近似來學習的概率預測模型y*。該方法包括將模型配置為(i)為從序列數據中提取的特征向量中的每一個特征向量分配多個預測函數中的一個預測函數,(ii)識別第i個數據中的第t個向量與目標變量y之間的關系,以及(iii)識別特征向量和目標變量y之間的關系的相似性。該方法包括使用模型來識別序列長度,序列長度在多個數據序列之間是可變的。該方法包括基于模型預測目標變量y,作為化合物的化學性質。
技術領域
本發明一般涉及預測建模,并且更具體地涉及用于確定是否應將多個輸入序列中的每個輸入序列中的數據的特征向量添加到該序列中的其它數據的特征向量的預測模型。
背景技術
通過化合物材料的混合過程(簡寫為“反應工藝”或“工藝”)來預測化合物材料的化學性質(例如,但不限于玻璃化轉變溫度、粘度等)是各種化學以及其它工業的重要任務。工藝(化學混合過程)是成分的量的序列。構建模型以預測化合物材料的化學性質。
然而,存在的問題在于,必須通過使用輸入與對應的輸出的對來學習可以具有以下輸入和輸出關系的對應的預測模型,其中,輸入包括序列數據(T個V維向量集),輸出包括來自序列數據(即,標量,例如化學性質)的目標變量的預測模型,并進行了假設,諸如序列中的所有向量對于預測都很重要但其通常是冗長和含糊的。進一步的假設可以包括:(1)第i個數據中的第t個向量與目標變量之間的關系和第I’個數據中的第t個向量與目標變量之間的關系可能不同;(2)第i個數據中的第t個向量與目標變量之間的關系和第I’個數據中的第t’個向量與目標變量之間的關系可能相同;(3)每個序列的長度不同;(4)第t個向量和第t+1個向量可能具有對目標函數的相似的關系;(5)獲得來自預測模型的關于每個數據的第t個向量的作用的知識的要求;以及(6)在許多現實世界中的問題中,具有標簽的訓練數據的數量是有限的(例如,某一類別中現有材料的數量不是很大)。例如,我們要基于成分的性質(例如基礎成分或附加成分)對成分進行分類,以分配不同的預測函數,該預測函數對于每個第i個數據是不同的。每個第i個數據的序列的長度是不同的。對于領域專家而言處理它們可能是不重要的,但對于數據分析人員而言卻并非如此,或者在一些情況下,我們只能獲得特征向量或代碼而沒有諸如原始化學式的信息。
在序列數據分析中,需要針對每個數據樣本適當地總結序列的冗余部分,但是還不存在考慮到這一點的已建立的用于從序列數據中提取特征向量的通用方法。
因此,需要一種預測模型,該預測模型可以確定是否應將多個輸入數據序列中的每個輸入數據序列中的數據的特征向量添加到多個輸入數據序列中的其它輸入數據序列中的特征向量。
發明內容
根據本發明的一個方面,提供了一種計算機實現的方法,用于創建預測模型,該預測模型從作為描述化合物的一組特征向量的序列數據中預測化合物的化學性質。序列數據包括多個數據序列。該方法包括由硬件處理器生成用于預測目標變量y并使用貝葉斯準則和變分近似來學習的概率預測模型y*。該方法進一步包括由硬件處理器將概率預測模型y*配置為(i)為從序列數據中提取的特征向量中的每一個特征向量分配多個預測函數中的一個預測函數,(ii)識別第i個數據中的第t個向量與目標變量y之間的關系,以及(iii)識別特征向量和目標變量y之間的關系的相似性。該方法還包括由硬件處理器使用概率預測模型y*來識別序列長度,序列長度在多個數據序列之間是可變的。該方法進一步包括由硬件處理器基于概率預測模型y*來預測目標變量y,作為化合物的化學性質。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010040634.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:供暖系統
- 下一篇:一種板式滑層支座及其施工方法





