[發(fā)明專利]用于關(guān)系推斷的系統(tǒng)和方法有效
| 申請?zhí)枺?/td> | 201710131683.8 | 申請日: | 2017-03-07 |
| 公開(公告)號: | CN107590168B | 公開(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計)人: | 劉朝春;杜楠;譚樹龍;費洪亮;范偉 | 申請(專利權(quán))人: | 百度(美國)有限責(zé)任公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/284;G06N3/044 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 關(guān)系 推斷 系統(tǒng) 方法 | ||
1.一種用于通過檢查關(guān)注術(shù)語的同時出現(xiàn)來訓(xùn)練模型的方法,所述方法包括:
搜索數(shù)據(jù)庫以獲得包括術(shù)語庫中所包括的術(shù)語的文檔;
在至少部分所述文檔中識別所述術(shù)語;
生成所識別的術(shù)語的特征以創(chuàng)建特征表示庫;
創(chuàng)建包括兩個或更多個術(shù)語的文檔樣本;
對于文檔樣本,使用所述特征表示庫來生成所述兩個或更多個術(shù)語的特征表示,并且識別所述術(shù)語在所述文檔樣本內(nèi)的相對順序序列;以及
使用所述特征表示和所述相對順序來訓(xùn)練遞歸神經(jīng)網(wǎng)絡(luò)RNN模型,所述遞歸神經(jīng)網(wǎng)絡(luò)模型預(yù)測與一組術(shù)語的同時出現(xiàn)相關(guān)的、所述一組術(shù)語之間的相關(guān)性因子。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述相關(guān)性因子表示所述一組術(shù)語中的術(shù)語相關(guān)的預(yù)測概率。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述RNN模型從所述特征表示庫檢索所述特征表示。
4.根據(jù)權(quán)利要求1所述的方法,其中,通過搜索半構(gòu)造的數(shù)據(jù)來接收所述文檔。
5.根據(jù)權(quán)利要求1所述的方法,還包括:在至少部分所述文檔中,當生成特征表示時使用不包括在所述術(shù)語庫中的術(shù)語。
6.根據(jù)權(quán)利要求5所述的方法,還包括:當創(chuàng)建所述特征表示庫時,不使用未包括在所述術(shù)語庫中的術(shù)語的特征表示。
7.根據(jù)權(quán)利要求1所述的方法,其中,所述生成所識別的術(shù)語的特征的步驟包括:保持所識別的術(shù)語的順序。
8.根據(jù)權(quán)利要求1所述的方法,其中,所述術(shù)語庫中的術(shù)語是預(yù)先定義的。
9.根據(jù)權(quán)利要求1所述的方法,其中,當預(yù)測所述相關(guān)性因子時,所述RNN模型考慮所識別的術(shù)語的出現(xiàn)次數(shù)。
10.一種用于使用訓(xùn)練的遞歸神經(jīng)網(wǎng)絡(luò)RNN模型來生成關(guān)注術(shù)語之間的關(guān)系信息的方法,所述方法包括:
接收輸入術(shù)語;
獲得所述輸入術(shù)語的特征表示;
將所述輸入術(shù)語的特征表示輸入到訓(xùn)練的RNN模型中,其中,已至少部分地使用訓(xùn)練數(shù)據(jù)中術(shù)語的同時出現(xiàn)衡量所述術(shù)語的相關(guān)性而訓(xùn)練所述訓(xùn)練的RNN模型,所述訓(xùn)練的RNN模型預(yù)測所述輸入術(shù)語與一組術(shù)語中的每個術(shù)語之間的相關(guān)性因子;以及
輸出具有超過閾值的相關(guān)性因子的術(shù)語。
11.根據(jù)權(quán)利要求10所述的方法,其中,所述相關(guān)性因子表示一組術(shù)語中的術(shù)語與所述輸入術(shù)語之間的相關(guān)性的預(yù)測概率。
12.根據(jù)權(quán)利要求11所述的方法,還包括:訪問術(shù)語庫以驗證所述術(shù)語庫包括所述輸入術(shù)語。
13.根據(jù)權(quán)利要求11所述的方法,其中,所述訓(xùn)練的RNN模型使用術(shù)語的相對位置信息作為上下文信息。
14.根據(jù)權(quán)利要求10所述的方法,其中,所述獲得所述輸入術(shù)語的特征表示的步驟包括:使用特征表示庫來查找所述特征表示。
15.根據(jù)權(quán)利要求11所述的方法,其中,所述訓(xùn)練的RNN模型是一類遞歸神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),包括傳統(tǒng)RNN及其高級變型,諸如長短期記憶LSTM網(wǎng)絡(luò)和門控遞歸單元GRU。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度(美國)有限責(zé)任公司,未經(jīng)百度(美國)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710131683.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





