[發(fā)明專利]用于復(fù)雜系統(tǒng)生命周期管理的預(yù)測查詢處理在審
| 申請?zhí)枺?/td> | 201910103225.2 | 申請日: | 2019-02-01 |
| 公開(公告)號: | CN110309502A | 公開(公告)日: | 2019-10-08 |
| 發(fā)明(設(shè)計(jì))人: | R·B·桑托索;J·J·帕特爾;K·P·蔡 | 申請(專利權(quán))人: | 波音公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/33;G06N20/00 |
| 代理公司: | 北京紀(jì)凱知識產(chǎn)權(quán)代理有限公司 11245 | 代理人: | 徐東升;孫尚白 |
| 地址: | 美國伊*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 電子文檔 復(fù)雜系統(tǒng) 生命周期管理 數(shù)據(jù)儲存庫 查詢處理 合成 機(jī)器學(xué)習(xí)模型 自然語言文本 自然語言文檔 預(yù)定義模式 過濾規(guī)則 匹配規(guī)則 使用數(shù)據(jù) 術(shù)語生成 字典結(jié)構(gòu) 預(yù)定義 預(yù)測 文檔 移除 申請 | ||
本申請涉及用于復(fù)雜系統(tǒng)生命周期管理的預(yù)測查詢處理。公開用于識別數(shù)據(jù)儲存庫內(nèi)的相關(guān)的自然語言文檔的技術(shù)。接收指定描述復(fù)雜系統(tǒng)的問題的自然語言文本的電子文檔。從電子文檔中移除一個(gè)或多個(gè)部分,其中這些部分被確定以滿足一個(gè)或多個(gè)預(yù)定義過濾規(guī)則。使用數(shù)據(jù)字典結(jié)構(gòu)確定第一組術(shù)語,并且確定第二組術(shù)語,其中第二組術(shù)語中的至少一個(gè)術(shù)語滿足至少一個(gè)預(yù)定義模式匹配規(guī)則。通過處理作為到被訓(xùn)練以識別電子文檔內(nèi)的相關(guān)術(shù)語的機(jī)器學(xué)習(xí)模型的輸入的電子文檔來確定第三組術(shù)語。從第一組術(shù)語、第二組術(shù)語和第三組術(shù)語生成合成的電子文檔,并且合成的電子文檔用于識別數(shù)據(jù)儲存庫內(nèi)的一組相關(guān)文檔。
技術(shù)領(lǐng)域
本公開涉及電子文檔檢索,并且更具體地,涉及用于確定與描述復(fù)雜系統(tǒng)的問題的所接收的自然語言文檔相關(guān)的一組歷史自然語言文檔的技術(shù)。
背景技術(shù)
復(fù)雜的機(jī)械(諸如商用飛行器)偶爾會遇到設(shè)備故障。一些商用飛行器和其他復(fù)雜機(jī)械可以將故障數(shù)據(jù)傳輸?shù)揭粋€(gè)或多個(gè)計(jì)算機(jī)系統(tǒng),諸如維護(hù)中心使用的計(jì)算機(jī)系統(tǒng)和飛行器制造商操作的計(jì)算機(jī)系統(tǒng)。在許多情況下,復(fù)雜系統(tǒng)的問題記錄在自然語言數(shù)據(jù)中,例如由正在努力解決該問題的工程師編寫。通常,通過數(shù)據(jù)挖掘可以收集關(guān)于復(fù)雜系統(tǒng)的故障及其對應(yīng)的解決方案的信息。數(shù)據(jù)挖掘廣泛地尋求揭示數(shù)據(jù)中的模式和趨勢,并且大多數(shù)數(shù)據(jù)挖掘技術(shù)是用于分析高度格式化數(shù)據(jù)(諸如數(shù)值數(shù)據(jù)或具有相對較少的固定數(shù)量的可能值的數(shù)據(jù))之間的關(guān)系的復(fù)雜方法。然而,大量的信息由文本表達(dá)的信息組成,該本文表達(dá)的信息包括許多數(shù)據(jù)庫字段、報(bào)告、備忘錄、電子郵件、網(wǎng)站以及管理人員、市場分析師和研究人員感興趣的外部新聞文章。隨著文本表達(dá)的信息量持續(xù)快速增長,針對復(fù)雜系統(tǒng)的問題的給定的自然語言報(bào)告,識別一組相關(guān)信息的技術(shù)故障變得越來越困難。
文本挖掘是自由或半結(jié)構(gòu)化文本領(lǐng)域中數(shù)據(jù)挖掘的一般概念的擴(kuò)展。與數(shù)據(jù)挖掘相比,文本數(shù)據(jù)分析(也稱為“文本挖掘”或簡稱“文本分析”)是指文本的分析,并且可能涉及文本概括、信息可視化、文檔分類、文檔聚類、文檔匯總和文檔交叉引用等功能。因此,文本數(shù)據(jù)分析可以幫助知識工作者找到單個(gè)非結(jié)構(gòu)化或半結(jié)構(gòu)化文本文檔與跨此類文檔的大集合的語義模式之間的關(guān)系。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)實(shí)施例,一種方法包括從請求裝置接收指定描述復(fù)雜系統(tǒng)的問題的自然語言文本的電子文檔。該方法還包括通過以下操作來合成電子文檔以創(chuàng)建合成的電子文檔:移除被確定為滿足一個(gè)或多個(gè)預(yù)定義過濾規(guī)則的電子文檔的一個(gè)或多個(gè)部分;使用數(shù)據(jù)字典結(jié)構(gòu)識別對應(yīng)于電子文檔的第一組術(shù)語以包括在合成的電子文檔中;以及識別對應(yīng)于電子文檔的第二組術(shù)語以包括在合成的電子文檔中,其中對應(yīng)于電子文檔的第二組術(shù)語中的至少一個(gè)術(shù)語滿足至少一個(gè)預(yù)定義模式匹配規(guī)則。該方法包括識別數(shù)據(jù)儲存庫內(nèi)的與合成的電子文檔相關(guān)的第一組電子文檔。此外,該方法包括將第一組電子文檔的至少一部分返回到請求裝置。
在一個(gè)方面,結(jié)合以上任何示例,該方法進(jìn)一步包括向第一組術(shù)語中的至少一個(gè)術(shù)語分配權(quán)重,權(quán)重指示術(shù)語相對于第一組術(shù)語中的其他術(shù)語的相關(guān)性,其中至少部分地基于分配給第一組術(shù)語中的術(shù)語的權(quán)重識別數(shù)據(jù)儲存庫內(nèi)的第一組電子文檔。
在一個(gè)方面,結(jié)合以上任何示例,復(fù)雜系統(tǒng)進(jìn)一步包括飛行器,并且該方法進(jìn)一步包括識別指定電子文檔涉及的飛行器中的感興趣區(qū)域的元數(shù)據(jù),其中所分配的權(quán)重至少部分地基于感興趣區(qū)域確定。
在一個(gè)方面,結(jié)合以上任何示例,識別數(shù)據(jù)儲存庫內(nèi)的與合成的電子文檔相關(guān)的第一組電子文檔進(jìn)一步包括使用合成的電子文檔訪問用于數(shù)據(jù)儲存庫的索引以識別第一組電子文檔,其中基于對應(yīng)于存儲在數(shù)據(jù)儲存庫內(nèi)的多個(gè)電子文檔的多個(gè)合成的電子文檔生成索引。
在一個(gè)方面,結(jié)合以上任何示例,合成電子文檔以創(chuàng)建合成的電子文檔進(jìn)一步包括將對應(yīng)于電子文檔內(nèi)的第一單詞的一個(gè)或多個(gè)同義詞添加到電子文檔中,并且用對應(yīng)的詞干單詞替換電子文檔內(nèi)的第一單詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于波音公司,未經(jīng)波音公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910103225.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種復(fù)雜武器系統(tǒng)作戰(zhàn)過程的協(xié)同仿真方法及系統(tǒng)
- 一種基于Petri網(wǎng)的復(fù)雜機(jī)電系統(tǒng)可靠性建模方法
- 一種基于特征的復(fù)雜機(jī)電系統(tǒng)故障預(yù)報(bào)方法
- 復(fù)雜斷裂系統(tǒng)組合方法
- 基于計(jì)算機(jī)軟件系統(tǒng)實(shí)現(xiàn)疾病復(fù)雜程度量化評價(jià)的系統(tǒng)
- 一種多約束條件下的復(fù)雜系統(tǒng)資源優(yōu)化調(diào)度方法及系統(tǒng)
- 一種支持映射升維的復(fù)雜系統(tǒng)自適應(yīng)方法及系統(tǒng)
- 復(fù)雜鑄件的澆注系統(tǒng)
- 一種大型復(fù)雜系統(tǒng)限幅閾值可變?nèi)嵝钥刂品椒?/a>
- 復(fù)雜煙氣處理系統(tǒng)
- 產(chǎn)品生命周期管理系統(tǒng)及其方法
- 基于JMX的網(wǎng)管系統(tǒng)中服務(wù)生命周期管理監(jiān)控方法
- 基于數(shù)據(jù)生命周期管理模板的數(shù)據(jù)管理
- 一種生命周期管理方法及裝置
- 一種網(wǎng)絡(luò)服務(wù)的生命周期管理方法及設(shè)備
- 服務(wù)資源許可管理方法和相關(guān)設(shè)備
- 一種生命周期管理方法及裝置
- 節(jié)點(diǎn)管理方法、裝置、設(shè)備、存儲介質(zhì)和系統(tǒng)
- 基于區(qū)塊鏈的疫苗全生命周期管理方法及系統(tǒng)
- 用于管理產(chǎn)品生命周期的方法、裝置及計(jì)算機(jī)可讀介質(zhì)
- 管理本機(jī)應(yīng)用程序數(shù)據(jù)的系統(tǒng)和方法
- 窗口管理設(shè)施同步儲存庫提供器
- 全局集成和多語言數(shù)據(jù)庫系統(tǒng)
- 在安全數(shù)據(jù)系統(tǒng)和外部數(shù)據(jù)系統(tǒng)之間上傳和下載數(shù)據(jù)
- 有效的數(shù)據(jù)操縱支持
- 用于數(shù)據(jù)項(xiàng)轉(zhuǎn)換的方法和計(jì)算機(jī)可讀介質(zhì)
- 大規(guī)模數(shù)據(jù)儲存庫中的數(shù)據(jù)管理系統(tǒng)
- 數(shù)據(jù)復(fù)制系統(tǒng)
- 獲得關(guān)于電信網(wǎng)絡(luò)中的訂戶的用戶訂閱數(shù)據(jù)的方法
- 流式數(shù)據(jù)的多高速緩存處理





