[發(fā)明專利]結(jié)構(gòu)化數(shù)據(jù)提取裝置、方法及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201811196902.1 | 申請(qǐng)日: | 2018-10-15 |
| 公開(公告)號(hào): | CN109299179A | 公開(公告)日: | 2019-02-01 |
| 發(fā)明(設(shè)計(jì))人: | 許娟;劉超;劉寧 | 申請(qǐng)(專利權(quán))人: | 西門子醫(yī)療系統(tǒng)有限公司 |
| 主分類號(hào): | G06F16/25 | 分類號(hào): | G06F16/25;G06F16/22 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201318 上海市浦東*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本特征表示 訓(xùn)練文本 目標(biāo)信息 預(yù)估 標(biāo)注信息 存儲(chǔ)介質(zhì) 定位策略 目標(biāo)文本 復(fù)數(shù) 文本 信息提取裝置 結(jié)構(gòu)化數(shù)據(jù) 準(zhǔn)確度 語義 獲取目標(biāo) 提取裝置 信息提取 指示目標(biāo) 預(yù)設(shè) 分析 | ||
本發(fā)明提供了一種信息提取裝置、方法和存儲(chǔ)介質(zhì)。獲取復(fù)數(shù)個(gè)訓(xùn)練文本,及預(yù)設(shè)的用于指示目標(biāo)信息在其中每個(gè)訓(xùn)練文本中的位置的標(biāo)注信息;獲取所述復(fù)數(shù)個(gè)訓(xùn)練文本中每個(gè)訓(xùn)練文本對(duì)應(yīng)的第一文本特征表示信息;利用所述第一文本特征表示信息和所述標(biāo)注信息確定一定位策略。獲取目標(biāo)文本及所述目標(biāo)文本對(duì)應(yīng)的第二文本特征表示信息,利用所述定位策略確定所述目標(biāo)信息在所述第二文本特征表示信息中的位置的預(yù)估信息;根據(jù)所述預(yù)估信息從所述目標(biāo)文本中提取出所述目標(biāo)信息。技術(shù)方案利用目標(biāo)信息在訓(xùn)練文本的文本特征表示信息中的位置規(guī)律獲得定位策略,從而具有對(duì)文本的語義進(jìn)行分析從而定位其中目標(biāo)信息的能力,提高了信息提取的效率和準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,特別是一種結(jié)構(gòu)化數(shù)據(jù)提取裝置、方法及存儲(chǔ)介質(zhì)。
背景技術(shù)
非結(jié)構(gòu)化數(shù)據(jù)是指無法用統(tǒng)一的結(jié)構(gòu)表達(dá)的數(shù)據(jù),例如文檔、圖片、音視頻,等。目前,廣泛使用的數(shù)據(jù)均為非結(jié)構(gòu)化數(shù)據(jù)的形式,例如各種文檔、醫(yī)學(xué)報(bào)告、工作報(bào)告,等。結(jié)構(gòu)化數(shù)據(jù)中的每條數(shù)據(jù)都包括數(shù)據(jù)類型和相應(yīng)的數(shù)據(jù)值。與結(jié)構(gòu)化數(shù)據(jù)相比,非結(jié)構(gòu)化數(shù)據(jù)不方便采用計(jì)算機(jī)技術(shù)進(jìn)行信息提取、檢索、統(tǒng)計(jì)等操作。
中國專利申請(qǐng)CN1497473A公開了基于規(guī)則將非結(jié)構(gòu)化文本信息轉(zhuǎn)換成結(jié)構(gòu)化形式的方法和裝置,該方法包括步驟:輸入結(jié)構(gòu)化規(guī)則;獲取非結(jié)構(gòu)化文本信息;對(duì)非結(jié)構(gòu)化文本信息進(jìn)行語法分析,產(chǎn)生小的文本片段;從非結(jié)構(gòu)化文本信息的文本單元中尋找結(jié)構(gòu)化規(guī)則中定義的文本片段;按照結(jié)構(gòu)化規(guī)則中確定的條件對(duì)非結(jié)構(gòu)化文本信息的文本片段進(jìn)行結(jié)構(gòu)化。該裝置包括:用于非結(jié)構(gòu)化文本信息的輸入裝置;用于結(jié)構(gòu)化規(guī)則的輸入裝置和存儲(chǔ)裝置;用于從非結(jié)構(gòu)化文本信息中提取小文本單元的提取裝置;用于根據(jù)結(jié)構(gòu)化規(guī)則產(chǎn)生結(jié)構(gòu)化文本信息的結(jié)構(gòu)化裝置;和用于結(jié)構(gòu)化文本信息中的文本單元的處理裝置。
中國專利申請(qǐng)CN101154159A公開了一種有效和可以簡單地操作的、為醫(yī)療成像產(chǎn)生和運(yùn)行軟件應(yīng)用程序的系統(tǒng)(1),該系統(tǒng)包括至少一個(gè)框架結(jié)構(gòu)(2,22,34,45,58,69,81),該框架結(jié)構(gòu)具有一個(gè)服務(wù)層(3)以及一個(gè)作為應(yīng)用編程接口設(shè)置在該服務(wù)層之上的工具箱層(4),其中,所述工具箱層(4)和服務(wù)層(3)的功能分別被概括在多個(gè)組件中,這些組件被這樣嚴(yán)格地分級(jí)設(shè)置,使得總是僅僅可以從上級(jí)的組件出發(fā)對(duì)任意的組件進(jìn)行訪問。
中國專利申請(qǐng)CN107644671A公開了用于在評(píng)價(jià)圖像數(shù)據(jù)集時(shí)支持報(bào)告醫(yī)師的方法、圖像記錄系統(tǒng)、計(jì)算機(jī)程序和電子可讀數(shù)據(jù)載體。一種用于在利用圖像記錄系統(tǒng)(10)記錄的患者的圖像數(shù)據(jù)集的評(píng)價(jià)中支持報(bào)告醫(yī)師的方法,其中圖像數(shù)據(jù)集由至少一個(gè)預(yù)處理算法自動(dòng)地處理用于顯示給報(bào)告醫(yī)師,其中至少一個(gè)預(yù)處理算法和/或?qū)⒅辽僖粋€(gè)預(yù)處理算法參數(shù)化的至少一個(gè)預(yù)處理參數(shù)由人工智能的選擇算法根據(jù)以下而自動(dòng)地選擇:描述圖像數(shù)據(jù)集的記錄和/或記錄區(qū)域的記錄信息(1)的至少一項(xiàng),和/或關(guān)于患者的先前檢查的附加信息(3a,3b,3c,3d)的至少一項(xiàng)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提出了一種提高功率放大器效率的方法,用以提高功率放大器的效率,進(jìn)一步確保功率放大器的線性度。
各實(shí)施例提供了一種信息提取裝置,可以包括:
學(xué)習(xí)模塊,用于獲取復(fù)數(shù)個(gè)訓(xùn)練文本,及預(yù)設(shè)的用于指示目標(biāo)信息在其中每個(gè)訓(xùn)練文本中的位置的標(biāo)注信息;獲取所述復(fù)數(shù)個(gè)訓(xùn)練文本中每個(gè)訓(xùn)練文本對(duì)應(yīng)的第一文本特征表示信息;利用所述第一文本特征表示信息和所述標(biāo)注信息確定一定位策略;及
提取模塊,用于獲取目標(biāo)文本及所述目標(biāo)文本對(duì)應(yīng)的第二文本特征表示信息,利用所述定位策略確定所述目標(biāo)信息在所述第二文本特征表示信息中的位置的預(yù)估信息;根據(jù)所述預(yù)估信息從所述目標(biāo)文本中提取出所述目標(biāo)信息。
可見,各實(shí)施例的信息提取裝置利用目標(biāo)信息在訓(xùn)練文本的文本特征表示信息中的位置規(guī)律獲得定位策略,從而具有對(duì)文本的語義進(jìn)行分析從而定位其中目標(biāo)信息的能力,因此,提高了信息提取的效率和準(zhǔn)確度。
一些實(shí)施例中,學(xué)習(xí)模塊可以包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西門子醫(yī)療系統(tǒng)有限公司,未經(jīng)西門子醫(yī)療系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811196902.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 文本處理方法和系統(tǒng)
- 一種問題分類方法及系統(tǒng)
- 一種計(jì)算文本主題模型的方法及裝置
- 一種文本分類模型生成、文本分類方法及裝置
- 模型訓(xùn)練、文本處理方法、裝置以及設(shè)備
- 一種訓(xùn)練文本識(shí)別模型、文本連貫性的方法及裝置
- 文本訓(xùn)練數(shù)據(jù)處理方法、裝置及存儲(chǔ)介質(zhì)
- 地址文本識(shí)別模型的訓(xùn)練方法、地址的預(yù)測方法及裝置
- 基于幽默度的文本分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文本分類及模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 電動(dòng)車的充電后的行駛范圍預(yù)估方法、裝置及駕駛輔助裝置
- 配電變壓器的饋線最大負(fù)荷預(yù)估方法
- 組合選取方法及其系統(tǒng)
- 程序化廣告投放中品牌客戶KPI預(yù)估方法
- 一種文件預(yù)估方法和裝置
- 一種預(yù)估接單等待時(shí)長的方法及裝置
- 廣告數(shù)據(jù)處理方法及裝置
- 用于資產(chǎn)分配的價(jià)值評(píng)估方法、裝置、電子設(shè)備和介質(zhì)
- 預(yù)估結(jié)算數(shù)據(jù)的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 路線到達(dá)時(shí)間預(yù)估方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)





