[發(fā)明專利]獲取圖表特征信息的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 201710885003.1 | 申請日: | 2017-09-26 |
| 公開(公告)號(hào): | CN107742096A | 公開(公告)日: | 2018-02-27 |
| 發(fā)明(設(shè)計(jì))人: | 章偉星 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00 |
| 代理公司: | 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司11415 | 代理人: | 林祥 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 獲取 圖表 特征 信息 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
技術(shù)領(lǐng)域
本說明書一個(gè)或多個(gè)實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種獲取圖表特征信息的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)。
背景技術(shù)
目前,圖表(Chart)廣泛存在于各類文檔或網(wǎng)頁中,圖表往往包含一些統(tǒng)計(jì)信息,因而可以很好地向讀者傳遞和表達(dá)有價(jià)值的信息。當(dāng)今隨著大數(shù)據(jù)以及機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,出現(xiàn)了將圖表中包含的有價(jià)值信息應(yīng)用到機(jī)器學(xué)習(xí)領(lǐng)域中的需求。然而,由于現(xiàn)今的大部分圖表都是以靜態(tài)圖片的形式進(jìn)行展示的,并且計(jì)算機(jī)目前還很難直接從圖表中提取到有效的數(shù)據(jù),導(dǎo)致無法將圖表中蘊(yùn)含的有價(jià)值信息應(yīng)用到機(jī)器學(xué)習(xí)領(lǐng)域。
發(fā)明內(nèi)容
有鑒于此,本說明書一個(gè)或多個(gè)實(shí)施例提供一種獲取圖表特征信息的方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)。
為實(shí)現(xiàn)上述目的,本說明書一個(gè)或多個(gè)實(shí)施例提供的技術(shù)方案如下:
在一個(gè)方面,提供了一種獲取圖表特征信息的方法,包括:
獲得待識(shí)別圖表;
識(shí)別所述待識(shí)別圖表中的文本片段;
根據(jù)所述文本片段所處的位置,確定所述文本片段所屬的圖表角色;
根據(jù)所述文本片段的內(nèi)容以及所述文本片段所屬的圖表角色,確定所述待識(shí)別圖表的圖表特征,并生成包含各圖表特征的文本文件。
在另一個(gè)方面,提供了一種獲取圖表特征信息的裝置,包括:圖片獲得單元、文本識(shí)別單元、角色確定單元以及文件生成單元;
所述圖片獲得單元獲得待識(shí)別圖表;
所述文本識(shí)別單元識(shí)別所述待識(shí)別圖表中的文本片段;
所述角色確定單元根據(jù)所述文本片段所處的位置,確定所述文本片段所屬的圖表角色;
所述文件生成單元根據(jù)所述文本片段的內(nèi)容以及所述文本片段所屬的圖表角色,確定所述待識(shí)別圖表的圖表特征,并生成包含各圖表特征的文本文件。
在又一個(gè)方面,提供了一種電子設(shè)備,包括:
處理器;
用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
所述處理器被配置為:
獲得待識(shí)別圖表;
識(shí)別所述待識(shí)別圖表中的文本片段;
根據(jù)所述文本片段所處的位置,確定所述文本片段所屬的圖表角色;
根據(jù)所述文本片段的內(nèi)容以及所述文本片段所屬的圖表角色,確定所述待識(shí)別圖表的圖表特征,并生成包含各圖表特征的文本文件。
在又一個(gè)方面,提供了一種電子設(shè)備,一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如下步驟:
獲得待識(shí)別圖表;
識(shí)別所述待識(shí)別圖表中的文本片段;
根據(jù)所述文本片段所處的位置,確定所述文本片段所屬的圖表角色;
根據(jù)所述文本片段的內(nèi)容以及所述文本片段所屬的圖表角色,確定所述待識(shí)別圖表的圖表特征,并生成包含各圖表特征的文本文件。
通過以上技術(shù)方案可以看出,通過獲得待識(shí)別圖表,并識(shí)別圖表中的文本片段,然后確定出各個(gè)文本片段所屬的圖表角色,最終依據(jù)所述文本片段的內(nèi)容以及所述文本片段所屬的圖表角色,確定所述待識(shí)別圖表的圖表特征,并生成包含各圖表特征的文本文件。通過上述過程,可以將圖片形式展示的圖表中包含的圖表特征提取出來并生成一個(gè)包含這些圖表特征的文本文件,因?yàn)樵撐谋疚募梢员挥?jì)算機(jī)直接讀取到其內(nèi)包含的文本信息,故可以被應(yīng)用到機(jī)器學(xué)習(xí)中。
附圖說明
圖1示出了一示例性實(shí)施例提供的一種獲取圖表特征信息的方法的流程圖;
圖2A示出了一種示例的待識(shí)別圖表;
圖2B標(biāo)記了圖2A所示的待識(shí)別圖表中包含的文本片段;
圖2C示出了一種預(yù)定義的標(biāo)準(zhǔn)圖表;
圖3示出了一示例性實(shí)施例提供的一種獲取圖表特征信息的裝置的模塊圖;
圖4示出了一示例性實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)。
具體實(shí)施方式
目前,出現(xiàn)在各類文檔或網(wǎng)頁中的圖表(Chart)的類型有很多種,例如:條形圖、柱狀圖、折線圖、餅圖等。雖然人們可以通過對圖表進(jìn)行視覺解碼來獲取信息,但是計(jì)算機(jī)卻不能直接獲取到圖表中蘊(yùn)含的信息,這就導(dǎo)致了大量圖表中的有價(jià)值信息不能被應(yīng)用到機(jī)器學(xué)習(xí)領(lǐng)域中。如果沒有一種有效的方法對這些圖表進(jìn)行解碼,以提取出圖表中蘊(yùn)含的有效信息并將其存儲(chǔ),這將是一大損失。
圖1示出了一示例性實(shí)施例提供的一種獲取圖表特征信息的方法的流程圖,該方法可以應(yīng)用于各類電子設(shè)備(如服務(wù)器、用戶設(shè)備UE、終端設(shè)備等)上。如圖1所示,在一實(shí)施例中,該方法可包括如下步驟101至步驟107,其中:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710885003.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種高彈性殼體
- 下一篇:一種重心傾斜用預(yù)緊力緊固裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





