[發(fā)明專利]一種從文本中提取農(nóng)歷時間的方法及裝置在審
| 申請?zhí)枺?/td> | 201410270720.X | 申請日: | 2014-06-17 |
| 公開(公告)號: | CN105183704A | 公開(公告)日: | 2015-12-23 |
| 發(fā)明(設(shè)計)人: | 傅尚斌 | 申請(專利權(quán))人: | 中興通訊股份有限公司 |
| 主分類號: | G06F17/21 | 分類號: | G06F17/21;G06F17/30 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 李睿;姚開麗 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 提取 農(nóng)歷 時間 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及終端領(lǐng)域中的數(shù)據(jù)處理技術(shù),尤其涉及一種從文本中提取農(nóng)歷時間的方法及裝置。
背景技術(shù)
在自然語言的發(fā)展歷程中,人們走過一條從規(guī)則到統(tǒng)計的認(rèn)識過程。在特定場景下,利用統(tǒng)計的方式,可以歸納出描述時間的種種方式,比如:描述具體日期的有XXXX年XX月XX日、幾月幾號;描述星期的有星期三、下周一等等。
在描述時間的過程中,農(nóng)歷與陽歷存在一定的區(qū)別,例如:在描述日期時,從一號到十號,農(nóng)歷的表達方式是在數(shù)字前面加上“初”字,所以當(dāng)出現(xiàn)幾月初幾的時候即可確定是用農(nóng)歷描述的;從十一號開始,農(nóng)歷與陽歷的描述方式又是相同的,這需要用戶根據(jù)生活環(huán)境及表達習(xí)慣等其他知識來判別。
目前,隨著科學(xué)技術(shù)的發(fā)展,手機、平板電腦等便攜式智能終端設(shè)備的普及率越來越高,短信、email等通訊軟件在人們?nèi)粘I钪邪l(fā)揮的作用也越來越大。在實際應(yīng)用中,將會議及日常事務(wù)的行程安排等通過短信、email等方式傳遞給終端設(shè)備,在終端設(shè)備接收到信息后,若能自動地提取信息中與日程相關(guān)的農(nóng)歷時間信息,將更加方便人們的生活。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例期望提供一種從文本中提取農(nóng)歷時間的方法及裝置,能夠自動地將農(nóng)歷時間從文本中提取出來,方便用戶進行日程管理。
為達到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明實施例提供一種從文本中提取農(nóng)歷時間的方法,所述方法包括:
根據(jù)農(nóng)歷時間的模型文件,提取文本中的農(nóng)歷時間成分;將所述農(nóng)歷時間成分轉(zhuǎn)換成農(nóng)歷時間值。
較佳的,該方法還包括:生成農(nóng)歷時間的模型文件,具體為:統(tǒng)計農(nóng)歷時間的表達規(guī)則;根據(jù)所述規(guī)則生成農(nóng)歷時間的正則表達式;將所述正則表達式封裝成農(nóng)歷時間的模型文件。
較佳的,所述生成農(nóng)歷時間的正則表達式,包括:將表示農(nóng)歷時間的確切時間設(shè)置于表示農(nóng)歷時間的相對時間之前。
較佳的,所述根據(jù)農(nóng)歷時間的模型文件,提取文本中的農(nóng)歷時間成分,包括:將文本中的內(nèi)容與所述模型文件中的正則表達式進行遍歷匹配;對匹配得到的農(nóng)歷時間成分進行提取。
較佳的,所述方法還包括:構(gòu)建時間對象;所述將農(nóng)歷時間成分轉(zhuǎn)換成農(nóng)歷時間值,包括:將所述提取的農(nóng)歷時間成分賦給所述時間對象的控制字段,獲取農(nóng)歷時間值;所述時間對象的控制字段,依次包括:年、月、日、時、分、秒。
較佳的,所述方法還包括:當(dāng)所述農(nóng)歷時間成分中含有相對時間時,對獲取的農(nóng)歷時間值進行相對時間計算。
本發(fā)明實施例還提供一種從文本中提取農(nóng)歷時間的裝置,所述裝置包括:提取模塊、以及轉(zhuǎn)換模塊;其中,所述提取模塊,用于根據(jù)農(nóng)歷時間的模型文件,提取文本中的農(nóng)歷時間成分;所述轉(zhuǎn)換模塊,用于將所述農(nóng)歷時間成分轉(zhuǎn)換成農(nóng)歷時間值。
較佳的,所述裝置還包括生成模塊,所述生成模塊,用于生成農(nóng)歷時間的模型文件,具體為:統(tǒng)計農(nóng)歷時間的表達規(guī)則,根據(jù)所述規(guī)則生成農(nóng)歷時間的正則表達式,將所述正則表達式封裝成農(nóng)歷時間的模型文件。
較佳的,所述生成模塊,具體用于將表示農(nóng)歷時間的確切時間設(shè)置于表示農(nóng)歷時間的相對時間之前。
較佳的,所述提取模塊,具體用于將文本中的內(nèi)容與所述模型文件中的正則表達式進行遍歷匹配;對匹配得到的農(nóng)歷時間成分進行提取。
較佳的,所述裝置還包括構(gòu)建模塊,所述構(gòu)建模塊,用于構(gòu)建時間對象;所述轉(zhuǎn)換模塊,具體用于將所述提取的農(nóng)歷時間成分賦給所述時間對象的控制字段,獲取農(nóng)歷時間值。
較佳的,所述轉(zhuǎn)換模塊,還用于當(dāng)所述農(nóng)歷時間成分中含有相對時間時,對獲取的農(nóng)歷時間值進行相對時間計算。
本發(fā)明實施例提供的從文本中提取農(nóng)歷時間的方法及裝置,根據(jù)農(nóng)歷時間的模型文件,提取文本中的農(nóng)歷時間成分;將所述農(nóng)歷時間成分轉(zhuǎn)換成農(nóng)歷時間值;如此,能夠基于農(nóng)歷時間的模型文件,自動地從文本中提取農(nóng)歷時間成分,并將所提取的農(nóng)歷時間成分轉(zhuǎn)換成具體的農(nóng)歷時間值,這樣,實現(xiàn)了農(nóng)歷時間的自動提取和轉(zhuǎn)換,能夠有效地方便用戶對生活及工作進行日程管理。
附圖說明
圖1為本發(fā)明實施例從文本中提取農(nóng)歷時間的方法實現(xiàn)流程示意圖;
圖2為本發(fā)明實施例生成農(nóng)歷時間的模型文件的實現(xiàn)流程示意圖;
圖3為本發(fā)明實施例提取及轉(zhuǎn)換農(nóng)歷時間成分的實現(xiàn)流程示意圖;
圖4為本發(fā)明實施例從文本中提取農(nóng)歷時間的裝置組成結(jié)構(gòu)示意圖。
具體實施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司,未經(jīng)中興通訊股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410270720.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





