[發明專利]一種多語言時間抽取方法、裝置、計算機裝置及計算機可讀存儲介質在審
| 申請號: | 202011204304.1 | 申請日: | 2020-11-02 |
| 公開(公告)號: | CN112287681A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 王志超;左凌峰;赫中翮;李敬;鄒媚;舒露 | 申請(專利權)人: | 湖南星漢數智科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/263;G06F40/103;G06F16/387 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410000 湖南省長沙市長沙高新*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語言 時間 抽取 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種多語言時間抽取方法,其特征在于,所述多語言時間抽取方法包括:
接收文本,獲取基準時間;
根據預先設置的正則關系對所述文本進行遍歷,得到時間字符片段;
在所述時間字符片段的數量大于1的情況下,獲取每一時間字符片段在所述文本的起始下標及結束下標;
根據所述每一時間字符片段在所述文本的起始下標及結束下標,判斷是否存在第一時間字符片段被第二時間字符片段所包含;在存在所述第二時間字符的情況下,從所述時間字符移除所述第一時間字符片段,得到剩余的時間字符片段;
根據所述基準時間,將所述剩余的時間字符片段調整為標準時間信息。
2.根據權利要求1所述的多語言時間抽取方法,其特征在于,所述根據所述基準時間,將所述剩余的時間字符片段調整為標準時間信息,包括以下過程:
判斷所述剩余的時間字符片段是否滿足預設標準時間格式,在所述剩余的時間字符片段不滿足所述預設標準時間格式的情況下,識別所述剩余的時間字符片段的關鍵字,根據所述基準時間及所述識別的關鍵字,生成所述標準時間信息。
3.根據權利要求2所述的多語言時間抽取方法,其特征在于,所述識別所述剩余的時間字符片段的關鍵字,根據所述基準時間及所述識別的關鍵字,生成所述標準時間信息,包括以下過程:
根據預先設置的轉換關系,將所述識別的關鍵字映射成對應的日期數,對所述基準時間增加或減少所述日期數,生成所述標準時間信息。
4.根據權利要求1所述的多語言時間抽取方法,其特征在于,所述將所述文本遍歷預先設置的正則關系進行匹配,得到時間字符片段之前,所述多語言時間抽取方法,還包括以下過程:
分別根據中文文本規則、英文文本規則及西班牙文本規則設置所述正則關系,所述正則關系包括精準類正則關系、世紀年代類正則關系、時間偏移類正則關系,所述精準類正則關系用于匹配包含年、月、日關鍵字的時間字符片段,所述世紀年代類正則關系用于匹配包含世紀、年代關鍵字的時間字符片段,所述時間偏移類正則關系用于匹配隱含時間信息的關鍵詞、和/或日期單位關鍵詞的時間字符片段。
5.根據權利要求1所述的多語言時間抽取方法,其特征在于,所述根據所述基準時間,將所述剩余的時間字符片段調整為標準時間信息之后,所述多語言時間抽取方法還包括以下步驟:
將所述標準時間信息轉換為毫秒數,并將所述毫秒數、所述毫秒數對應的時間字符片段、正則關系進行關聯存儲。
6.一種多語言時間抽取裝置,其特征在于,所述多語言時間抽取裝置包括:
接收模塊,用于接收文本,獲取基準時間;
處理模塊,用于根據預先設置的正則關系對所述文本進行遍歷,得到時間字符片段;
獲取模塊,用于在所述時間字符片段的數量大于1的情況下,獲取每一時間字符片段在所述文本的起始下標及結束下標;
判斷模塊,用于根據所述每一時間字符片段在所述文本的起始下標及結束下標,判斷是否存在第一時間字符片段被第二時間字符片段所包含;在存在所述第二時間字符的情況下,從所述時間字符移除所述第一時間字符片段,得到剩余的時間字符片段;
調整模塊,用于根據所述基準時間,將所述剩余的時間字符片段調整為標準時間信息。
7.根據權利要求6所述的多語言時間抽取裝置,其特征在于,所述調整模塊,用于判斷所述剩余的時間字符片段是否滿足預設標準時間格式,在所述剩余的時間字符片段不滿足所述預設標準時間格式的情況下,識別所述剩余的時間字符片段的關鍵字,根據所述基準時間及所述識別的關鍵字,生成所述標準時間信息。
8.根據權利要求7所述的多語言時間抽取裝置,其特征在于,所述判斷模塊,還用于根據預先設置的轉換關系,將所述識別的關鍵字映射成對應的日期數,對所述基準時間增加或減少所述日期數,生成所述標準時間信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南星漢數智科技有限公司,未經湖南星漢數智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011204304.1/1.html,轉載請聲明來源鉆瓜專利網。





