[發明專利]自然語言時間詞的解析方法、裝置和計算機設備在審
| 申請號: | 201911045300.0 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN111027319A | 公開(公告)日: | 2020-04-17 |
| 發明(設計)人: | 查月閱;張駿 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/35 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然語言 時間 解析 方法 裝置 計算機 設備 | ||
本申請提供了一種自然語言時間詞的解析方法、裝置、計算機設備和計算機可讀存儲介質,涉及語義解析領域,其中方法包括:獲取輸入文本;去除輸入文本的預設字符得到預處理文本;分詞得到若干個時間詞;進行數據封裝得到各時間詞對應的第一時間詞;將各第一時間詞進行合并得到若干個第二時間詞;解析得到各第二時間詞對應的時間區間。本申請通過多個識別規則從輸入文本中提取相應時間詞,再根據各時間詞在輸入文本中的排列位置、識別規則間的關聯進行合并,最后將合并時間詞根據詞義解析得到對應的時間區間,從而實現對自然語言中所有時間詞的解析,有效提高對輸入文本中時間詞識別的全面性和準確率。
技術領域
本申請涉及語義解析技術領域,特別涉及一種自然語言時間詞的解析方法、裝置和計算機設備。
背景技術
在對自然語言進行解析時,時間信息是完整解析自然語言語義時不可或缺的要素。而現有對自然語言中時間信息的識別方法主要是基于固定規則的識別,將固定規則與文本進行匹配,從而提取出時間詞,比如,提取出“2018年9月10號”這樣表示日期的時間詞。這種識別方法需要構建大量的規則,一方面過于復雜且呆板,不便于后期開發人員的理解和修改;另一方面,這種固定規則從文本中提取的時間詞不夠全面,準確率較低。
發明內容
本申請的主要目的為提供一種自然語言時間詞的解析方法、裝置和計算機設備,旨在解決現有時間詞解析方法過于呆板和準確率、完整度低的弊端。
為實現上述目的,本申請提供了一種自然語言時間詞的解析方法,包括:
獲取輸入文本;
去除所述輸入文本中的預設字符,得到預處理文本;
根據第一預設規則對所述預處理文本進行分詞,得到若干個時間詞;
將各所述時間詞進行數據封裝,得到各所述時間詞分別對應的第一時間詞;
將各所述第一時間詞按照第二預設規則進行合并,得到若干個第二時間詞;
分別解析各所述第二時間詞,得到各所述第二時間詞各自對應的時間區間。
進一步的,所述根據第一預設規則對所述預處理文本進行分詞,得到若干個時間詞的步驟,包括:
加載預先構建的規則庫,其中,所述規則庫由多個識別規則組成,單個所述識別規則中包含多個識別參數;
從所述預處理文本中篩選得到與各所述識別規則的識別參數分別對應的若干個所述時間詞。
進一步的,所述第一時間詞攜帶時間詞屬性,所述時間詞屬性包括所述第一時間詞對應的所述識別規則和所述第一時間詞在所述輸入文本中的排列位置,所述將各所述第一時間詞按照第二預設規則進行合并,得到若干個第二時間詞的步驟,包括:
根據所述排列位置的順序性,依次篩選所述排列位置具有連續性的若干個所述第一時間詞進行合并,得到第一合并時間詞,并將所述排列位置不具有連續性的若干個所述第一時間詞標記為待合并時間詞;
按照所述排列位置的順序性,分別將所述排列位置在預設范圍內的各個所述待合并時間詞歸類為同一集合,得到至少一個第一時間詞集合;
在同一所述第一時間詞集合中,篩選具有關聯關系的所述識別規則分別對應的各個所述待合并時間詞進行二次合并,得到第二合并時間詞;
將所述第一合并時間詞和所述第二合并時間詞作所述第二時間詞。
進一步的,所述排列位置包括起始位置和結束位置,所述根據所述排列位置的順序性,依次篩選所述排列位置具有連續性的若干個所述第一時間詞進行合并,得到第一合并時間詞的步驟,包括:
判斷一個所述第一時間詞的結束位置是否與另一個所述第一時間詞的開始位置相鄰;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911045300.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種導電顆粒組合
- 下一篇:一種防止光路被遮擋的裝置和卷煙生產線用檢測模塊





