[發(fā)明專利]文本處理方法、裝置、系統(tǒng)及存儲介質在審
| 申請?zhí)枺?/td> | 202110416101.7 | 申請日: | 2021-04-16 |
| 公開(公告)號: | CN113111650A | 公開(公告)日: | 2021-07-13 |
| 發(fā)明(設計)人: | 林勇;蘇彧;馬可;霍嘉;殷宇 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/289;G06F40/211 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周天宇 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 處理 方法 裝置 系統(tǒng) 存儲 介質 | ||
本公開提供了一種文本處理方法,應用于金融科技以及計算機領域,該方法包括獲取需求描述文本,對需求描述文本進行詞性分析,確定需求描述文本中每個詞的詞性,對進行詞性處理后的需求描述文本進行句法分析,確定需求描述文本的句法成分,基于經(jīng)過詞性分析和句法分析后的需求描述文本,判斷需求描述文本是否為目標描述文本,提升對需求描述文本的判別準確率。本公開還提供了一種文本處理裝置、系統(tǒng)及存儲介質。
技術領域
本公開涉及金融科技以及計算機技術領域,更具體地,涉及一種文本處理方法、裝置、系統(tǒng)及存儲介質。
背景技術
描述需求的語言可以是模型語言或者是自然語言。更多的時候,需求是用自然語言進行描述的。然而受編寫人員的語言習慣、寫作水平等因素影響,即使是描述同樣一個需求,不同的編寫人員寫出的需求可能千差萬別。這就使得往往寫出的需求質量不佳,需要付出許多額外的溝通成本去明確需求內(nèi)容。同時現(xiàn)有技術對于需求描述文本的判別準確率低。
發(fā)明內(nèi)容
有鑒于此,本公開提供了一種文本處理方法、裝置、系統(tǒng)及存儲介質。
本公開的一個方面提供了一種文本處理方法,包括:
獲取需求描述文本;
對所述需求描述文本進行詞性分析,確定所述需求描述文本中每個詞的詞性;
對進行所述詞性處理后的需求描述文本進行句法分析,確定所述需求描述文本的句法成分;
基于經(jīng)過所述詞性分析和所述句法分析后的需求描述文本,判斷所述需求描述文本是否為目標描述文本。
在本公開其中一個實施例中,所述基于經(jīng)過所述詞性分析和所述句法分析后的需求描述文本,判斷所述需求描述文本是否為目標描述文本包括:
獲取目標描述文本的句法成分;
判斷所述需求描述文本的句法成分是否包含所述目標描述文本的所有句法成分;
若所述需求描述文本的句法成分沒有包含所述目標描述文本的所有句法成分,則輸出所述需求描述文本不是目標描述文本的提示信息。
在本公開其中一個實施例中,所述基于經(jīng)過所述詞性分析和所述句法分析后的需求描述文本,判斷所述需求描述文本是否為目標描述文本包括:
獲取目標描述文本的禁用詞性;
判斷所述需求描述文本中是否存在詞的詞性為所述禁用詞性;
若所述需求描述文本中存在詞的詞性為所述禁用詞性,則輸出所述需求描述文本不是目標描述文本的提示信息。
在本公開其中一個實施例中,所述基于經(jīng)過所述詞性分析和所述句法分析后的需求描述文本,判斷所述需求描述文本是否為目標描述文本包括:
獲取目標描述文本的禁用句法,所述禁用句法關聯(lián)禁用詞;
判斷所述需求描述文本的所有句法成分中是否包含所述禁用句法;
若所述需求描述文本的所有句法成分中包含所述禁用句法,則獲取所述需求描述文本中使用所述禁用句法的語句,判斷所述語句是否包含所述禁用詞,若所述語句包含所述禁用詞,則輸出所述需求描述文本不是目標描述文本的提示信息。
在本公開其中一個實施例中,若所述需求描述文本的句法成分包含所述目標描述文本的所有句法成分,且,所述需求描述文本中不存在詞的詞性為所述禁用詞性,且所述需求描述文本的所有句法成分中不包含所述禁用句法,則輸出所述需求描述文本是目標描述文本的提示信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經(jīng)中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110416101.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





