[發明專利]自然語言處理方法、裝置、存儲介質及電子設備在審

申請號：	201911401196.4	申請日：	2019-12-30
公開（公告）號：	CN111209746A	公開（公告）日：	2020-05-29
發明（設計）人：	劉振宇;王志剛;王澤皓;王亞平;劉雅婷;劉芬;鄧應強	申請（專利權）人：	航天信息股份有限公司
主分類號：	G06F40/284	分類號：	G06F40/284
代理公司：	北京英創嘉友知識產權代理事務所(普通合伙) 11447	代理人：	魏嘉熹
地址：	100195 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	自然語言處理方法裝置存儲介質電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本公開涉及一種自然語言處理方法、裝置、存儲介質及電子設備，所述方法包括：接收待分析文本數據和分析指令，分析指令用于指示對待分析文本數據進行的分析模式和分析結果格式；若分析模式指示對待分析文本數據進行句法依存分析，則對待分析文本數據進行分詞處理，獲得分詞數據；根據分詞數據對待分析文本數據進行詞性標注，獲得分詞詞性數據；對分詞詞性數據中的名詞詞性的分詞詞語進行實體識別，獲得實體識別數據；根據分詞詞性數據和實體識別數據進行句法依存分析，獲得句法依存數據；根據分析結果格式確定文本數據分析結果，輸出文本數據分析結果，文本數據分析結果包括分詞數據、分詞詞性數據、實體識別數據和句法依存數據中的一者或多者。

技術領域

本公開涉及計算機技術領域，具體地，涉及一種自然語言處理方法、裝置、存儲介質及電子設備。

背景技術

隨著計算機技術的發展，自然語言處理技術也隨之興起。如，在稅務領域、醫學領域等，均可以通過自然語言處理技術從而對該領域中的文本進行標準化處理，降低用戶的工作量。

然而，在現有技術中，該自然語言處理的不同技術通常是被單獨的在各智能平臺及自然語言處理工具中提供，這樣往往會導致各種重復性計算問題。如用戶在使用實體識別功能時需要重新進行分詞和詞性標注工作，浪費了大量的運算時間。

發明內容

本公開的目的是提供一種準確地自然語言處理方法、裝置、存儲介質和電子設備。

為了實現上述目的，根據本公開的第一方面，提供一種自然語言處理方法，包括：

接收待分析文本數據和分析指令，其中，所述分析指令用于指示對所述待分析文本數據進行的分析模式和分析結果格式；

若所述分析模式指示對所述待分析文本數據進行句法依存分析，則對所述待分析文本數據進行分詞處理，獲得分詞數據；

根據所述分詞數據對所述待分析文本數據進行詞性標注，獲得分詞詞性數據；

對所述分詞詞性數據中的名詞詞性的分詞詞語進行實體識別，獲得實體識別數據；