[發明專利]一種信息處理方法及裝置有效
| 申請號: | 201610912078.X | 申請日: | 2016-10-19 |
| 公開(公告)號: | CN107967250B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 許林;尚國強 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/295;G06F40/253;G10L15/26 |
| 代理公司: | 北京德崇智捷知識產權代理有限公司 11467 | 代理人: | 王斌 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 方法 裝置 | ||
本發明公開了一種信息處理方法,包括:將接收到的非文本信息識別為文本信息;對所述文本信息進行詞法分析,獲取組成所述文本信息的各分詞以及對應每一個分詞的屬性信息;根據所述各分詞以及對應每一個分詞的屬性信息,將所述各分詞劃分為能刪除分詞和不能刪除分詞;刪除所述文本信息中所包含的所述能刪除分詞,并記錄由所述文本信息中所包含的所述不能刪除分詞所組成的新文本信息與所述非文本信息之間的關系。本發明還同時公開了一種信息處理裝置。
技術領域
本發明涉及信息處理技術,尤其涉及一種信息處理方法及裝置。
背景技術
隨著通信技術的發展,越來越多的用戶喜歡采用非文本信息的方式比如語音信息進行聊天,其中常見的語音聊天方式包括微信語音、QQ語音等。相比傳統的文本短信的聊天方式,采用語音信息的聊天方式減少了用戶手動輸入文本信息的不便、彌補了傳統的文本短信難以傳遞聲音的不足。然而,采用語音信息的聊天方式也存在一個不足之處,即用戶在收到語音信息后不能直觀的閱讀和理解,而只能逐條地點擊語音信息進行語音識別,并且由于現有技術中沒有提取和檢索語音信息中所包含的關鍵信息的功能,從而給用戶在語音信息的使用上造成不便。例如,當用戶已接收到大量語音短信而此時需要查看某一條語音短信的內容時,如果用戶忘記該語音短信的大致收發時間,則只能逐條地點擊語音短信進行語音識別以獲取目標語音短信,這樣會使得查看操作過程既麻煩又費時。此外,雖然根據現有技術已能實現將語音信息轉化為文本信息,但是由于人們交流的口語中包含許多對于意思表達沒有影響的虛詞或助詞,如果將這些虛詞或助詞也轉化為文本,則會影響用戶對文本信息的閱讀。
發明內容
為解決上述技術問題,本發明實施例期望提供一種信息處理方法及裝置。
為達到上述目的,本發明的技術方案是這樣實現的:
本發明實施例提供了一種信息處理方法,所述方法包括:
將接收到的非文本信息識別為文本信息;
對所述文本信息進行詞法分析,獲取組成所述文本信息的各分詞以及對應每一個分詞的屬性信息;
根據所述各分詞以及對應每一個分詞的屬性信息,將所述各分詞劃分為能刪除分詞和不能刪除分詞;
刪除所述文本信息中所包含的所述能刪除分詞,并記錄由所述文本信息中所包含的所述不能刪除分詞所組成的新文本信息與所述非文本信息之間的關系。
上述方案中,所述方法還包括:在所述非文本信息后顯示所述新文本信息;和/或,當任意一個所述不能刪除分詞被搜索時,顯示所述新文本信息和/或所述非文本信息。
上述方案中,所述將接收到的非文本信息識別為文本信息,包括:
通過語音識別技術將接收到的語音信息轉換為文本信息;或,
通過圖像文字識別技術將接收到的圖片信息轉換為文本信息。
上述方案中,所述對所述文本信息進行詞法分析,包括:
對所述文本信息進行分詞,獲取組成所述文本信息的各分詞;
對所述各分詞進行詞性標注,獲取所述各分詞中每一個分詞的詞性標簽;
對所述各分詞進行命名實體識別,獲取所述各分詞中每一個分詞的命名實體標簽。
上述方案中,所述對所述文本信息進行詞法分析之前,所述方法還包括:采用正則表達式匹配所述文本信息,將匹配出的所述文本信息中所包含的不規范用語替換為規范用語。
上述方案中,所述對所述文本信息進行詞法分析之后,所述方法還包括:
對所述各分詞進行句法分析,獲取所述各分詞中每一個分詞的句法分析標簽,并簡化所述句法分析標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610912078.X/2.html,轉載請聲明來源鉆瓜專利網。





