[發明專利]用于智能機器人的文本處理方法及系統在審
| 申請號: | 201710082574.1 | 申請日: | 2017-02-16 |
| 公開(公告)號: | CN106897266A | 公開(公告)日: | 2017-06-27 |
| 發明(設計)人: | 魏晨;韋克禮 | 申請(專利權)人: | 北京光年無限科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京聿華聯合知識產權代理有限公司11611 | 代理人: | 張文娟,朱繪 |
| 地址: | 100000 北京市石景山區石景山*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 智能 機器人 文本 處理 方法 系統 | ||
技術領域
本發明涉及智能機器人領域,尤其涉及一種用于智能機器人的文本處理方法及系統。
背景技術
隨著科學技術的不斷發展,信息技術、計算機技術以及人工智能技術的引入,機器人的研究已經逐步走出工業領域,逐漸擴展到了醫療、保健、家庭、娛樂以及服務行業等領域。
而人們對于機器人的要求也從簡單重復的機械動作提升為具有擬人問答、自主性及智能性的智能機器人,人機交互也就成為決定智能機器人發展的重要因素,因此,提高智能機器人的人機交互效率,成為目前亟需解決的重要問題,那么相應的,對機器人的開發者也提出了更高的要求,以提高對于處理機器人產品性能和機器人數據處理效能。
發明內容
本發明所要解決的技術問題之一是需要提供一種提高對于處理機器人產品性能和機器人數據處理效能,提升智能機器人的智能性的解決方案。
為了解決上述技術問題,本申請的實施例首先提供了一種用于智能機器人的文本處理方法,所述智能機器人安裝有機器人操作系統,該方法包括:獲取待處理的文本數據;通過句法分析對所述待處理的文本數據進行核心詞提取,基于核心詞比對進行文本歸一化處理,其中,對基于核心詞比對歸一化失敗的文本數據,基于語義相似度算法進行文本歸一化;輸出和/或存儲文本歸一化結果。
優選地,在基于語義相似度算法進行文本歸一化的步驟中,基于最短路徑長度和分類中的最大深度來計算語義相似度。
優選地,所述語義相似度算法為混合了根據語義內容計算相似度和根據概念的語義距離計算相似度的算法。
優選地,在基于核心詞比對進行文本歸一化處理的步驟中,將歸一化后的文本數據放在同一歸一化列表中,其中,將字數最短的文本數據作為該列表的歸一化詞條,其他的文本數據作為該列表的列表成員。
本發明實施例還提供了一種用于智能機器人的文本處理系統,所述智能機器人安裝有機器人操作系統,該文本處理系統包括:文本數據獲取模塊,其獲取待處理的文本數據;文本歸一化模塊,其通過句法分析對所述待處理的文本數據進行核心詞提取,基于核心詞比對進行文本歸一化處理,其中,對基于核心詞比對歸一化失敗的文本數據,基于語義相似度算法進行文本歸一化;結果處理模塊,其輸出和/或存儲文本歸一化結果。
優選地,所述文本歸一化模塊,其進一步在基于語義相似度算法進行文本歸一化時,基于最短路徑長度和分類中的最大深度來計算語義相似度。
優選地,所述語義相似度算法為混合了根據語義內容計算相似度和根據概念的語義距離計算相似度的算法。
優選地,所述文本歸一化模塊,其進一步在基于核心詞比對進行文本歸一化處理時,將歸一化后的文本數據放在同一歸一化列表中,其中,將字數最短的文本數據作為該列表的歸一化詞條,其他的文本數據作為該列表的列表成員。
與現有技術相比,上述方案中的一個或多個實施例可以具有如下優點或有益效果:
本發明實施例通過對用戶輸入的待處理文本數據進行句法分析獲取每個文本數據中的核心詞,然后基于核心詞比對進行文本歸一化處理來得到文本歸一化結果。而且,對基于核心詞比對歸一化失敗的文本數據,基于語義相似度算法進行文本歸一化。上述方法能夠提高機器人智能性以及與用戶的交互能力,對待處理的文本數據能夠進行較好的文本歸一化處理,便于后續的語言處理,能夠提高智能機器人的語言交互能力,更好的滿足用戶需求。
本發明的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發明的技術方案而了解。本發明的目的和其他優點可通過在說明書、權利要求書以及附圖中所特別指出的結構和/或流程來實現和獲得。
附圖說明
附圖用來提供對本申請的技術方案或現有技術的進一步理解,并且構成說明書的一部分。其中,表達本申請實施例的附圖與本申請的實施例一起用于解釋本申請的技術方案,但并不構成對本申請技術方案的限制。
圖1為本申請第一實施例的用于智能機器人的文本處理方法的流程示意圖。
圖2為本申請實施例的文本歸一化處理的示意圖。
圖3為本申請第二實施例的用于智能機器人的文本處理系統的結構示意圖。
具體實施方式
以下將結合附圖及實施例來詳細說明本發明的實施方式,借此對本發明如何應用技術手段來解決技術問題,并達成相應技術效果的實現過程能充分理解并據以實施。本申請實施例以及實施例中的各個特征,在不相沖突前提下可以相互結合,所形成的技術方案均在本發明的保護范圍之內。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京光年無限科技有限公司,未經北京光年無限科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710082574.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:詞向量訓練方法及裝置
- 下一篇:文章縮略文意生成方法、裝置及服務器





