[發明專利]一種信息處理方法在審
| 申請號: | 201810491332.2 | 申請日: | 2018-05-21 |
| 公開(公告)號: | CN108733654A | 公開(公告)日: | 2018-11-02 |
| 發明(設計)人: | 李明;王靖波;婁旭芳 | 申請(專利權)人: | 寧波薄言信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N99/00 |
| 代理公司: | 上海申新律師事務所 31272 | 代理人: | 俞滌炯 |
| 地址: | 315048 浙江省寧波市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 文本 圖譜 詞語 互聯網數據 人工智能 詞語合并 海量信息 語義關系 自動生成 答案 用戶端 分詞 編譯 歸納 反饋 計算機 保存 學習 | ||
本發明公開了一種信息處理方法,采用信息處理端接收需要被處理的文本,將文本進行分詞,依次得到多個詞語;信息處理端根據詞語之間的語義關系,將詞語合并為多個詞包;信息處理端根據詞包和文本的句式,編譯關系圖譜;信息處理端根據關系圖譜,自動生成多個問題及對應的答案并保存;信息處理端根據問題和對應的答案與用戶端之間進行反饋學習。采用本發明的技術方案,可以使得計算機能從海量信息的互聯網數據中獲取知識,自動歸納新的概念以及信息之間的聯系,使得計算機中的人工智能的知識廣度和深度可以做到持續提升。
技術領域
本發明涉及機器學習領域,尤其涉及一種信息處理方法。
背景技術
隨著社會技術的發展,機器智能化得到廣泛的發展,其中人機交互,信息智能化處理,成為了重要的發展方向。
目前,現有的機器學習方法為將文本看成有序的單詞流序列,在這個有序序列上通過計算對文章進行建模表達。對于短句的文本,計算機可以很快地完成對文本信息的學習。但是,現有的機器學習模型缺乏一種能夠閱讀并分析長句子并做推理的能力,因此不能直接控制計算機學習海量的文本資源,需要消耗大量的時間才能完成對文本的運算和識別,計算機無法有效的獲取長段文本的信息,導致計算機自主學習效率收到了極大的限制。
發明內容
針對現有技術中機器學習領域存在的上述問題,現提供一種信息處理方法。
具體技術方案如下:
一種信息處理方法,運用于機器學習領域,包括信息處理端和用戶端,所述信息處理端與所述用戶端通訊連接,采用以下步驟進行信息處理:
步驟S1:所述信息處理端接收需要被處理的文本,將所述文本進行分詞,依次得到多個詞語;
步驟S2:所述信息處理端根據所述詞語之間的語義關系,將所述詞語合并為多個詞包;
步驟S3:所述信息處理端根據所述詞包和所述文本的句式,編譯關系圖譜;
步驟S4:所述信息處理端根據所述關系圖譜,自動生成多個問題及對應的答案并保存;
步驟S5:所述信息處理端根據所述問題和對應的所述答案與所述用戶端之間進行反饋學習。
優選的,所述步驟S2中,依次比對每個所述詞語之間的語義關系,將所述語義關系相近的所述詞語合并到一個所述詞包中。
優選的,所述步驟S3包括以下步驟:
步驟S31:采用所述信息處理端判斷所述句式是否為時序類句式;
若非所述時序類句式,則進入步驟S32;
若為所述時序類句式,則進入步驟S33;
步驟S32:將所述文本編譯成單個所述關系圖譜中;
步驟S33:將所述文本按照所述文本中的標點作為節點分段,并編譯成多個按時序排列的所述關系圖譜,一個所述關系圖譜對應于一段所述文本。
優選的,所述詞包包括:
所述實體詞包,用于表示所述文本中的主語名詞或對象名詞;
所述關系詞包,用于表示所述實體詞包之間的聯系;
所述屬性詞包,用于表示所述實體詞包的相關屬性。
優選的,所述步驟S3中,編譯所述關系圖譜采用如下步驟:
步驟S31a:將所述詞包根據所述文本的句式拆分為所述實體詞包、所述關系詞包和所述屬性詞包;
步驟S32a:以所述實體詞包作為節點,以所述關系詞包作為相互關聯的所述節點之間的有向邊,以及以所述屬性詞包作為與對應的所述節點所連接的屬性,得到所述關系圖譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波薄言信息技術有限公司,未經寧波薄言信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810491332.2/2.html,轉載請聲明來源鉆瓜專利網。





