[發明專利]基于自然語言處理和深度學習的智能問答優化方法在審
| 申請號: | 202010364914.1 | 申請日: | 2020-04-30 |
| 公開(公告)號: | CN111639165A | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 陳立;徐雷 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/284;G06F40/289;G06F40/35;G06K9/62 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 吳茂杰 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自然語言 處理 深度 學習 智能 問答 優化 方法 | ||
本發明公開一種基于自然語言處理和深度學習的智能問答優化方法,準確性高。本發明的技基于自然語言處理和深度學習的智能問答優化方法,包括如下步驟:(10)中文分詞及詞向量轉換:抓取特定目標領域語意信息,將自然語言中的單詞字符轉換成計算機可以理解的N維矩陣向量;(20)自然語言處理:給本體語義概念間關系賦予權重,使用權重計算語義距離,基于概念間語義距離描述語義相似性;(30)語言歧義消除:通過闕值比較消除語言歧義。
技術領域
本發明屬于計算機人工智能領域,特別是一種基于自然語言處理和深度學習的智能問答優化方法
背景技術
智能問答是指系統接受用戶以自然語言形式描述的提問,使用數據處理、查詢拓展等技術從大量異構數據源中搜索出能回答提問的精確答案的信息檢索系統。不同于傳統的基于關鍵詞查詢且返回文檔鏈接集合的搜索引擎,智能問答系統涉及知識表示、IR(Information Retrieval信息檢索)、NLR(Natural Language Processing自然語言處理)等領域,能夠更有效的幫助用戶從海量信息資源中提取有效信息,同時具有更智能的人機交互體驗,目前已經成為國際上的一個新興的研究熱點。
當前智能問答的實現方法一般包括如下步驟:首先,對于用戶輸入的自然語言形式問題進行問句分析,提取問句的句法形式,通過分詞模型抓取問句中的關鍵詞和主要句義;其次,利用提取的關鍵詞和句義利用信息檢索技術從文檔庫中提取文檔集合;第三,從整理出的文檔集合尋找匹配的特征值,根據該特征值整理答案集,最后,對答案集進行打分排序,提取最佳答案并返還給用戶。
然而,當前智能問答的實現方法往往是基于關鍵詞的邏輯結合,采用索引和匹配算法無法觸及對語義信息的處理,同時帶來了檢索結果與問答內容語義不相關,信息冗余的問題,對問答反饋結果的準確性造成了一定程度的影響。
發明內容
本發明的目的在于提供一種基于自然語言處理和深度學習的智能問答優化方法,準確性高。
實現本發明目的的技術解決方案為:
一種基于自然語言處理和深度學習的智能問答優化方法,包括如下步驟:
(10)中文分詞及詞向量轉換:抓取特定目標領域語意信息,將自然語言中的單詞字符轉換成計算機可以理解的N維矩陣向量;
(20)自然語言處理:給本體語義概念間關系賦予權重,使用權重計算語義距離,基于概念間語義距離描述語義相似性;
(30)語言歧義消除:通過闕值比較消除語言歧義。
本發明與現有技術相比,其顯著優點為:
智能問答準確性高:本發明優化了智能問答步驟中的語義匹配算法和反饋篩選過程,通過詞向量處理實現問答語義的向量化并利用語義向量進行相似度計算,極大的簡便了語義與文檔庫的匹配問題,同時減少了信息冗余度。得到問答反饋之后通過闕值比較提高了智能問答的準確性。
下面結合附圖和具體實施方式對本發明作進一步的詳細描述。
附圖說明
圖1是本發明基于自然語言處理和深度學習的智能問答優化方法的主流程圖。
圖2是詞向量訓練流程圖。
圖3是圖1中自然語言處理步驟的流程圖。
圖4是語義相似性層次模型。
圖5是語義相似度計算的具體實施流程圖。
具體實施方案
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010364914.1/2.html,轉載請聲明來源鉆瓜專利網。





