[發明專利]一種基于seq2seq模型的實現問答機器人的方法在審
| 申請號: | 201710696670.5 | 申請日: | 2017-08-15 |
| 公開(公告)號: | CN107463699A | 公開(公告)日: | 2017-12-12 |
| 發明(設計)人: | 尹青山;段成德;于治樓 | 申請(專利權)人: | 濟南浪潮高新科技投資發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 濟南信達專利事務所有限公司37100 | 代理人: | 姜明 |
| 地址: | 250100 山東省濟南市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 seq2seq 模型 實現 問答 機器人 方法 | ||
技術領域
本發明涉及人工智能技術領域,特別涉及一種基于seq2seq模型的實現問答機器人的方法。
背景技術
人工智能(Artificial Intelligence,AI)是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。
人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器。該領域的研究包括智能點餐機器人、語言識別、圖像識別、自然語言處理和專家系。人工智能從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,可以設想,未來人工智能帶來的科技產品,將會是人類智慧的“容器”。
TensorFlow是Google基于DistBelief進行研發的第二代人工智能學習系統,其命名來源于本身的運行原理。Tensor(張量)意味著N維數組,Flow(流)意味著基于數據流圖的計算,TensorFlow為張量從流圖的一端流動到另一端計算過程。TensorFlow是將復雜的數據結構傳輸至人工智能神經網中進行分析和處理過程的系統。
seq2seq(Sequence to Sequence)模型是Google開源的一款用于TensorFlow的通用編碼器&解碼器框架(encoder-decoder framework),可用于機器翻譯、文本摘要、會話建模、圖像描述等。
Seq2Seq模型解決問題的主要思路是通過深度神經網絡模型(常用的是LSTM,長短記憶網絡,一種循環神經網絡)將一個作為輸入的序列映射為一個作為輸出的序列,這一過程由編碼輸入與解碼輸出兩個環節組成。
seq2seq技術突破了傳統的固定大小輸入問題框架,開通了將經典深度神經網絡模型(DNNs)運用于翻譯與智能問答這一類序列型(Sequence Based,項目間有固定的先后關系)任務的先河,并被證實在英語-法語翻譯、英語-德語翻譯以及人機短問快答的應用中有著不俗的表現。
基于上述情況,本發明提出了一種基于seq2seq模型的實現問答機器人的方法。
發明內容
本發明為了彌補現有技術的缺陷,提供了一種簡單高效的基于seq2seq模型的實現問答機器人的方法。
本發明是通過如下技術方案實現的:
一種基于seq2seq模型的實現問答機器人的方法,其特征在于,包括以下步驟:
(1)語料數據預處理;
(2)使用seq2seq模型對經過預處理的語料數據進行訓練得到問答模型;
(3)接收用戶輸入的問題;
(4)根據問答語句的上下文信息提取主題詞存放于數據庫中;
(5)若問答語句中無主題詞,則將存放于數據庫的主題詞加入到問答語句中;若問答語句中有主題詞,則提取出主題詞并更新到數據庫中;
(6)將處理后的問題輸入到訓練的seq2seq模型中,獲取與所述問題對應的回答。
所述步驟(1)中,語料數據預處理過程先根據知識圖譜對語料庫進行分詞,然后將分詞后的語料庫轉化為向量表示。
所述語料數據預處理過程,先根據知識圖譜使用python的jiaba分詞器對語料庫進行分詞,然后將分詞后的語料庫使用word2vec向量表示,并將回答語句更新于Mongo DB數據庫中。
本發明的有益效果是:該基于seq2seq模型的實現問答機器人的方法,可以根據問答語句的上下文提取出主題詞,能夠處理省略主題詞的問答,具有普遍的通用性。可以應用在導購,熱線,自動控制等多種場景中。
附圖說明
附圖1 為本發明基于seq2seq模型的實現問答機器人的方法示意圖。
具體實施方式
為了使本發明所要解決的技術問題、技術方案及有益效果更加清楚明白,以下結合附圖和實施例,對本發明進行詳細的說明。應當說明的是,此處所描述的具體實施例僅用以解釋本發明,并不用于限定本發明。
該基于seq2seq模型的實現問答機器人的方法,包括以下步驟:
(1)語料數據預處理;
(2)使用seq2seq模型對經過預處理的語料數據進行訓練得到問答模型;
(3)接收用戶輸入的問題;
(4)根據問答語句的上下文信息提取主題詞存放于數據庫中;
(5)若問答語句中無主題詞,則將存放于數據庫的主題詞加入到問答語句中;若問答語句中有主題詞,則提取出主題詞并更新到數據庫中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南浪潮高新科技投資發展有限公司,未經濟南浪潮高新科技投資發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710696670.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于人工智能推送信息的方法和裝置
- 下一篇:用于獲取信息的方法、裝置及設備





