[發明專利]一種基于LSTM的獲取食品安全問題答案的方法及系統在審
| 申請號: | 201911113762.1 | 申請日: | 2019-11-14 |
| 公開(公告)號: | CN111125295A | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 陳瑛;趙筱鈺;陳昂軒;董玉博;侯文俊 | 申請(專利權)人: | 中國農業大學 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/332;G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 張秀程 |
| 地址: | 100193 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lstm 獲取 食品安全問題 答案 方法 系統 | ||
本發明實施例提供一種基于LSTM的獲取食品安全問題答案的方法及系統。該方法包括:獲取待回答問題;將所述待回答問題輸入至預先訓練好的問答判斷模型,獲取所述問答判斷模型輸出的問題匹配結果;其中所述問答判斷模型是基于食品安全問題答案樣本集,使用人工標注的問題答案對及對應的匹配標簽訓練LSTM模型得到的。本發明實施例通過基于LSTM模型對食品安全問題進行訓練,并解決搜索引擎對食品安全事件檢索準確性低的問題,能有效從新聞庫中篩選出食品安全問題答案。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種基于LSTM的獲取食品安全問題答案的方法及系統。
背景技術
近年來,由于各類食品安全事件頻頻發生,使得食品安全問題愈發嚴峻,加劇了大眾對食品安全的擔憂。由于信息不對稱問題,對于食品安全類信息的數據常難以獲取。
目前針對食品安全事件語料主要來源于新聞報道。但是,由于新聞文本長短不一,加之答案分布的不確定性,對于一個食品安全相關問題,在食品安全事件新聞報道中人工尋找答案效率較低。
而大多數自動問答系統以結構化方法構造食品安全數據庫,從中挑選出符合問題的對應數據作為返回給消費者的答案。這種數據庫構造方法非常依賴人工標注對應數據的質量,一旦數據標注有誤差或者沒有標注對應問題方面的答案數據,就不能給消費者合理的信息反饋。所以構造一個能夠從新聞報道中找到消費者詢問問題答案的食品安全問答系統顯得很有必要,且這種問答系統能夠做到自己生產答案,而不是從已有的數據庫中找到答案。
因此,需要提出一種能獲取食品安全自動問答答案的方法,能提供相關食品安全事件的查詢,給出包含答案的相關語句,保證消費者能夠便捷的了解食品安全事件。
發明內容
本發明實施例提供一種基于LSTM的獲取食品安全問題答案的方法及系統,用以解決現有技術中依靠人工搜索食品安全問題的答案效率低的問題。
第一方面,本發明實施例提供一種基于LSTM的獲取食品安全問題答案的方法,包括:
獲取待回答問題;
將所述待回答問題輸入至預先訓練好的問答判斷模型,獲取所述問答判斷模型輸出的問題匹配結果;其中所述問答判斷模型是基于食品安全問題答案樣本集,使用人工標注的問題答案對及對應的匹配標簽訓練LSTM模型得到的。
優選地,所述問答判斷模型,通過以下步驟獲得:
獲取食品安全問題答案樣本集;
按照問題答案對進行分類,將所述問題答案對中包含目標答案所在的句子定義為第一標簽,將所述問題答案對中不包含目標答案的句子定義為第二標簽;
基于所述第一標簽和所述第二標簽,將所述食品安全問題樣本集劃分為訓練集、交叉驗證集和測試集;
獲取LSTM模型網絡結構作為初始模型;
將所述訓練集、所述交叉驗證集和所述測試集輸入至所述初始模型進行訓練,得到所述問答判斷模型。
優選地,所述獲取食品安全問題答案樣本集,具體包括:
獲取食品安全原始文檔;
基于預設食品安全事件進行人工提問,在所述食品安全原始文檔中標注具有與所述人工提問匹配答案的句子,將所述具有與所述人工提問的句子與所述人工提問構成匹配問題答案對;
在所述食品安全原始文檔中標注與所述人工提問具有預設非關聯度的句子,將所述具有預設非關聯度的句子與所述人工提問構成不匹配問題答案對;
對所述匹配問題答案對和所述不匹配問題答案對進行分詞,采用Word2Vec模型生成食品安全領域的詞向量,將問題答案對中分詞后的問題和答案映射到詞向量空間生成問題答案對向量表示;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業大學,未經中國農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911113762.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動標定試題知識點的方法
- 下一篇:手與物體復雜交互場景重建方法及裝置





