[發(fā)明專利]一種問題生成方法在審
| 申請?zhí)枺?/td> | 201810762281.2 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN108897894A | 公開(公告)日: | 2018-11-27 |
| 發(fā)明(設計)人: | 趙豫;葉茂;徐培;蘇楊 | 申請(專利權(quán))人: | 電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 成都虹盛匯泉專利代理有限公司 51268 | 代理人: | 王偉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量 傳播 人工智能領域 神經(jīng)網(wǎng)絡應用 非數(shù)據(jù)庫 神經(jīng)網(wǎng)絡 文本文檔 誤差傳播 分詞 匹配 終端 輸出 轉(zhuǎn)換 靈活 重復 網(wǎng)絡 保證 | ||
本發(fā)明提出了一種問題生成方法,屬于人工智能領域。本發(fā)明在將文本文檔進行分詞后,將其轉(zhuǎn)換為終端能夠處理的向量的形式,把向量輸入至逆向傳播神經(jīng)網(wǎng)絡中對網(wǎng)絡進行訓練,通過信號正方向的傳播和逆向的誤差傳播,一直重復此過程直到該BP網(wǎng)絡輸出的誤差在閾值以內(nèi)才完成訓練,保證了問題生成的質(zhì)量;將逆向傳播神經(jīng)網(wǎng)絡應用于問題生成中,實現(xiàn)了自動非數(shù)據(jù)庫匹配的問題生成,使問題生成更加靈活,適用性更廣。
技術(shù)領域
本發(fā)明屬于人工智能領域,特別涉及一種問題生成方法。
背景技術(shù)
自從二十世紀八十年代以來,人工智能領域的研究開始成為熱點,主要體現(xiàn)在機器人、語言識別、圖像識別、自然語言處理等研究領域。其中,自然語言處理研究的內(nèi)容也逐漸豐富,機器翻譯、自動文摘的準確度已經(jīng)達到相當高的水平。目前,信息檢索中的高級檢索,即問題生成,還有很大的研究空間。人工智能中主要用到一些人工神經(jīng)網(wǎng)絡,其優(yōu)勢在于不需要事先確定輸入輸出之間的映射關系,僅僅通過訓練,讓其學習特征,在學習后,給定某一輸入值后能夠得到最接近期望輸出值的結(jié)果。神經(jīng)網(wǎng)絡作為一種智能的處理各種信息的系統(tǒng),算法是其實現(xiàn)功能的核心。誤差逆向傳播(back propagation,BP)神經(jīng)網(wǎng)絡是一種逆向傳播訓練的前潰網(wǎng)絡,這個算法的基本思想是利用梯度下降法,以實現(xiàn)網(wǎng)絡的實際輸出值和期望輸出值的誤差均方差最小。
另外,基于神經(jīng)網(wǎng)絡的問題生成技術(shù)具有重要研究意義。首先,基于網(wǎng)絡的問題生成,能夠?qū)ξ谋具M行識別,識別后生成各種問題,可以將此方法運用到閱讀理解中的相關問題的設定的情景下,也可以將此技術(shù)應用于各種場景,如可以用在財務部門的相關系統(tǒng)中,可以應用在網(wǎng)上客服系統(tǒng)中,以及其他業(yè)務中,以期達到滿足對不同行業(yè)需求的、實時的服務。其次,由于目前已經(jīng)成為大數(shù)據(jù)時代,每天的數(shù)據(jù)量遠遠不是人工能處理的,如果采用傳統(tǒng)的方式,即問題生成的方式是人工的,或者是通過寫好的數(shù)據(jù)庫進行匹配的,比較消耗人力,會帶來極大的人力物力資源的開銷,由于大部分問題生成都是通過匹配以及基于問題模板生成即一定的規(guī)則得到的,所以得到的問題結(jié)果在時間上也會相應滯后。而采用基于神經(jīng)網(wǎng)絡的問題生成比較節(jié)省人力,并且生成問題所需要的時間比較短,提高效率。
現(xiàn)有的問題生成技術(shù),只能通過特定任務的問題序列,此序列是一個個問題描述,將問題發(fā)送給用戶。然而這些問題不是自動生成的問題,相當于已經(jīng)存在的現(xiàn)有的知識庫組成的。因此,在復雜的環(huán)境中,基于這種特征的生成方法是不具有靈活性的,而且前期知識庫的收集也比較費時費力,在技術(shù)的適用性上有限。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中,生成的問題呆滯不靈活的問題,本發(fā)明提出了一種問題生成方法,通過誤差逆向傳播算法,即在進行訓練學習的過程中,由信號正方向的傳播和逆向的誤差傳播兩部分組成,一直重復此過程直到BP網(wǎng)絡輸出的誤差在可以接受的范圍,保證了問題生活的質(zhì)量。
一種問題生成方法,包括以下步驟:
步驟1,對文本文檔進行分詞;
步驟2,將分詞后的文本文檔轉(zhuǎn)換為向量;
步驟3,構(gòu)建BP神經(jīng)網(wǎng)絡,輸入向量,基于誤差逆向傳播算法對所述BP神經(jīng)網(wǎng)絡進行訓練;
步驟4,當所述BP神經(jīng)網(wǎng)絡的誤差小于預設誤差閾值時,所述BP神經(jīng)網(wǎng)絡訓練完成,得到問題生成網(wǎng)絡模型。
進一步地,所述步驟1中,應用jieba分詞算法對文本文檔進行分詞。
進一步地,所述步驟2中,應用word2vec模型將分詞后的文本文檔轉(zhuǎn)換為向量。
進一步地,所述步驟2中,應用skip-gram模型將分詞后的文本文檔轉(zhuǎn)換為向量。
進一步地,所述步驟4包括以下流程:
步驟41,判斷所述BP神經(jīng)網(wǎng)絡的誤差是否小于預設誤差閾值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學,未經(jīng)電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810762281.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 一種基于神經(jīng)網(wǎng)絡集成的股票趨勢預測方法
- 神經(jīng)網(wǎng)絡訓練方法和裝置、存儲介質(zhì)及電子裝置
- 神經(jīng)網(wǎng)絡的基于特征的選擇性控制
- 合作地訓練和/或使用單獨的輸入和后續(xù)內(nèi)容神經(jīng)網(wǎng)絡以進行信息檢索
- 脈沖神經(jīng)網(wǎng)絡運算芯片及相關運算方法
- 人工智能應用開發(fā)系統(tǒng)、計算機設備及存儲介質(zhì)
- 一種神經(jīng)網(wǎng)絡模型知識蒸餾方法、系統(tǒng)、設備及介質(zhì)
- 一種圖神經(jīng)網(wǎng)絡訓練方法及裝置
- 一種可重構(gòu)神經(jīng)網(wǎng)絡處理器





