[發(fā)明專利]自動回答方法、裝置、存儲介質(zhì)及電子設(shè)備在審
| 申請?zhí)枺?/td> | 201780002509.1 | 申請日: | 2017-11-02 |
| 公開(公告)號: | CN107980130A | 公開(公告)日: | 2018-05-01 |
| 發(fā)明(設(shè)計)人: | 檀利 | 申請(專利權(quán))人: | 深圳前海達(dá)闥云端智能科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11447 | 代理人: | 魏嘉熹,南毅寧 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自動 回答 方法 裝置 存儲 介質(zhì) 電子設(shè)備 | ||
1.一種自動回答方法,其特征在于,所述方法包括:
抽取待回答問題的文本特征;
通過對所述待回答問題的文本特征與問答語料庫中問答對的問題的文本特征進(jìn)行相似度計算,從所述問答語料庫中篩選出候選問答對;
基于預(yù)先完成問答訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型計算所述待回答問題的特征向量,以及,獲取基于所述神經(jīng)網(wǎng)絡(luò)模型計算出的所述候選問答對的答案的特征向量;
通過對所述待回答問題的特征向量與所述候選問答對的答案的特征向量進(jìn)行余弦相似度計算,從所述候選問答對中篩選出答案。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述抽取待回答問題的文本特征包括:
將所述待回答問題的所有一元特征以及二元特征,加入所述待回答問題的特征序列,其中,一個一元特征為一個字符,一個二元特征為一個一元特征的后繼一元特征相拼接得到的字符串;
計算所述待回答問題與所述問答語料庫中問答對問題的最長公共子序列;
將所述最長公共子序列的二元特征,加入所述待回答問題的特征序列。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過對所述待回答問題的文本特征與問答語料庫中問答對的問題的文本特征進(jìn)行相似度計算,從所述問答語料庫中篩選出候選問答對包括:
通過對所述待回答問題進(jìn)行句法分詞確定所述待回答問題的核心詞,以及,通過對所述問答對的問題進(jìn)行句法分詞確定所述問答對的問題的核心詞;
其中,所述問答對的問題的特征序列包括:所述問答對的問題的所有一元特征、二元特征、與所述待回答問題的最長公共子序列的所有二元特征;
基于所述待回答問題的核心詞在所述待回答問題的特征序列中出現(xiàn)的頻次確定所述待回答問題的特征權(quán)重、基于所述問答對的問題的核心詞在所述問答對的問題的特征序列中出現(xiàn)的頻次確定所述問答對的問題的特征權(quán)重;
基于所述待回答問題的核心詞的褒貶與是否被否定詞修飾確定所述待回答問題的否定系數(shù),以及,基于所述問答對的問題的核心詞的褒貶與是否被否定詞修飾確定所述問答對的問題的否定系數(shù);
利用所述待回答問題的特征權(quán)重和否定系數(shù)、所述問答對的問題的特征權(quán)重和否定系數(shù)、計算所述待回答問題與所述問答對的問題的相似度;
將所述問答對按照所述待回答問題與所述問答對的問題的相似度從高到低排序,從所述問答語料庫中篩選出排序在前預(yù)設(shè)位數(shù)的問答對作為候選問答對。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述抽取待回答問題的文本特征之前,還包括:對所述待回答問題進(jìn)行文本一致性處理;
所述文本一致性處理包括:不同字體轉(zhuǎn)換為相同字體、同義詞轉(zhuǎn)換為相同詞語、去除預(yù)設(shè)特殊符號。
5.一種自動回答裝置,其特征在于,所述裝置包括:
特征抽取模塊,用于抽取待回答問題的文本特征;
候選篩選模塊,用于通過對所述待回答問題的文本特征與問答語料庫中問答對的問題的文本特征進(jìn)行相似度計算,從所述問答語料庫中篩選出候選問答對;
特征向量計算模塊,用于基于預(yù)先完成問答訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型計算所述待回答問題的特征向量,以及,獲取基于所述神經(jīng)網(wǎng)絡(luò)模型計算出的所述候選問答對的答案的特征向量;
答案篩選模塊,用于通過對所述待回答問題的特征向量與所述候選問答對的答案的特征向量進(jìn)行余弦相似度計算,從所述候選問答對中篩選出答案。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述特征抽取模塊包括:
自身特征抽取子模塊,用于將所述待回答問題的所有一元特征以及二元特征,加入所述待回答問題的特征序列,其中,一個一元特征為一個字符,一個二元特征為一個一元特征的后繼一元特征相拼接得到的字符串;
公共特征計算子模塊,用于計算所述待回答問題與所述問答語料庫中問答對的問題的最長公共子序列;
公共特征加入子模塊,用于將所述最長公共子序列的所有二元特征,加入所述待回答問題的特征序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海達(dá)闥云端智能科技有限公司,未經(jīng)深圳前海達(dá)闥云端智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780002509.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





