[發(fā)明專利]自動問答方法、自動問答系統(tǒng)及構(gòu)建問答實(shí)例庫的方法有效
| 申請?zhí)枺?/td> | 201210533328.0 | 申請日: | 2012-12-11 |
| 公開(公告)號: | CN103049433A | 公開(公告)日: | 2013-04-17 |
| 發(fā)明(設(shè)計)人: | 陳開江 | 申請(專利權(quán))人: | 微夢創(chuàng)科網(wǎng)絡(luò)科技(中國)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京市京大律師事務(wù)所 11321 | 代理人: | 黃啟行;方曉明 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自動 問答 方法 系統(tǒng) 構(gòu)建 實(shí)例 | ||
1.一種自動問答方法,其特征在于,該方法包括:
A、將接收到的問題向量化獲得問題向量;所述問題向量包含多個向量元素;
B、根據(jù)所述向量元素檢索問答實(shí)例庫,獲得多個實(shí)例向量;任一所述實(shí)例向量至少包含一個向量元素;
C、利用相似度計算公式,計算問題向量與多個實(shí)例向量的相似度;
D、利用所述相似度確定答復(fù)知識點(diǎn),輸出與答復(fù)知識點(diǎn)對應(yīng)的數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A之前進(jìn)一步包括:
A’、采樣人工回答記錄并向量化,生成問答實(shí)例庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟A’包括:
A’1、確定需自動問答的知識點(diǎn),為所述需自動問答的知識點(diǎn)分配問題ID;
A’2、根據(jù)所述需自動問答的知識點(diǎn),對人工回答記錄進(jìn)行采樣,獲得與所述需自動問答的知識點(diǎn)對應(yīng)的問答實(shí)例,為所述問答實(shí)例包含的知識點(diǎn)分配回答知識點(diǎn)ID;
A’3、向量化所述問答實(shí)例包含的問題,獲得問題向量;
A’4、將所述問答實(shí)例以三元組的形式進(jìn)行存儲;任一所述問答實(shí)例的三元組包含問題ID、問題向量及回答知識點(diǎn)ID。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟A’2所述對人工回答記錄進(jìn)行采樣,獲得與所述需自動問答的知識點(diǎn)對應(yīng)的問答實(shí)例包括:
A’21、確定進(jìn)行采樣的知識點(diǎn)的樣本數(shù)量n;所述進(jìn)行采樣的知識點(diǎn)為需自動回答的知識點(diǎn);所述n為自然數(shù);
A’22、從人工回答記錄中選擇包含所述知識點(diǎn)的n個問題實(shí)例;
A’23、計算所述n個問題實(shí)例的問題的整體長度方差;
A’24、判斷所述問題的整體長度方差是否低于第一閾值,如果是,則執(zhí)行步驟A’25,否則,去除所述n個問題實(shí)例中問題長度與所述n個問題實(shí)例的長度平均值的差值最大的一個問題實(shí)例,從人工回答記錄中再選擇一個包含所述知識點(diǎn)的問題實(shí)例,執(zhí)行步驟A’23;
A’25、將所述n個問題實(shí)例作為選擇的n個包含所述需自動回答的知識點(diǎn)的問答實(shí)例。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟A’23為:
利用
所述qi為知識點(diǎn)Kj的問題樣本,所述len(qi)為qi包含的詞數(shù)量,所述為知識點(diǎn)Kj中所有問題長度的平均值。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟A’3包括:
提取所述問答實(shí)例中問題的關(guān)鍵詞、二元字符串及特殊詞性;
將所述關(guān)鍵詞作為向量元素,計算每一向量元素的權(quán)重;
利用每個向量元素的權(quán)重計算問答實(shí)例的向量的長度;
將向量元素、向量元素的權(quán)重及向量的長度作為問題向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微夢創(chuàng)科網(wǎng)絡(luò)科技(中國)有限公司,未經(jīng)微夢創(chuàng)科網(wǎng)絡(luò)科技(中國)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210533328.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





