[發(fā)明專利]非事實型詢問應答系統(tǒng)以及方法有效
| 申請?zhí)枺?/td> | 201380010249.4 | 申請日: | 2013-01-23 |
| 公開(公告)號: | CN104137102B | 公開(公告)日: | 2017-06-13 |
| 發(fā)明(設計)人: | 吳鐘勛;鳥澤健太郎;橋本力;川田拓也;史蒂恩·德薩哲;風間淳一;王軼謳 | 申請(專利權)人: | 獨立行政法人情報通信研究機構 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司11021 | 代理人: | 趙琳琳 |
| 地址: | 日本國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 事實 詢問 應答 系統(tǒng) 以及 計算機 程序 | ||
1.一種非事實型詢問應答系統(tǒng),接受非事實型詢問的輸入并生成針對該詢問的回答,
所述非事實型詢問應答系統(tǒng)與用于對由處理對象的語言的文檔亦即計算機可讀取的文檔組成的語料庫進行存儲的語料庫存儲單元相連接而被使用,
所述非事實型詢問應答系統(tǒng)包含:
候選檢索單元,其用于響應于已接受詢問的輸入的情況,從所述語料庫存儲單元之中檢索并取出針對該詢問的多個回答候選;
特征生成單元,其用于響應于已接受詢問的輸入的情況,針對該詢問與由所述候選檢索單元取出的各個回答候選的組合,來生成給定的特征的集合;
得分計算單元,其預先進行了學習,使得:在被給出由所述特征生成單元生成的所述特征的集合時,針對成為生成該特征的集合的基礎的詢問以及回答候選的組合,來計算表示該回答候選是針對該詢問的正確回答的程度的得分;以及
回答選擇單元,其針對所述詢問與由所述候選檢索單元取出的各個回答候選的組合,基于由所述得分計算單元計算出的得分,將針對所述詢問為正確回答的可能性最高的回答候選作為針對所述詢問的回答進行輸出,
針對由所述候選檢索單元檢索出的各個回答候選,賦予了由所述特征生成單元生成特征所需的信息,
所述特征生成單元,包含:
句法解析單元,其用于針對所述詢問進行詞素解析以及句法解析,并輸出詞素信息以及語法信息;以及
評價單元,其用于從所述詢問當中確定遵照某評價基準而被分類為第1評價類的詞組以及被分類為第2評價類的詞組,
針對所述第1評價類以及第2評價類各自分配了彼此相反的評價的極性,
所述詢問應答系統(tǒng)還包含:特征集合生成單元,其用于針對所述詢問與各個所述回答候選的組合,基于所述句法解析單元的解析結果、由所述評價單元確定出的詞組的位置及其評價類的極性、以及對所述回答候選所賦予的特征生成用信息,來生成所述特征的集合。
2.根據(jù)權利要求1所述的非事實型詢問應答系統(tǒng),其中,
所述特征生成單元還包含:含義類變換單元,其用于將包含在所述句法解析單元的輸出中的各名詞分類成預先準備的多個單詞的含義類中的任一者,并將該名詞變換成對應的含義類,
所述特征集合生成單元包含:第1單元,其用于針對所述詢問與各個所述回答候選的組合,基于所述句法解析單元的解析結果、由所述評價單元確定出的詞組的位置及其評價類的極性、由所述含義類變換單元被進行了變換后的所述句法解析單元的輸出、以及對所述回答候選所賦予的特征生成用信息,來生成所述特征的集合。
3.根據(jù)權利要求2所述的非事實型詢問應答系統(tǒng),其中,
所述第1單元基于由所述評價單元確定出的詞組的位置以及評價類的極性而生成的特征包含:表示詢問中的詞組的評價類的極性與回答候選中的詞組的評價類的極性是否一致的信息。
4.根據(jù)權利要求2所述的非事實型詢問應答系統(tǒng),其中,
所述第1單元所生成的特征包含:從所述句法解析單元的輸出得到且未使用所述評價單元的輸出或所述含義類變換單元的輸出而得到的特征、對所述句法解析單元的輸出組合所述評價單元的輸出而得到的特征、以及對所述句法解析單元的輸出組合所述含義類變換單元的輸出而得到的特征。
5.根據(jù)權利要求2所述的非事實型詢問應答系統(tǒng),其中,
所述第1單元所生成的特征包含:對所述句法解析單元的輸出組合所述評價單元的輸出,進而組合所述含義類變換單元的輸出而得到的特征。
6.一種非事實型詢問應答方法,由接受非事實型詢問的輸入并生成針對該詢問的回答的非事實型詢問應答系統(tǒng)來實現(xiàn),
所述非事實型詢問應答系統(tǒng)與用于對由處理對象的語言的文檔亦即計算機可讀取的文檔組成的語料庫進行存儲的語料庫存儲單元相連接,
所述方法包括:
候選檢索步驟,響應于已接受詢問的輸入的情況,從所述語料庫存儲單元之中檢索并取出針對該詢問的多個回答候選;以及
特征生成步驟,響應于已接受詢問的輸入的情況,針對該詢問與通過所述候選檢索步驟取出的各個回答候選的組合,來生成給定的特征的集合,
所述非事實型詢問應答系統(tǒng)包括:
得分計算單元,其預先進行了學習,使得:在被給出通過所述特征生成步驟生成的所述特征的集合時,針對成為生成該特征的集合的基礎的詢問以及回答候選的組合,來計算表示該回答候選是針對該詢問的正確回答的程度的得分,
所述方法包括:
在被給出通過所述特征生成步驟生成的所述特征的集合時,利用所述得分計算單元來計算所述得分的步驟;以及
回答選擇步驟,針對所述詢問與通過所述候選檢索步驟取出的各個回答候選的組合,基于通過計算所述得分的步驟計算出的得分,將針對所述詢問為正確回答的可能性最高的回答候選作為針對所述詢問的回答進行輸出,
針對通過所述候選檢索步驟取出的各個回答候選,賦予了通過所述特征生成步驟生成特征所需的信息,
所述特征生成步驟包括:
句法解析步驟,針對所述詢問進行詞素解析以及句法解析,并輸出詞素信息以及語法信息;以及
評價步驟,從所述詢問當中確定遵照某評價基準而被分類為第1評價類的詞組以及被分類為第2評價類的詞組,
針對所述第1評價類以及第2評價類各自分配了彼此相反的評價的極性,
所述方法還包括:
特征集合生成步驟,針對所述詢問與各個所述回答候選的組合,基于所述句法解析步驟的解析結果、通過所述評價步驟確定出的詞組的位置及其評價類的極性、以及對所述回答候選所賦予的特征生成用信息,來生成所述特征的集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于獨立行政法人情報通信研究機構,未經(jīng)獨立行政法人情報通信研究機構許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380010249.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





