[發明專利]一種基于知識圖譜的語音問答系統及其應用方法在審
| 申請號: | 202010422420.4 | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN111597308A | 公開(公告)日: | 2020-08-28 |
| 發明(設計)人: | 李澤宇;李磊;李煜祺;宋凱;陳忠;周賓;牛耕田;劉延杰 | 申請(專利權)人: | 中國電子科技集團公司第二十八研究所 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/36 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 徐紅梅 |
| 地址: | 210007 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 語音 問答 系統 及其 應用 方法 | ||
1.一種基于知識圖譜的語音問答系統,其特征在于,包括:
終端應用模塊,用于聲音錄制以及獲取數據的展示;
語音識別模塊,負責實時監測并接收終端應用模塊發送的音頻信息,利用語音識別引擎進行模數轉換,生成文本句式信息;
語義理解模塊,實時接收來自語音識別模塊生成的文本句式信息,利用語義理解引擎將關鍵詞信息提取出來;
數據檢索模塊,負責接收語義理解模塊生成的關鍵詞信息,通過對知識圖譜數據庫的訪問獲取用戶實際期望得到的信息,最后返回終端應用模塊顯示在界面上。
2.根據權利要求1所述的基于知識圖譜的語音問答系統,其特征在于,語音識別模塊包括語音識別客戶端和語音識別服務端,語音識別客戶端主要負責收錄用戶的提問語音并錄制成pcm格式的音頻文件發送至語音識別服務端;語音識別服務端執行語音識別的主要功能,先進行預處理和特征提取,通過抗混疊濾波將頻譜上的雜音與目標區段區分開來,提取有用信息并完成模擬信號向數字信號的轉換,然后送往解碼器根據事先訓練好的聲學模型和語言模型進行模式匹配,最后將用戶語音內容作為識別結果返回語音識別客戶端。
3.根據權利要求1所述的基于知識圖譜的語音問答系統,其特征在于,語義理解模塊主要提供語義理解服務端,該語義理解服務端提供http訪問接口,指揮系統通過http協議以語音識別模塊得到的文本信息為參數訪問語義理解服務端,語義理解服務端將文本信息與提前訓練好的模板句式進行匹配,找到似然度最高的模板句式,得到該句式預先設定的關鍵詞及其類型信息并以字符串的形式返回指揮系統。
4.根據權利要求1所述的基于知識圖譜的語音問答系統,其特征在于,關鍵詞對應知識圖譜數據庫中數據表的名稱字段、屬性名稱或關系名稱,類型對應數據表名、屬性或關系,通過對表的查詢得到用戶想要檢索的信息。
5.一種基于知識圖譜的語音問答系統的應用方法,其特征在于,包括以下步驟:
(1)配置知識圖譜數據庫中表的結構信息,通過知識圖譜數據庫中表的字段關聯構建本體模型,并利用這些模型之間的關聯字段構建數據關系模型,將數據關系模型存入知識圖譜數據庫中;
(2)用戶通過錄音設備將想要檢索的內容以口語的方式錄入,生成音頻文件發送至語音識別服務端,語音識別服務端將音頻文件解析成文本信息返回給語音識別客戶端;
(3)構建問答句式模型,以便語義理解模塊匹配挑選出對應的關鍵詞信息;
(4)語音識別客戶端將文本信息作為參數訪問語義理解服務提供的http端口,語義理解服務將該文本信息提取關鍵詞返回給語音識別客戶端;
(5)數據檢索模塊通過該關鍵詞信息到知識圖譜數據庫中查詢該關系或屬性信息并通過終端應用模塊展示給用戶。
6.根據權利要求5所述的基于知識圖譜的語音問答系統的應用方法,其特征在于,步驟(1)中數據關系模型的構建方法為:
(11)根據數據源進行本體模型構建,每張數據表都能作為一個本體;
(12)進行本體模型關系構建,兩張數據表之間若存在關聯字段,便進行本體模型關系構建;
(13)進行實體關系構建,將數據表中的每一條數據作為一個實體,每條數據的每個字段作為該實體的屬性,兩個實體間若存在關聯屬性的值相等或經過特定公式計算后相等,則進行實體關系構建;
(14)將生成的數據存入圖數據庫并建立索引,完成數據關系模型構建。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司第二十八研究所,未經中國電子科技集團公司第二十八研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010422420.4/1.html,轉載請聲明來源鉆瓜專利網。





