[發明專利]一種基于孿生網絡的FAQ問答庫匹配方法與系統在審
| 申請號: | 202110063608.9 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN112800196A | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 孫旭恩 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 青島清泰聯信知識產權代理有限公司 37256 | 代理人: | 李紅巖 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 孿生 網絡 faq 問答 匹配 方法 系統 | ||
本發明公開了一種基于孿生網絡的FAQ問答庫匹配方法與系統,所述方法包括:在嵌入層中使用預訓練的詞向量和字向量對輸入的兩個問句做聯合嵌入表示;在編碼層利用孿生網絡架構,使用兩個雙向的LSTM網絡,分別對問句進行上下文編碼,并進行特征提取,將LSTM網絡每一個時間步的隱藏層狀態值輸入至注意力層;在注意力層將隱藏層狀態值基于注意力機制進行加權求和,得到問句的語義表征向量;在特征融合層采用特征增強的方法將語義表征向量進行拼接,得到總的特征向量;在輸出層通過全連接層對總的特征向量做線性變換來轉換輸出的維度,最后通過softmax函數得到兩個問句的概率分布,輸出兩個問句的語義相似度。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種基于孿生網絡的FAQ問答庫匹配方法與系統。
背景技術
問答系統(Question Answering System,QA)是工業維修助手應用的重要功能,該功能旨在實現用準確、簡潔的自然語言回答用戶用自然語言提出的問題,維修助手通過QA模塊實現與用戶之間的信息交互,并對用戶提出的問題進行語義理解和解析,從而對用戶亟需解決的問題提供決策依據,最后利用知識庫查詢、推理并返回符合用戶當前意圖的解決方案。而FAQ(Frequently Asked Questions)模塊又是QA模型的一項重要的子功能,也稱作常見問答解答模塊,在FAQ知識庫中存儲了大量常見的維修問題與解決方案對,針對用戶提出的常見的維修問題,可以直接返回所需的答案,具有快捷、高效的特點。因此如何實現用戶提出的問題與FAQ知識庫中常見問題的有效匹配,是維修助手QA功能首要解決的問題,是整個QA功能的基石。
以汽修領域維修助手為例,首先對于用戶提出的問題,例如“內徑等于42mm的軸承有哪些”進行FAQ知識庫匹配,如果兩個問題的語義相似度達到一定的閾值,便直接返回FAQ知識庫中對應的解決方案,從而減少了繁瑣的人工操作,提高了檢修助手QA功能的工作效率。
現有FAQ模塊問句匹配的解決方案主要依靠兩種方式。第一種方法是通過文本距離等方式計算問句之間的相似性,第二種方法是利用向量模型來計算問句在向量空間上的差異性。
雖然基于文本距離來計算問句相似性的方法簡單易行,但是這種方法對于問句的順序和位置非常敏感,對于復雜語義的語句匹配準確性較差;而向量表示模型的方法往往局限于語料庫的規模和質量,對于具有相似語境的詞語區分度不高。
發明內容
本發明針對上述的問句匹配準確性差的技術問題,提出一種基于孿生網絡的FAQ問答庫匹配方法與系統。
第一方面,本申請實施例提供了一種基于孿生網絡的FAQ問答庫匹配方法,包括:
輸入步驟:在嵌入層中輸入兩個問句并對其進行處理,將處理完成后的所述問句中的詞向量和字向量融合后輸入至編碼層;
信息抽取步驟:在所述編碼層利用孿生網絡架構,使用兩個雙向的LSTM網絡,分別從所述問句的兩個方向對融合后的所述詞向量和所述字向量進行上下文編碼,并進行問句特征提取,將LSTM網絡每一個時間步的隱藏層狀態值輸入至注意力層;
語句加權步驟:在所述注意力層將所述隱藏層狀態值基于注意力機制進行加權求和,得到所述問句的語義表征向量,將所述語義表征向量輸入至特征融合層;
特征融合步驟:在所述特征融合層采用特征增強的方法將所述語義表征向量進行拼接,拼接后得到的特征向量輸入至輸出層;
輸出步驟:在所述輸出層通過全連接層對所述特征向量做線性變換來轉換輸出的維度,進而通過softmax函數得到兩個所述問句的概率分布,輸出兩個所述問句的語義相似度。
上述基于孿生網絡的FAQ問答庫匹配方法,其中,所述輸入步驟還包括:
處理步驟:對輸入的所述問句進行分詞處理和分字處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110063608.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電主軸和機床
- 下一篇:一種基于知識圖譜的安防應急措施自響應方法及系統





