[發明專利]基于多語義的集外詞處理方法及裝置有效
| 申請號: | 201811498210.2 | 申請日: | 2018-12-07 |
| 公開(公告)號: | CN109614618B | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 楊凱程;李健銓;蔣宏飛 | 申請(專利權)人: | 安徽省泰岳祥升軟件有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/284;G06F16/332;G06F16/33 |
| 代理公司: | 北京弘權知識產權代理有限公司 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 230088 安徽省合肥市高新區習友路333*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 集外詞 處理 方法 裝置 | ||
本申請實施例提供了一種基于多語義的集外詞處理方法及裝置。所述方法包括:根據集外詞在句子中的上下詞,獲取集外詞的每個語義的權重;根據每個語義中義原的詞向量,生成每個語義的語義向量;根據每個語義的權重,對每個語義的語義向量加權求和,生成仿真詞向量。本申請提供的技術方案生成的仿真詞向量,能夠實現在匹配句子句義的同時,兼顧到集外詞的其他語義,使仿真詞向量所表達的語義更豐富飽滿,適應更豐富的語義環境;當仿真詞向量用于智能交互系統中時,能夠使應答與問題的關聯度高,提高應答準確率,并適應更豐富的對話環境,使智能問答系統表現的更智能,極大地提高用戶好感度,解決了現有技術中的集外詞問題。
本申請要求在2018年6月1日提交中國專利局、申請號為201810556386.2、發明名稱為“基于多語義的集外詞處理方法、智能問答方法及裝置”的中國專利申請的優先權,其全部內容通過引用結合在本申請中。
技術領域
本申請涉及自然語言處理技術領域,尤其涉及一種基于多語義的集外詞處理方法及裝置。
背景技術
隨著自然語言處理技術的發展,基于自然語言處理技術建立起來的對話系統也得到了廣泛的應用,常用的對話系統例如聊天機器人,能夠根據用戶輸入的聊天內容,自動生成相應地應答。
現有技術中,對話系統根據不同的應答方法可分為基于知識庫的檢索式對話系統和基于深度學習模型的生成式對話系統。其中,基于深度學習模型的對話系統,通過建立一個基于RNN(遞歸神經網絡:Recurrent?Neural?Networks)的對話模型,并使用該模型進行大量的語料訓練,使對話模型能夠從問答對中學習到對未知對話的潛在應答模式,從而其回答內容不僅局限于訓練語料中已有的知識。
基于深度學習模型的對話系統在進行語料訓練和語料應答時,以詞向量為操作對象,詞向量是對語料中分詞的一種數學化的表達形式。詞向量在深度學習中的貢獻是:通過將兩個詞向量計算余弦夾角或歐氏距離,能夠得到兩個分詞的距離,兩個分詞的距離越小,表示兩個分詞的相似度越高。在對話系統的訓練過程中,會根據訓練語料生成包含已知分詞詞向量的詞向量空間;在對話系統的應答過程中,根據問題分詞的詞向量與已知分詞的詞向量之間的距離,并結合機器學習的算法生成問題的應答內容。
但是,基于語料訓練得到的詞向量空間對于專業領域的業務術語、方言詞匯、外文、組合詞的包含能力較差,因此,在問題內容不受限的開放式對話系統中,對話系統經常會遇到集外詞(OOV:out-of-vocabulary),是指詞向量空間中未包含的分詞。當對話系統遇到包含集外詞的問題時,其給出應答內容的準確率就會下降,這種情況被稱為集外詞(OOV)問題。目前,現有技術對集外詞問題缺乏有效的解決辦法。
發明內容
本申請實施例提供了一種基于多語義的集外詞處理方法及裝置,以解決現有技術中存在的問題。
第一方面,本申請實施例提供了一種基于多語義的集外詞處理方法,包括:
根據集外詞在句子中的上下詞,獲取集外詞的每個語義的權重;所述上下詞包括集外詞在句子中的至少一個前序分詞和至少一個后序分詞;
根據每個語義中義原的詞向量,生成每個語義的語義向量;
根據每個語義的權重,對每個語義的語義向量加權求和,生成仿真詞向量。
第二方面,本申請實施例提供了一種智能問答方法,應用于本申請實施例提供的基于多語義的集外詞處理方法,包括:
從未知問題的分詞結果中獲取集外詞;
基于所述集外詞的多語義,生成所述集外詞的仿真詞向量;
根據所述仿真詞向量和所述問題中其余分詞的詞向量,從已訓練的問答模型中匹配問題答案。
第三方面,本申請實施例提供了一種基于多語義的集外詞處理裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽省泰岳祥升軟件有限公司,未經安徽省泰岳祥升軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811498210.2/2.html,轉載請聲明來源鉆瓜專利網。





