[發明專利]基于多語義的集外詞處理方法、智能問答方法及裝置在審

申請號：	201810556386.2	申請日：	2018-06-01
公開（公告）號：	CN108763217A	公開（公告）日：	2018-11-06
發明（設計）人：	楊凱程;李健銓;蔣宏飛	申請（專利權）人：	北京玄一科技有限公司
主分類號：	G06F17/27	分類號：	G06F17/27;G06F17/30
代理公司：	北京弘權知識產權代理事務所(普通合伙) 11363	代理人：	逯長明;許偉群
地址：	100012 北京市朝陽區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語義詞向量智能問答系統語義向量權重應答句子方案生成語義環境關聯度好感度求和準確率句義加權申請匹配對話表現
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于多語義的集外詞處理方法，其特征在于，包括：

根據集外詞在句子中的上下詞，獲取集外詞的每個語義的權重；所述上下詞包括集外詞在句子中的至少一個前序分詞和至少一個后序分詞；

根據每個語義中義原的詞向量，生成每個語義的語義向量；

根據每個語義的權重，對每個語義的語義向量加權求和，生成仿真詞向量。

2.根據權利要求1所述的方法，其特征在于，所述根據集外詞在句子中的上下詞，獲取集外詞的每個語義的權重的步驟，包括：

獲取集外詞在句子中的上下詞；

獲取所述上下詞與每個語義的第一類距離；

根據所述第一類距離，計算每個語義的權重。

3.根據權利要求2所述的方法，其特征在于，所述獲取上下詞與每個語義的第一類距離的步驟，包括：

獲取所述上下詞的每個分詞與每個語義中每個義原的余弦距離；

根據所述余弦距離，獲取所述上下詞的每個分詞與每個語義中所有義原的平均距離；

根據所述平均距離，獲取所述上下詞與每個語義的第一類距離。

4.根據權利要求2所述的方法，其特征在于，所述根據所述第一類距離，計算每個語義的權重的步驟，使用以下公式：

其中，n為集外詞語義的數量，Wm為集外詞第m個語義的權重，Dm為所述上下詞與集外詞第m個語義的第一類距離，為集外詞所有語義的第一類距離的和。

5.根據權利要求1所述的方法，其特征在于，所述根據每個語義中義原的詞向量，生成每個語義的語義向量的步驟，包括：

獲取集外詞的每個語義中每個義原的義原詞向量；

根據每個語義中義原的數量，對每個語義中的每個義原設置義原權重；

根據所述義原權重，對每個語義中義原的詞向量進行加權求和，生成每個語義的語義向量。

6.根據權利要求2所述的方法，其特征在于，所述獲取集外詞在句子中的上下詞的步驟，包括：

設置用于約束所述上下詞數量的取詞窗口值C，C為整數且大于或等于1；

根據所述取詞窗口值C，從包含所述集外詞的句子的分詞中獲取所述上下詞；

其中，所述上下詞包括句子中位于所述集外詞前序的C個分詞和后序的C個分詞。

7.根據權利要求5所述的方法，其特征在于，

所述根據每個語義中義原的數量，對每個語義中的每個義原設置義原權重，使用以下公式：

Wp＝1/x

其中，Wp為義原權重，x為語義中義原的數量。

8.一種智能問答方法，其特征在于，應用于權利要求1-7任一所述的方法，包括：

從未知問題的分詞結果中獲取集外詞；

基于所述集外詞的多語義，生成所述集外詞的仿真詞向量；

根據所述仿真詞向量和所述問題中其余分詞的詞向量，從已訓練的問答模型中匹配問題答案。

9.一種基于多語義的集外詞處理裝置，其特征在于，包括：

語義權重獲取單元，用于根據集外詞在句子中的上下詞，獲取集外詞的每個語義的權重；所述上下詞包括集外詞在句子中的至少一個前序分詞和至少一個后序分詞；

語義向量生成單元，用于根據每個語義中義原的詞向量，生成每個語義的語義向量；

仿真詞向量生成單元，用于根據每個語義的權重，對每個語義的語義向量加權求和，生成仿真詞向量。

10.一種智能問答裝置，其特征在于，應用于權利要求1-7任一所述的方法，包括：

集外詞獲取單元，用于從未知問題的分詞結果中獲取集外詞；

集外詞處理單元，用于基于所述集外詞的多語義，生成所述集外詞的仿真詞向量；

作答單元，用于根據所述仿真詞向量和所述問題中其余分詞的詞向量，從已訓練的問答模型中匹配問題答案。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京玄一科技有限公司，未經北京玄一科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810556386.2/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種基于中文數據集的文本情感分析方法
下一篇：一種基于CRF的影視檢索實體識別方法

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F17-00 特別適用于特定功能的數字計算設備或數據處理設備或數據處理方法
G06F17-10 .復雜數學運算的
G06F17-20 .處理自然語言數據的
G06F17-30 .信息檢索；及其數據庫結構
G06F17-40 .數據的獲取和記錄
G06F17-50 .計算機輔助設計

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】

[發明專利]基于多語義的集外詞處理方法、智能問答方法及裝置在審

專利文獻下載

[發明專利]基于多語義的集外詞處理方法、智能問答方法及裝置在審