[發明專利]基于人工智能的語義相似度獲取方法及裝置有效
| 申請號: | 201611042515.3 | 申請日: | 2016-11-21 |
| 公開(公告)號: | CN106776782B | 公開(公告)日: | 2020-05-22 |
| 發明(設計)人: | 周坤勝;何徑舟;石磊;馮仕堃;朱志凡 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F16/9535;G06F40/30 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 語義 相似 獲取 方法 裝置 | ||
1.一種基于人工智能的語義相似度獲取方法,其特征在于,包括:
獲取搜索詞與搜索條目的粒度特征;
基于所述搜索詞的每個粒度特征與所述搜索條目的粒度特征進行相似度計算,得到每個粒度特征對應的權重;
利用每個粒度特征對應的權重對所述搜索詞和所述搜索條目進行加權計算,得到所述搜索詞的粒度向量和所述搜索條目的粒度向量;
基于所述搜索詞的粒度向量和所述搜索條目的粒度向量,計算所述搜索詞與所述搜索條目之間的相似度。
2.根據權利要求1所述的基于人工智能的語義相似度獲取方法,其特征在于,所述獲取搜索詞與搜索條目的粒度特征,包括:
對所述搜索詞和所述搜索條目進行切詞,得到所述搜索詞和所述搜索條目的分詞語料;
利用神經網絡對所述分詞語料進行特征提取,得到所述搜索詞的粒度特征和所述搜索條目的粒度特征。
3.根據權利要求1所述的基于人工智能的語義相似度獲取方法,其特征在于,所述基于所述搜索詞的每個粒度特征與所述搜索條目的粒度特征進行相似度計算,得到每個粒度特征對應的權重,包括:
將所述搜索詞的每個粒度特征分別與所述搜索條目的同類型的粒度特征進行相似計算,得到每個粒度特征對應的權重。
4.根據權利要求3所述的基于人工智能的語義相似度獲取方法,其特征在于,所述將所述搜索詞的每個粒度特征分別與所述搜索條目的同類型的粒度特征進行相似計算得到每個粒度特征對應的權重,包括:
將所述搜索詞的每個粒度特征分別與所述搜索條目的同類型的粒度特征進行余弦相似度計算,得到每個粒度特征對應的權重。
5.根據權利要求4所述的基于人工智能的語義相似度獲取方法,其特征在于,所述利用每個粒度特征對應的權重對所述搜索詞和所述搜索條目進行加權計算,得到所述搜索詞的粒度向量和所述搜索條目的粒度向量,包括:
對每個粒度特征對應的權重進行歸一化處理,得到每個粒度對應的歸一化權重;
針對所述搜索詞和所述搜索條目,將每個粒度特征與對應的所述歸一化權重的乘積相加,得到所述搜索詞的粒度向量和所述搜索條目的粒度向量。
6.根據權利要求5所述的基于人工智能的語義相似度獲取方法,其特征在于,所述基于所述搜索詞的粒度向量和所述搜索條目的粒度向量,計算所述搜索詞與所述搜索條目之間的相似度,包括:
對所述搜索詞的每個粒度特征與所述搜索條目的粒度向量進行相似度計算得到第一權重,以及對所述搜索條目的每個粒度特征與所述搜索條目的粒度向量進行相似度計算得到第二權重;
將所述搜索詞的每個粒度特征與所述第一權重進行加權計算,并將所述搜索條目的每個粒度特征與所述第二權重進行加權計算;
利用加權計算的結果更新所述搜索詞的粒度向量和所述搜索條目的粒度向量;
對所述搜索詞的粒度向量和所述搜索條目的粒度向量的相似度進行計算,得到所述搜索詞和所述搜索條目之間的相似度。
7.根據權利要求6所述的基于人工智能的語義相似度獲取方法,其特征在于,所述利用加權計算的結果更新所述搜索詞的粒度向量和所述搜索條目的粒度向量之前,還包括:
對經過所述加權計算更新后的所述搜索詞的粒度向量和所述搜索條目的粒度向量,按照預設的迭代次數迭代執行所述對所述搜索詞的每個粒度特征與所述搜索條目的粒度向量進行相似度計算得到第一權重,以及對所述搜索條目的每個粒度特征與所述搜索條目的粒度向量進行相似度計算得到第二權重,以及將所述搜索詞的每個粒度特征與所述第一權重進行加權計算,并將所述搜索條目的每個粒度特征與所述第二權重進行加權計算,直到所述迭代次數完成為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611042515.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種人群關系網絡分析方法及裝置
- 下一篇:非結構化數據存儲管理方法和系統





