[發明專利]信息輸出方法和裝置在審
| 申請號: | 201810018641.8 | 申請日: | 2018-01-09 |
| 公開(公告)號: | CN110110199A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 安旭;安偉佳;汪雷;李雪 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100080 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選物品 向量 詞向量 候選句 加權 目標物品 方法和裝置 信息對應 信息集合 信息輸出 詞轉換 匹配度 查詢請求 順序選取 物品信息 成功率 匹配 輸出 響應 申請 | ||
1.一種信息輸出方法,包括:
響應于接收到包括目標物品信息的查詢請求,獲取候選物品信息集合;
將所述目標物品信息中的每個詞轉換成詞向量,并將所述目標物品信息對應的各個詞向量組成目標句向量;
對于所述候選物品信息集合中的每個候選物品信息,將該候選物品信息中的每個詞轉換成詞向量,并將該候選物品信息對應的各個詞向量組成該候選物品信息的候選句向量;
確定所述目標物品信息和各候選物品信息中的每個詞的類別,并獲取各類別對應的權重;
根據詞的類別對所述目標句向量和各候選物品信息的候選句向量進行加權,并確定加權后的目標句向量與加權后的各候選物品信息的候選句向量之間的匹配度;
按照匹配度由大到小的順序選取預定數目個加權后的候選句向量,并輸出所選取的加權后的候選句向量對應的候選物品信息。
2.根據權利要求1所述的方法,其中,所述根據詞的類別對所述目標句向量和各候選物品信息的候選句向量進行加權,包括:
根據所述目標物品信息中的每個詞的類別對應的權重分別對所述目標句向量中的每個詞向量進行加權,并生成加權后的目標句向量;
對于每個候選物品信息,根據該候選物品信息中的每個詞的類別對應的權重分別對該候選句向量中的每個詞向量進行加權,并生成該候選物品信息的加權后的候選句向量。
3.根據權利要求1所述的方法,其中,所述確定所述目標物品信息和各候選物品信息中的每個詞的類別,并獲取各類別對應的權重,包括:
將所述目標物品信息中的每個詞和各候選物品信息中的每個詞與預設的類別詞集合進行匹配以確定出每個詞的類別;
對于每個類別,獲取所述目標物品信息和各候選物品信息中該類別詞的詞頻-逆文本頻率作為該類別的權重。
4.根據權利要求1所述的方法,其中,所述確定所述目標物品信息和各候選物品信息中的每個詞的類別,并獲取各類別對應的權重,包括:
將所述目標物品信息中的每個詞和各候選物品信息中的每個詞與預設的特征詞集合進行匹配以確定出匹配的至少一個特征詞;
對于所述至少一個特征詞中每個特征詞,確定該特征詞所屬的類別,并根據該特征詞所屬的類別查找預設的權重表中的權重作為該特征詞的權重,其中,所述權重表用于表征類別與權重之間的對應關系;
對于所述目標物品信息中與所述特征詞集合不匹配的每個詞和各候選物品信息中與所述特征詞集合不匹配的每個詞,獲取該詞的詞頻-逆文本頻率作為該詞的權重。
5.根據權利要求4所述的方法,其中,所述方法還包括生成權重表的步驟,包括:
獲取至少一對樣本句向量,其中,每個樣本句向量是由樣本物品信息中的每個樣本詞生成的樣本詞向量組成的,并且每對樣本句向量之間的余弦相似度大于預設相似度閾值;
將各樣本詞進行分類,并為每個類別的樣本詞設置該類別對應的權重;
對于所述至少一對樣本句向量中每對樣本句向量,根據所設置的權重對該樣本句向量中每個樣本詞向量進行加權;
根據加權后的所述至少一對樣本句向量中每對樣本句向量之間的余弦相似度構造代價函數;
通過梯度下降法求解所述代價函數中的各類別對應的權重,并根據樣本詞的類別與求解出的權重的對應關系生成權重表。
6.根據權利要求5所述的方法,其中,所述通過梯度下降法求解所述代價函數中的各類別對應的權重,包括:
對于每個類別對應的權重,將該權重確定為第一權重并設置權重變化量,執行如下迭代步驟:根據所述第一權重和所述權重變化量之和確定所述代價函數的第一損失;根據所述第一權重和所述權重變化量之差確定所述代價函數的第二損失;根據所述第一損失和所述第二損失確定梯度方向;根據所述梯度方向確定梯度值,并根據所述梯度值、所述第一權重和預設的步長確定第二權重;若所述第二權重與所述第一權重之差小于預定權重變化閾值,則將所述第二權重確定為該類別對應的權重;
若所述第二權重與所述第一權重之差不小于預定權重變化閾值或執行迭代步驟的次數達到預定迭代次數閾值,則將所述第二權重與所述第一權重之差作為權重變化量,將所述第二權重作為第一權重繼續執行上述迭代步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810018641.8/1.html,轉載請聲明來源鉆瓜專利網。





