[發(fā)明專利]超鏈的語義化方法、裝置、設備及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810720405.0 | 申請日: | 2018-07-03 |
| 公開(公告)號: | CN110737851B | 公開(公告)日: | 2022-09-09 |
| 發(fā)明(設計)人: | 馬宇峰;王曉元;沈璠;余韜 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡技術(shù)(北京)有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06Q30/06 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 方法 裝置 設備 計算機 可讀 存儲 介質(zhì) | ||
1.一種超鏈的語義化方法,其特征在于,包括:
獲取用戶訪問記錄日志;
根據(jù)所述用戶訪問記錄日志確定用戶訪問記錄的統(tǒng)一資源定位符URL;
根據(jù)所述URL在預設的站點知識庫中確定與用戶訪問記錄相對應的商品實體和業(yè)務流程;
其中,根據(jù)所述URL在預設的站點知識庫中確定與用戶訪問記錄相對應的商品實體,包括:
對所述URL進行特征化處理,獲取與所述URL相對應的特征集;
獲取所述特征集的每個鍵值;
根據(jù)所述鍵值確定所述URL中的可變部分;
根據(jù)所述可變部分在所述站點知識庫中確定與用戶訪問記錄相對應的商品實體;
所述根據(jù)所述鍵值確定所述URL中的可變部分,包括:
獲取與每個鍵值相對應的ID信息值;
若所述站點知識庫中存在與所述ID信息值相匹配的標準ID信息值,則確定與所述鍵值和ID信息值相對應的特征集部分為所述URL中的可變部分。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述鍵值確定所述URL中的可變部分,還包括:
獲取每個鍵值在所有取值下所對應的可泛化權(quán)重;
若所述可泛化權(quán)重小于預設的分界點權(quán)重,則確定與所述可泛化權(quán)重和鍵值相對應的特征集部分為所述URL中的可變部分。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述URL在預設的站點知識庫中確定與用戶訪問記錄相對應的業(yè)務流程,包括:
在所述站點知識庫中確定所述URL中的標題信息和與所述URL相對應的商品實體;
將所述標題信息中的商品實體進行移除操作,獲得目標URL;
對所述目標URL進行切詞處理,獲得與用戶訪問記錄相對應的業(yè)務流程。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對目標URL進行切詞處理,獲得與用戶訪問記錄相對應的業(yè)務流程,包括:
對經(jīng)過切詞處理后的目標URL進行特征化處理,獲取與所述目標URL相對應的特征集合;
獲取所述特征集合的每個特征鍵值;
根據(jù)所述特征鍵值獲取與用戶訪問記錄相對應的業(yè)務流程。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述特征鍵值獲取與用戶訪問記錄相對應的業(yè)務流程,包括:
獲取每個特征鍵值的純度,所述純度是根據(jù)每個特征鍵值所匹配到的業(yè)務流程數(shù)目計算得到的;
若所述純度大于或等于預設的純度閾值,則在所述站點知識庫內(nèi)查找一與所述特征鍵值相對應的標準特征鍵值以及與所述標準特征鍵值相對應的標準業(yè)務流程;
將所述標準業(yè)務流程確定為與用戶訪問記錄相對應的業(yè)務流程。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
若所述純度小于預設的純度閾值,則向用戶發(fā)送指示信息,以使用戶確認與用戶訪問記錄相對應的業(yè)務流程;或者,
若在所述站點知識庫中不存在與所述特征鍵值相匹配的標準特征鍵值,或者,在所述站點知識庫中存在多個與所述特征鍵值相匹配的標準特征鍵值,則向用戶發(fā)送指示信息,以使用戶確認與用戶訪問記錄相對應的業(yè)務流程。
7.一種超鏈的語義化裝置,其特征在于,包括:
獲取模塊,用于獲取用戶訪問記錄日志;
處理模塊,用于根據(jù)所述用戶訪問記錄日志確定用戶訪問記錄的統(tǒng)一資源定位符URL;
確定模塊,用于根據(jù)所述URL在預設的站點知識庫中確定與用戶訪問記錄相對應的商品實體和業(yè)務流程;
所述確定模塊,用于:
對所述URL進行特征化處理,獲取與所述URL相對應的特征集;
獲取所述特征集的每個鍵值;
根據(jù)所述鍵值確定所述URL中的可變部分;
根據(jù)所述可變部分在所述站點知識庫中確定與用戶訪問記錄相對應的商品實體;
所述確定模塊,用于:
獲取與每個鍵值相對應的ID信息值;
若所述站點知識庫中存在與所述ID信息值相匹配的標準ID信息值,則確定與所述鍵值和ID信息值相對應的特征集部分為所述URL中的可變部分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810720405.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





