[發(fā)明專利]一種關鍵詞標記方法和裝置有效
| 申請?zhí)枺?/td> | 201711252344.1 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN110069669B | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設計)人: | 劉志敏;朱昌磊;葉祺;王峰;李剛 | 申請(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/903;G06F16/33;G06F16/9535 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 郭化雨;王寶筠 |
| 地址: | 100084 北京市海淀區(qū)中關*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關鍵詞 標記 方法 裝置 | ||
1.一種關鍵詞標記方法,其特征在于,所述方法包括:
獲取待標記關鍵詞;
根據(jù)所述待標記關鍵詞與根據(jù)所述待標記關鍵詞所打開搜索頁面間的對應關系,將所述待標記關鍵詞添加到二部圖中,所述二部圖包括關鍵詞與根據(jù)關鍵詞所打開搜索頁面間的對應關系,所述二部圖中包括的關鍵詞已標記了標記分布;
將目標關鍵詞的標記分布向量在所述二部圖中進行傳播,得到所述待標記關鍵詞的標記分布向量;所述目標關鍵詞為所述二部圖中與根據(jù)所述待標記關鍵詞所打開搜索頁面具有對應關系的關鍵詞,所述目標關鍵詞的標記分布向量為根據(jù)所述目標關鍵詞已標記的標記分布構(gòu)建的;
根據(jù)所述待標記關鍵詞的標記分布向量確定所述待標記關鍵詞的標記。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述獲取待標記關鍵詞之后,所述方法還包括:
判斷所述待標記關鍵詞是否具有與根據(jù)所述待標記關鍵詞所打開搜索頁面間的對應關系;
若沒有,對所述待標記關鍵詞進行分詞處理,得到多個分詞;
若所述多個分詞中具有與所述二部圖中關鍵詞相同的分詞,根據(jù)所述二部圖中與所述多個分詞部分或全部相同的關鍵詞的標記分布確定所述待標記關鍵詞的標記分布。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在所述二部圖的關鍵詞與根據(jù)關鍵詞所打開搜索頁面間的對應關系中,還包括根據(jù)關鍵詞所打開搜索頁面的打開次數(shù),所述將目標關鍵詞的標記分布向量在所述二部圖中進行傳播,得到所述待標記關鍵詞的標記分布向量,包括:
在所述目標關鍵詞的標記分布向量進行傳播時,將根據(jù)關鍵詞所打開搜索頁面的打開次數(shù)作為計算權(quán)重計算所述待標記關鍵詞的標記分布向量。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述方法還包括:
對所述二部圖中的關鍵詞進行分詞,其中,任一個關鍵詞的分詞具有與根據(jù)這個關鍵詞所打開搜索頁面間的對應關系,以及具有這個關鍵詞的標記分布;
在分詞后的所述二部圖進行關鍵詞的標記分布向量的傳播。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述待標記關鍵詞的標記分布向量確定所述待標記關鍵詞的標記,包括:
判斷所述待標記關鍵詞的標記分布向量中各維度標記的分布概率;
將分布概率滿足預設條件的標記作為所述待標記關鍵詞的標記。
6.一種關鍵詞標記裝置,其特征在于,所述裝置包括獲取單元、添加單元、傳播單元和確定單元:
所述獲取單元,用于獲取待標記關鍵詞;
所述添加單元,用于根據(jù)所述待標記關鍵詞與根據(jù)所述待標記關鍵詞所打開搜索頁面間的對應關系,將所述待標記關鍵詞添加到二部圖中,所述二部圖包括關鍵詞與根據(jù)關鍵詞所打開搜索頁面間的對應關系,所述二部圖中包括的關鍵詞已標記了標記分布;
所述傳播單元,用于將目標關鍵詞的標記分布向量在所述二部圖中進行傳播,得到所述待標記關鍵詞的標記分布向量;所述目標關鍵詞為所述二部圖中與根據(jù)所述待標記關鍵詞所打開搜索頁面具有對應關系的關鍵詞,所述目標關鍵詞的標記分布向量為根據(jù)所述目標關鍵詞已標記的標記分布構(gòu)建的;
所述確定單元,用于根據(jù)所述待標記關鍵詞的標記分布向量確定所述待標記關鍵詞的標記。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括判斷單元:
所述判斷單元,用于判斷所述待標記關鍵詞是否具有與根據(jù)所述待標記關鍵詞所打開搜索頁面間的對應關系;
若沒有,對所述待標記關鍵詞進行分詞處理,得到多個分詞;
若所述多個分詞中具有與所述二部圖中關鍵詞相同的分詞,觸發(fā)所述確定單元,所述確定單元還用于根據(jù)所述二部圖中與所述多個分詞部分或全部相同的關鍵詞的標記分布確定所述待標記關鍵詞的標記分布。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711252344.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





