[發(fā)明專利]SEM關鍵詞生成方法、系統(tǒng)、設備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210061054.3 | 申請日: | 2022-01-19 |
| 公開(公告)號: | CN114385778A | 公開(公告)日: | 2022-04-22 |
| 發(fā)明(設計)人: | 葛萬峰;魯玲;周海燕 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/335;G06F16/35;G06F16/36;G06N3/08 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 馬濤;羅朗 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | sem 關鍵詞 生成 方法 系統(tǒng) 設備 存儲 介質(zhì) | ||
1.一種SEM關鍵詞生成方法,其特征在于,包括以下步驟:
獲取與目標產(chǎn)品對應的多條搜索文本;
針對每一條搜索文本,根據(jù)預設的分詞與屬性的對應關系,對所述搜索文本進行切詞,得到搜索分詞和與所述搜索分詞對應的第一屬性;
基于所述第一屬性生成與所述搜索文本對應的第一屬性序列;
獲取所述目標產(chǎn)品的產(chǎn)品文本;
基于所述產(chǎn)品文本、所述搜索分詞和第二屬性序列生成SEM關鍵詞,其中,所述第二屬性序列基于所述產(chǎn)品文本、所述搜索分詞和所述第一屬性序列得到。
2.根據(jù)權利要求1所述的SEM關鍵詞生成方法,其特征在于,所述基于所述產(chǎn)品文本、所述搜索分詞和第二屬性序列生成SEM關鍵詞的步驟包括:
判斷所述產(chǎn)品文本是否存在直接對應的產(chǎn)品分詞和第二屬性,若是,則獲取所述產(chǎn)品分詞和所述第二屬性;否則根據(jù)預設的分詞與屬性的對應關系,對所述產(chǎn)品文本進行切詞得到所述產(chǎn)品分詞和與所述產(chǎn)品分詞對應的第二屬性;
從所述第一屬性序列中篩選第二屬性序列,其中,所述第二屬性序列中所包含的第一屬性覆蓋所述第二屬性;
根據(jù)所述第二屬性序列的屬性順序,分別將與所述第二屬性序列的屬性對應的所述搜索分詞和所述產(chǎn)品分詞進行拼接,生成SEM關鍵詞;
和/或,所述基于所述產(chǎn)品文本、所述搜索分詞和第二屬性序列生成SEM關鍵詞的步驟之前還包括對所述第一屬性序列和所述搜索分詞進行預篩選;
所述對所述第一屬性序列和所述搜索分詞進行預篩選的步驟包括:
分別統(tǒng)計所述第一屬性序列的數(shù)量;
篩選數(shù)量最多的N個第一屬性序列,其中,N為正整數(shù);
分別統(tǒng)計N個第一屬性序列中每個第一屬性下的所述搜索分詞的數(shù)量;
篩選數(shù)量最多的K個搜索分詞,其中,K為正整數(shù)。
3.根據(jù)權利要求1所述的SEM關鍵詞生成方法,其特征在于,所述對所述搜索文本進行切詞,得到搜索分詞和與所述搜索分詞對應的第一屬性的步驟包括:
利用第一切詞流程和/或第二切詞流程對所述搜索文本進行切詞;
其中,所述第一切詞流程包括:
構建字典,所述字典包括屬性和與所述屬性對應的分詞;
遍歷所述字典的分詞,對所述搜索文本進行一一匹配以得到所述搜索分詞;
從所述字典中獲取與所述搜索分詞對應的第一屬性;
所述第二切詞流程包括:
通過預先訓練的神經(jīng)網(wǎng)絡模型獲取所述搜索文本中各漢字對應的屬性標識;
對所述屬性標識進行聚類分析得到第一屬性;
根據(jù)所述第一屬性對所述搜索文本進行切詞以得到所述搜索分詞。
4.根據(jù)權利要求3所述的SEM關鍵詞生成方法,其特征在于,當利用第一切詞流程和第二切詞流程對所述搜索文本進行切詞時,所述對所述搜索文本進行切詞的步驟之后還包括:
分別統(tǒng)計利用所述第一切詞流程得到的所述第一屬性的第一數(shù)量和利用所述第二切詞流程得到的所述第一屬性的第二數(shù)量;
判斷所述第一數(shù)量是否不小于所述第二數(shù)量,若是,則保留利用第一切詞流程得到的所述第一屬性和所述搜索分詞;否則保留利用第二切詞流程得到的所述第一屬性和所述搜索分詞。
5.一種SEM關鍵詞生成系統(tǒng),其特征在于,所述SEM關鍵詞生成系統(tǒng)包括第一獲取模塊、切詞模塊、第一生成模塊、第二獲取模塊和第二生成模塊:
所述第一獲取模塊用于獲取與目標產(chǎn)品對應的多條搜索文本;
所述切詞模塊用于針對每一條搜索文本,根據(jù)預設的分詞與屬性的對應關系,對所述搜索文本進行切詞,得到搜索分詞和與所述搜索分詞對應的第一屬性;
所述第一生成模塊用于基于所述第一屬性生成與所述搜索文本對應的第一屬性序列;
所述第二獲取模塊用于獲取所述目標產(chǎn)品的產(chǎn)品文本;
所述第二生成模塊用于基于所述產(chǎn)品文本、所述搜索分詞和第二屬性序列生成SEM關鍵詞,其中,所述第二屬性序列基于所述產(chǎn)品文本、所述搜索分詞和所述第一屬性序列得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經(jīng)攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210061054.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





