[發明專利]關鍵詞拓詞的方法及裝置有效
| 申請號: | 201611063473.1 | 申請日: | 2016-11-25 |
| 公開(公告)號: | CN108108379B | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 葛婷 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/289;G06F40/242 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 葛聰慧;王寶筠 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞 方法 裝置 | ||
1.一種關鍵詞拓詞的方法,其特征在于,所述方法包括:
獲取預設行業的已有關鍵詞;
對所述已有關鍵詞進行分詞獲得單詞;
從預設詞典中查找所述單詞的詞性,所述預設詞典包括詞匯與詞性的對應關系;
根據所述單詞的詞性確定所述已有關鍵詞的詞性結構模式,所述詞性結構模式包括所述單詞的詞性以及所述單詞的詞性的排列順序;
獲取所述預設行業的詞匯;其中,所述預設行業為已經投放過所述已有關鍵詞的行業;
采用所述詞性結構模式對所述預設行業的詞匯進行組合生成所述預設行業的新關鍵詞,使得所述新關鍵詞的詞性結構模式與所述已有關鍵詞的詞性結構模式相同;
所述獲取所述預設行業的詞匯,采用所述詞性結構模式生成所述預設行業的新關鍵詞包括:
從所述預設行業的詞匯中獲取符合所述詞性結構模式中所述單詞的詞性的詞匯作為備選詞;
按照所述詞性結構模式中所述單詞的詞性的排列順序對所述備選詞進行組合生成所述預設行業的新關鍵詞。
2.根據權利要求1所述的方法,其特征在于,所述預設詞典包括預設基本詞典和預設行業詞典,所述從預設詞典中查找所述單詞的詞性包括:
從所述預設基本詞典中查找所述單詞的基本詞性,并且從所述預設行業詞典中查找所述單詞的行業詞性,所述預設基本詞典包括詞匯與基本詞性的對應關系,所述預設行業詞典包括詞匯與所述預設行業的行業詞性的對應關系;
當從所述預設行業詞典中查找到所述單詞的行業詞性時,將所述單詞的基本詞性和行業詞性設置為所述單詞的詞性;從所述預設行業詞典中沒有查找到所述單詞的行業詞性時,將所述單詞的基本詞性設置為所述單詞的詞性。
3.根據權利要求1所述的方法,其特征在于,所述預設詞典包括預設基本詞典和預設行業詞典,所述從預設詞典中查找所述單詞的詞性包括:
從所述預設行業詞典中查找所述單詞的行業詞性,所述預設行業詞典包括詞匯與所述預設行業的行業詞性的對應關系,當從所述預設行業詞典中查找到所述單詞的行業詞性時,將所述行業詞性作為所述單詞的詞性;
當從所述預設行業詞典中沒有查找到所述單詞的行業詞性時,從所述預設基本詞典中查找所述單詞的基本詞性,將所述基本詞性作為所述單詞的詞性。
4.根據權利要求1-3任意一項所述的方法,其特征在于,所述對所述已有關鍵詞進行分詞獲得單詞包括:
根據所述預設行業詞典對所述已有關鍵詞進行分詞獲得單詞。
5.根據權利要求1-3任意一項所述的方法,其特征在于,所述獲取所述預設行業的詞匯包括:
獲取從網絡爬取的所述預設行業的詞匯;
和/或,
獲取預先存儲的所述預設行業的詞匯。
6.一種關鍵詞拓詞裝置,其特征在于,所述裝置包括:
第一獲取單元,用于獲取預設行業的已有關鍵詞;
分詞單元,用于對所述已有關鍵詞進行分詞獲得單詞;
查找單元,用于從預設詞典中查找所述單詞的詞性,所述預設詞典包括詞匯與詞性的對應關系;
確定單元,用于根據所述單詞的詞性確定所述已有關鍵詞的詞性結構模式,所述詞性結構模式包括所述單詞的詞性以及所述單詞的詞性的排列順序;
第二獲取單元,用于獲取所述預設行業的詞匯;其中,所述預設行業為已經投放過所述已有關鍵詞的行業;
生成單元,用于采用所述詞性結構模式對所述預設行業的詞匯進行組合生成所述預設行業的新關鍵詞,使得所述新關鍵詞的詞性結構模式與所述已有關鍵詞的詞性結構模式相同;
所述生成單元包括:
第一獲取子單元,用于從所述預設行業的詞匯中獲取符合所述詞性結構模式中所述單詞的詞性的詞匯作為備選詞;
生成子單元,用于按照所述詞性結構模式中所述單詞的詞性的排列順序對所述備選詞進行組合生成所述預設行業的新關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611063473.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據對象庫存信息處理方法及裝置
- 下一篇:頁面的監測方法及裝置





