[發(fā)明專(zhuān)利]一種關(guān)鍵詞確定方法、裝置、終端及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910501917.2 | 申請(qǐng)日: | 2019-06-11 |
| 公開(kāi)(公告)號(hào): | CN110263335A | 公開(kāi)(公告)日: | 2019-09-20 |
| 發(fā)明(設(shè)計(jì))人: | 楚國(guó)慶;朱旭琪;閆剛;金竹;孫瑛瑛;劉洋 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京清博大數(shù)據(jù)科技有限公司 |
| 主分類(lèi)號(hào): | G06F17/27 | 分類(lèi)號(hào): | G06F17/27;G06F17/22;G06F16/33 |
| 代理公司: | 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11411 | 代理人: | 蘇友娟 |
| 地址: | 100044 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 詞組 特征關(guān)鍵詞 關(guān)鍵詞確定 刪除 存儲(chǔ)介質(zhì) 文章集合 預(yù)設(shè) 相似度計(jì)算 終端 排序 關(guān)鍵詞組 輸出目標(biāo) 相似度 全網(wǎng) 還原 檢索 | ||
本發(fā)明公開(kāi)了一種關(guān)鍵詞確定方法、裝置、終端及存儲(chǔ)介質(zhì),包括:刪除第一特征詞組中第一個(gè)特征關(guān)鍵詞生成當(dāng)前第二特征詞組,以所述當(dāng)前第二特征詞組作為關(guān)鍵詞進(jìn)行全網(wǎng)檢索,得到第二文章集合;將所述第二文章集合中排序前預(yù)設(shè)數(shù)量的文章與第一文章集合中排序前預(yù)設(shè)數(shù)量的文章進(jìn)行相似度計(jì)算或者將其與所述目標(biāo)文章進(jìn)行相似度計(jì)算;若所述相似度超過(guò)預(yù)設(shè)閾值則刪除所述當(dāng)前第二特征詞組的第一個(gè)特征關(guān)鍵詞作為新的第二特征詞組,否則,將所述刪除的特征關(guān)鍵詞還原,依次刪除下一個(gè)特征關(guān)鍵詞作為新的第二特征詞組,直至循環(huán)至最后一個(gè)特征關(guān)鍵詞,輸出目標(biāo)關(guān)鍵詞組。本發(fā)明提供的關(guān)鍵詞確定方法、裝置、終端及存儲(chǔ)介質(zhì),能夠準(zhǔn)確地定位關(guān)鍵詞。
技術(shù)領(lǐng)域
本發(fā)明涉及關(guān)鍵詞確定技術(shù)領(lǐng)域,特別涉及一種關(guān)鍵詞確定方法、裝置、終端及存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)有的比較典型的文章關(guān)鍵詞提取方法是將文本分詞然后提取特征詞,根據(jù)特定規(guī)則分別計(jì)算特征詞的權(quán)重,然后按特征詞的權(quán)重排序提取文章的特征關(guān)鍵詞。對(duì)于新聞工作者來(lái)說(shuō)他們需要精準(zhǔn)匹配目標(biāo)文章,這種方法獲取的文章特征關(guān)鍵詞不夠精準(zhǔn),不能夠準(zhǔn)確定位目標(biāo)文章。
發(fā)明內(nèi)容
本發(fā)明提供一種關(guān)鍵詞確定方法、裝置、終端及存儲(chǔ)介質(zhì),能夠比較準(zhǔn)確地定位關(guān)鍵詞。
第一方面,本發(fā)明實(shí)施例提供了一種關(guān)鍵詞確定方法,包括:
刪除第一特征詞組中第一個(gè)特征關(guān)鍵詞生成當(dāng)前第二特征詞組,以所述當(dāng)前第二特征詞組作為關(guān)鍵詞進(jìn)行全網(wǎng)檢索,得到第二文章集合,所述第二文章集合中的文章根據(jù)其與目標(biāo)文章的相似度進(jìn)行排序,所述第一特征詞組由所述目標(biāo)文章中的特征關(guān)鍵詞組成;
將所述第二文章集合中排序前預(yù)設(shè)數(shù)量的文章與第一文章集合中排序前預(yù)設(shè)數(shù)量的文章進(jìn)行相似度計(jì)算或者將其與所述目標(biāo)文章進(jìn)行相似度計(jì)算,其中,所述第一文章集合由所述第一特征詞組作為關(guān)鍵詞進(jìn)行全網(wǎng)檢索得到,所述第一文章集合中的文章根據(jù)其與所述目標(biāo)文章的相似度進(jìn)行排序;
若所述相似度超過(guò)預(yù)設(shè)閾值則刪除所述當(dāng)前第二特征詞組的第一個(gè)特征關(guān)鍵詞作為新的第二特征詞組,否則,將所述刪除的特征關(guān)鍵詞還原,依次刪除下一個(gè)特征關(guān)鍵詞作為新的第二特征詞組,直至循環(huán)至最后一個(gè)特征關(guān)鍵詞,輸出目標(biāo)關(guān)鍵詞組。
優(yōu)選地,還包括步驟:對(duì)目標(biāo)文章進(jìn)行分詞處理,得到分詞結(jié)果,在所述分詞結(jié)果中提取特征關(guān)鍵詞。
優(yōu)選地,所述第一文章集合為與所述目標(biāo)文章相似度從高到低排序的文章構(gòu)成的集合,所述第二文章集合為與所述目標(biāo)文章相似度從高到低排序的文章構(gòu)成的集合。
優(yōu)選地,所述將所述第二文章集合中排序前預(yù)設(shè)數(shù)量的文章與第一文章集合中排序前預(yù)設(shè)數(shù)量的文章進(jìn)行相似度計(jì)算,具體為:分別對(duì)所述第二文章集合和所述第一文章集合中排序位置對(duì)應(yīng)的文章進(jìn)行相似度計(jì)算,將得到的相似度結(jié)果取平均值。
第二方面,本發(fā)明實(shí)施例提供了一種關(guān)鍵詞確定裝置,包括:
第二文章集合獲取模塊,用于刪除第一特征詞組中第一個(gè)特征關(guān)鍵詞生成當(dāng)前第二特征詞組,以所述當(dāng)前第二特征詞組作為關(guān)鍵詞進(jìn)行全網(wǎng)檢索,得到第二文章集合,所述第二文章集合中的文章根據(jù)其與目標(biāo)文章的相似度進(jìn)行排序,所述第一特征詞組由所述目標(biāo)文章中的特征關(guān)鍵詞組成;
相似度計(jì)算模塊,用于將所述第二文章集合中排序前預(yù)設(shè)數(shù)量的文章與第一文章集合中排序前預(yù)設(shè)數(shù)量的文章進(jìn)行相似度計(jì)算或者將其與所述目標(biāo)文章進(jìn)行相似度計(jì)算,其中,所述第一文章集合由所述第一特征詞組作為關(guān)鍵詞進(jìn)行全網(wǎng)檢索得到,所述第一文章集合中的文章根據(jù)其與所述目標(biāo)文章的相似度進(jìn)行排序;
目標(biāo)關(guān)鍵詞組確定模塊,用于在所述相似度超過(guò)預(yù)設(shè)閾值則刪除所述當(dāng)前第二特征詞組的第一個(gè)特征關(guān)鍵詞作為新的第二特征詞組,否則,將所述刪除的特征關(guān)鍵詞還原,依次刪除下一個(gè)特征關(guān)鍵詞作為新的第二特征詞組,直至循環(huán)至最后一個(gè)特征關(guān)鍵詞,輸出目標(biāo)關(guān)鍵詞組。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京清博大數(shù)據(jù)科技有限公司,未經(jīng)北京清博大數(shù)據(jù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910501917.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 廣告關(guān)鍵詞提取方法和裝置
- 關(guān)鍵詞提取方法和裝置
- 一種數(shù)據(jù)查詢(xún)方法、裝置和可讀介質(zhì)
- 用于提取關(guān)鍵詞的方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 關(guān)鍵詞區(qū)分方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 文本關(guān)鍵詞提取方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種基于主題語(yǔ)義感知的特征關(guān)鍵詞提取方法
- 一種基于歷史關(guān)鍵詞投放數(shù)據(jù)的關(guān)鍵詞構(gòu)建方法及系統(tǒng)
- 語(yǔ)音關(guān)鍵詞識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別方法、裝置、終端和存儲(chǔ)介質(zhì)





