[發(fā)明專利]一種信息處理方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201910976749.2 | 申請(qǐng)日: | 2019-10-15 |
| 公開(公告)號(hào): | CN110717029A | 公開(公告)日: | 2020-01-21 |
| 發(fā)明(設(shè)計(jì))人: | 康潮明 | 申請(qǐng)(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號(hào): | G06F16/335 | 分類號(hào): | G06F16/335;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 51253 成都七星天知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人: | 袁春曉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 原始關(guān)鍵詞 關(guān)鍵詞集合 文本 機(jī)器學(xué)習(xí)模型 統(tǒng)計(jì)結(jié)果 信息處理 文本庫 預(yù)設(shè) 檢索 統(tǒng)計(jì) | ||
1.一種信息處理方法,包括:
獲取原始關(guān)鍵詞;
根據(jù)所述原始關(guān)鍵詞得到關(guān)鍵詞集合,所述關(guān)鍵詞集合包括所述原始關(guān)鍵詞在內(nèi)的至少一個(gè)關(guān)鍵詞;
基于所述關(guān)鍵詞集合中的關(guān)鍵詞從預(yù)設(shè)文本庫中檢索出一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)文本;
用機(jī)器學(xué)習(xí)模型處理一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)文本,得到一個(gè)或多個(gè)關(guān)鍵詞的興趣成分;
統(tǒng)計(jì)在所述一個(gè)或多個(gè)關(guān)鍵詞的興趣成分中各興趣成分出現(xiàn)的頻次,根據(jù)統(tǒng)計(jì)結(jié)果確定所述原始關(guān)鍵詞的興趣成分。
2.根據(jù)權(quán)利要求1所述的信息處理方法,所述根據(jù)所述原始關(guān)鍵詞得到關(guān)鍵詞集合包括:
確定所述原始關(guān)鍵詞的至少一個(gè)同義詞;
根據(jù)所述原始關(guān)鍵詞和所述至少一個(gè)同義詞構(gòu)建所述關(guān)鍵詞集合。
3.根據(jù)權(quán)利要求1或2所述的信息處理方法,所述根據(jù)所述原始關(guān)鍵詞得到關(guān)鍵詞集合包括:
獲取多個(gè)候選詞;
確定所述原始關(guān)鍵詞和每個(gè)候選詞的詞向量;
根據(jù)所述原始關(guān)鍵詞和每個(gè)候選詞的詞向量確定每個(gè)候選詞與所述原始關(guān)鍵詞的相似度;
從所述多個(gè)候選詞中選出與所述原始關(guān)鍵詞的相似度滿足設(shè)定條件的至少一個(gè)候選詞;
根據(jù)所述原始關(guān)鍵詞和所選出的至少一個(gè)候選詞構(gòu)建所述關(guān)鍵詞集合。
4.根據(jù)權(quán)利要求1所述的信息處理方法,所述機(jī)器學(xué)習(xí)模型為以下中的一種:
長短期記憶和條件隨機(jī)場模型;
條件隨機(jī)場模型;或
隱馬爾可夫模型。
5.根據(jù)權(quán)利要求1所述的信息處理方法,所述興趣成分包括利益成分,所述利益成分用于指示其對(duì)應(yīng)的關(guān)鍵詞攜帶利益信息。
6.根據(jù)權(quán)利要求1所述的信息處理方法,所述根據(jù)統(tǒng)計(jì)結(jié)果確定所述原始關(guān)鍵詞的興趣成分包括:
將在所述一個(gè)或多個(gè)關(guān)鍵詞的興趣成分中出現(xiàn)的頻次最大的興趣成分確定為所述原始關(guān)鍵詞的興趣成分。
7.一種信息處理系統(tǒng),包括:
原始關(guān)鍵詞獲取模塊,用于獲取原始關(guān)鍵詞;
關(guān)鍵詞集合獲取模塊,用于根據(jù)所述原始關(guān)鍵詞得到關(guān)鍵詞集合,所述關(guān)鍵詞集合包括所述原始關(guān)鍵詞在內(nèi)的至少一個(gè)關(guān)鍵詞;
文本檢索模塊,用于基于所述關(guān)鍵詞集合中的關(guān)鍵詞從預(yù)設(shè)文本庫中檢索出一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)文本;
關(guān)鍵詞興趣成分獲取模塊,用于用機(jī)器學(xué)習(xí)模型處理一個(gè)或多個(gè)關(guān)鍵詞對(duì)應(yīng)文本,得到一個(gè)或多個(gè)關(guān)鍵詞的興趣成分;
關(guān)鍵詞興趣成分確定模塊,用于統(tǒng)計(jì)在所述一個(gè)或多個(gè)關(guān)鍵詞的興趣成分中各興趣成分出現(xiàn)的頻次,根據(jù)統(tǒng)計(jì)結(jié)果確定所述原始關(guān)鍵詞的興趣成分。
8.根據(jù)權(quán)利要求7所述的信息處理系統(tǒng),所述關(guān)鍵詞集合獲取模塊包括:
同義詞確定單元,用于確定所述原始關(guān)鍵詞的至少一個(gè)同義詞;
關(guān)鍵詞集合構(gòu)建單元,用于根據(jù)所述原始關(guān)鍵詞和所述至少一個(gè)同義詞構(gòu)建所述關(guān)鍵詞集合。
9.根據(jù)利要求7或8所述的信息處理系統(tǒng),所述關(guān)鍵詞集合獲取模塊包括:
候選詞獲取單元,用于獲取多個(gè)候選詞;
詞向量確定單元,用于確定所述原始關(guān)鍵詞和每個(gè)候選詞的詞向量;
相似度確定單元,用于根據(jù)所述原始關(guān)鍵詞和每個(gè)候選詞的詞向量確定每個(gè)候選詞與所述原始關(guān)鍵詞的相似度;
候選詞篩選單元,用于從所述多個(gè)候選詞中選出與所述原始關(guān)鍵詞的相似度滿足設(shè)定條件的至少一個(gè)候選詞;
關(guān)鍵詞集合構(gòu)建單元,用于根據(jù)所述原始關(guān)鍵詞和所選出的至少一個(gè)候選詞構(gòu)建所述關(guān)鍵詞集合。
10.根據(jù)權(quán)利要求7所述的信息處理系統(tǒng),所述機(jī)器學(xué)習(xí)模型為以下中的一種:
長短期記憶和條件隨機(jī)場模型;
條件隨機(jī)場模型;或
隱馬爾可夫模型。
11.根據(jù)權(quán)利要求7所述的信息處理系統(tǒng),所述興趣成分包括利益成分,所述利益成分用于指示其對(duì)應(yīng)的關(guān)鍵詞攜帶利益信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910976749.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 詞典數(shù)據(jù)更新方法及系統(tǒng)、儲(chǔ)存媒體及計(jì)算機(jī)程序產(chǎn)品
- 一種基于關(guān)鍵詞的檢索方法和系統(tǒng)
- 確定關(guān)鍵詞的方法和裝置
- 關(guān)鍵詞的分析方法和裝置
- 關(guān)聯(lián)詞調(diào)整方法及調(diào)整系統(tǒng)
- 關(guān)聯(lián)詞調(diào)整方法及調(diào)整系統(tǒng)
- 一種信息處理方法和系統(tǒng)
- 關(guān)鍵詞提取方法、關(guān)鍵詞提取裝置及電子設(shè)備
- 行業(yè)關(guān)鍵詞提取方法及裝置
- 一種信息檢索方法、裝置、設(shè)備及介質(zhì)
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 自動(dòng)建立關(guān)鍵詞索引表的方法
- 關(guān)鍵詞推薦方法及裝置
- 用于推送關(guān)鍵詞的方法、裝置以及設(shè)備
- 關(guān)鍵詞推薦方法、裝置、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 基于重點(diǎn)關(guān)鍵詞的關(guān)鍵詞拓展方法和裝置
- 關(guān)鍵詞規(guī)則生成方法及裝置和電子設(shè)備
- 關(guān)鍵詞廣告投放自動(dòng)化否定關(guān)鍵詞方法及裝置
- 用于處理信息的方法和裝置
- 一種關(guān)鍵詞推薦的方法、相關(guān)裝置以及存儲(chǔ)介質(zhì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 機(jī)器學(xué)習(xí)模型之間進(jìn)行轉(zhuǎn)換的方法與設(shè)備
- 在多個(gè)機(jī)器學(xué)習(xí)任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)模型
- 用于訓(xùn)練機(jī)器學(xué)習(xí)模型的方法及系統(tǒng)
- 機(jī)器學(xué)習(xí)模型解釋方法以及裝置
- 用于機(jī)器學(xué)習(xí)模型的并行化坐標(biāo)下降法
- 一種機(jī)器學(xué)習(xí)模型的生成方法、裝置
- 模型配置方法、裝置、電子設(shè)備及可讀取存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)模型處理方法及節(jié)點(diǎn)
- 模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
- 管理應(yīng)用的方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





