[發(fā)明專利]煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202011070273.5 | 申請(qǐng)日: | 2020-10-09 |
| 公開(kāi)(公告)號(hào): | CN112115237A | 公開(kāi)(公告)日: | 2020-12-22 |
| 發(fā)明(設(shè)計(jì))人: | 張勝華;閆愛(ài)華;周俊;李琳;楊睿;陳一 | 申請(qǐng)(專利權(quán))人: | 湖北中煙工業(yè)有限責(zé)任公司 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/335;G06F40/247;G06N3/08 |
| 代理公司: | 浙江千克知識(shí)產(chǎn)權(quán)代理有限公司 33246 | 代理人: | 裴金華 |
| 地址: | 430000 湖北省*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 煙草 科技 文獻(xiàn) 數(shù)據(jù) 推薦 模型 構(gòu)建 方法 裝置 | ||
1.一種煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,包括:
從煙草科技文獻(xiàn)庫(kù)中采樣文獻(xiàn)數(shù)據(jù),得到訓(xùn)練數(shù)據(jù)集;
根據(jù)所述文獻(xiàn)數(shù)據(jù)的語(yǔ)義獲取對(duì)應(yīng)的關(guān)聯(lián)語(yǔ)句,通過(guò)所述關(guān)聯(lián)語(yǔ)句、文獻(xiàn)數(shù)據(jù)以及預(yù)設(shè)的正向標(biāo)注構(gòu)建正例標(biāo)注數(shù)據(jù);
通過(guò)預(yù)設(shè)的非關(guān)聯(lián)方法獲取與所述文獻(xiàn)數(shù)據(jù)不相關(guān)的非關(guān)聯(lián)文獻(xiàn)數(shù)據(jù),并通過(guò)所述關(guān)聯(lián)語(yǔ)句、非關(guān)聯(lián)文獻(xiàn)數(shù)據(jù)以及預(yù)設(shè)的負(fù)向標(biāo)注構(gòu)建負(fù)例標(biāo)注數(shù)據(jù);
將所述正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行模型訓(xùn)練,得到所述煙草科技的文獻(xiàn)數(shù)據(jù)的推薦模型。
2.根據(jù)權(quán)利要求1所述的煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,所述通過(guò)預(yù)設(shè)的非關(guān)聯(lián)方法獲取與所述文獻(xiàn)數(shù)據(jù)不相關(guān)的非關(guān)聯(lián)文獻(xiàn)數(shù)據(jù),包括:
從所述訓(xùn)練數(shù)據(jù)集中隨機(jī)抽取文獻(xiàn),通過(guò)預(yù)設(shè)的文本匹配方法計(jì)算所述關(guān)聯(lián)語(yǔ)句與所述隨機(jī)抽取文獻(xiàn)之間的匹配度;
當(dāng)所述匹配度低于預(yù)設(shè)值時(shí),將所述隨機(jī)抽取文獻(xiàn)作為與所述文獻(xiàn)數(shù)據(jù)不相關(guān)的非關(guān)聯(lián)文獻(xiàn)數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,所述將正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行模型訓(xùn)練之前,還包括:
檢測(cè)所述正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)的數(shù)據(jù)量是否達(dá)到預(yù)設(shè)的數(shù)據(jù)量標(biāo)準(zhǔn);
當(dāng)所述正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)的數(shù)據(jù)量未達(dá)到預(yù)設(shè)的數(shù)據(jù)量標(biāo)準(zhǔn)時(shí),重復(fù)構(gòu)建負(fù)例標(biāo)注數(shù)據(jù)的步驟直至所述正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)的數(shù)據(jù)量達(dá)到預(yù)設(shè)的數(shù)據(jù)量標(biāo)準(zhǔn)。
4.根據(jù)權(quán)利要求1所述的煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,所述從煙草科技文獻(xiàn)庫(kù)中采樣文獻(xiàn)數(shù)據(jù)之前,還包括:
獲取預(yù)設(shè)的數(shù)據(jù)權(quán)重表,根據(jù)所述數(shù)據(jù)權(quán)重表為所述從煙草科技文獻(xiàn)庫(kù)中的數(shù)據(jù)分配權(quán)重,得到權(quán)重分配后的煙草科技文獻(xiàn)庫(kù),所述煙草科技文獻(xiàn)庫(kù)的權(quán)重用于調(diào)整從所述煙草科技文獻(xiàn)庫(kù)中采樣時(shí)的采樣概率。
5.根據(jù)權(quán)利要求1所述的煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,所述關(guān)聯(lián)語(yǔ)句,包括:
關(guān)鍵詞、關(guān)鍵詞的同義詞、包含關(guān)鍵詞的語(yǔ)句。
6.據(jù)權(quán)利要求1所述的煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,所述將正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行模型訓(xùn)練,包括:
獲取搜索關(guān)鍵詞列表;
將所述正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)作為第一輸入,將所述搜索關(guān)鍵詞列表作為第二輸入,將所述第一輸入和所述第二輸入通過(guò)所述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。
7.根據(jù)權(quán)利要求1所述的煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法,其特征在于,所述得到所述煙草科技的文獻(xiàn)數(shù)據(jù)的推薦模型之后,還包括:
接收用戶輸入內(nèi)容,獲取所述輸入內(nèi)容中的待推薦關(guān)聯(lián)語(yǔ)句;
從所述訓(xùn)練數(shù)據(jù)集中隨機(jī)抽取文獻(xiàn)數(shù)據(jù),將所述待推薦關(guān)聯(lián)語(yǔ)句和所述文獻(xiàn)數(shù)據(jù)輸入至所述推薦模型,得到智能推薦結(jié)果候選集;
將所述智能推薦結(jié)果候選集中匹配概率小于預(yù)設(shè)閾值的結(jié)果刪除,并將剩余結(jié)果按照匹配概率從大到小的順序排列,得到智能推薦結(jié)果集。
8.一種煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建裝置,其特征在于,所述裝置包括:
采樣模塊,用于從煙草科技文獻(xiàn)庫(kù)中采樣文獻(xiàn)數(shù)據(jù),得到訓(xùn)練數(shù)據(jù)集;
第一獲取模塊,用于根據(jù)所述文獻(xiàn)數(shù)據(jù)的語(yǔ)義獲取對(duì)應(yīng)的關(guān)聯(lián)語(yǔ)句,通過(guò)所述關(guān)聯(lián)語(yǔ)句、文獻(xiàn)數(shù)據(jù)以及預(yù)設(shè)的正向標(biāo)注構(gòu)建正例標(biāo)注數(shù)據(jù);
第二獲取模塊,用于通過(guò)預(yù)設(shè)的非關(guān)聯(lián)方法獲取與所述文獻(xiàn)數(shù)據(jù)不相關(guān)的非關(guān)聯(lián)文獻(xiàn)數(shù)據(jù),并通過(guò)所述關(guān)聯(lián)語(yǔ)句、非關(guān)聯(lián)文獻(xiàn)數(shù)據(jù)以及預(yù)設(shè)的負(fù)向標(biāo)注構(gòu)建負(fù)例標(biāo)注數(shù)據(jù);
訓(xùn)練模塊,用于將所述正例標(biāo)注數(shù)據(jù)和所述負(fù)例標(biāo)注數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行模型訓(xùn)練,得到所述煙草科技的文獻(xiàn)數(shù)據(jù)的推薦模型。
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法的步驟。
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述煙草科技文獻(xiàn)數(shù)據(jù)推薦模型的構(gòu)建方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖北中煙工業(yè)有限責(zé)任公司,未經(jīng)湖北中煙工業(yè)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011070273.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于PageRank和時(shí)間衰減的科技文獻(xiàn)重要度評(píng)價(jià)方法
- 基于手機(jī)APP的科技信息服務(wù)查詢系統(tǒng)
- 一種科技情報(bào)信息管理系統(tǒng)
- 一種高校科技成果收集方法
- 一種表征科技專家成果能力的科技詞條抽取方法
- 一種科技成果轉(zhuǎn)化信息服務(wù)方法及系統(tǒng)
- 一種基于語(yǔ)義分析的科技成果入庫(kù)方法及系統(tǒng)
- 一種科技項(xiàng)目申報(bào)咨詢服務(wù)平臺(tái)
- 面向科技服務(wù)的知識(shí)圖譜構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種科技金融評(píng)估系統(tǒng)的構(gòu)建方法
- PDF科技文獻(xiàn)管理系統(tǒng)及其方法
- 建立新舊文獻(xiàn)代替關(guān)系的方法及裝置
- 一種自動(dòng)標(biāo)注文獻(xiàn)作廢的方法和裝置
- 一種新型的中文科技文獻(xiàn)半自動(dòng)標(biāo)引方法
- 文獻(xiàn)歸一方法、文獻(xiàn)搜索方法及對(duì)應(yīng)裝置
- 文獻(xiàn)價(jià)值評(píng)估方法和裝置
- 一種基于引用次數(shù)的文獻(xiàn)推薦方法
- 一種多語(yǔ)種文獻(xiàn)分類方法、裝置及存儲(chǔ)介質(zhì)
- 一種文獻(xiàn)標(biāo)簽的識(shí)別方法及裝置
- 一種基于文檔數(shù)據(jù)分析的在線文獻(xiàn)歸納和儲(chǔ)存系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





