[發(fā)明專利]標(biāo)題生成方法、訓(xùn)練方法、裝置、電子設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010989342.6 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112149408B | 公開(公告)日: | 2022-11-08 |
| 發(fā)明(設(shè)計)人: | 郝卓琳 | 申請(專利權(quán))人: | 北京有竹居網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06F40/258 | 分類號: | G06F40/258;G06F40/242;G06F40/216;G06N3/08 |
| 代理公司: | 北京中知法苑知識產(chǎn)權(quán)代理有限公司 11226 | 代理人: | 李明 |
| 地址: | 101299 北京市平*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)題 生成 方法 訓(xùn)練 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┝艘环N標(biāo)題生成方法、訓(xùn)練方法、裝置、電子設(shè)備和存儲介質(zhì),其中,該方法包括:獲取為目標(biāo)標(biāo)題設(shè)置的關(guān)鍵詞句,其中,所述關(guān)鍵詞句包括:關(guān)鍵詞或關(guān)鍵語句;將所述關(guān)鍵詞句作為概率預(yù)測模型的輸入?yún)?shù),利用所述概率預(yù)測模型得到目標(biāo)字典中的各個字符在所述關(guān)鍵詞句兩側(cè)的各預(yù)設(shè)位置上的概率,其中,各所述預(yù)設(shè)位置為設(shè)置在所述關(guān)鍵詞句兩側(cè)的各字符位置;根據(jù)所述概率,從所述目標(biāo)字典中選擇出目標(biāo)字符;根據(jù)所述目標(biāo)字符和所述關(guān)鍵詞句的位置關(guān)系,生成所述目標(biāo)標(biāo)題,通過上述方法可以在只輸入關(guān)鍵詞句的情況下就可以得到目標(biāo)標(biāo)題,因此有利于降低用戶在投放媒體內(nèi)容時的投放難度。
技術(shù)領(lǐng)域
本申請涉及計算機(jī)技術(shù)領(lǐng)域,具體而言,涉及一種標(biāo)題生成方法、訓(xùn)練方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
在通過媒體內(nèi)容投放平臺投放媒體內(nèi)容(如:廣告和文章等)之前,需要先獲得媒體內(nèi)容,其中,媒體內(nèi)容包括媒體內(nèi)容標(biāo)題和媒體內(nèi)容正文,媒體內(nèi)容投放平臺在獲得一個完整的媒體內(nèi)容后,可以將該媒體內(nèi)容投放給用戶端,該媒體內(nèi)容在用戶端展示時,只展示媒體內(nèi)容標(biāo)題,用戶可以根據(jù)媒體內(nèi)容標(biāo)題中的內(nèi)容確定是否打開該媒體內(nèi)容,以查看該媒體內(nèi)容中的媒體內(nèi)容正文。
在現(xiàn)有技術(shù)中,用戶可以通過自己的用戶端選擇向其他用戶端投放媒體內(nèi)容,但是這種方式需要用戶自己提供媒體內(nèi)容標(biāo)題,從而增加了用戶在投放媒體內(nèi)容時的投放難度。
發(fā)明內(nèi)容
有鑒于此,本申請實(shí)施例提供了一種標(biāo)題生成方法、訓(xùn)練方法、裝置、電子設(shè)備和存儲介質(zhì),以降低用戶投放媒體內(nèi)容時的投放難度。
第一方面,本申請實(shí)施例提供了一種標(biāo)題生成方法,包括:
獲取為目標(biāo)標(biāo)題設(shè)置的關(guān)鍵詞句,其中,所述關(guān)鍵詞句包括:關(guān)鍵詞或關(guān)鍵語句;
將所述關(guān)鍵詞句作為概率預(yù)測模型的輸入?yún)?shù),利用所述概率預(yù)測模型得到目標(biāo)字典中的各個字符在所述關(guān)鍵詞句兩側(cè)的各預(yù)設(shè)位置上的概率,其中,各所述預(yù)設(shè)位置為設(shè)置在所述關(guān)鍵詞句兩側(cè)的各字符位置;
根據(jù)所述概率,從所述目標(biāo)字典中選擇出目標(biāo)字符;
根據(jù)所述目標(biāo)字符和所述關(guān)鍵詞句的位置關(guān)系,生成所述目標(biāo)標(biāo)題。
可選地,所述將所述關(guān)鍵詞句作為概率預(yù)測模型的輸入?yún)?shù),利用所述概率預(yù)測模型得到目標(biāo)字典中的各個字符在所述關(guān)鍵詞句兩側(cè)的各預(yù)設(shè)位置上的概率,包括:
對所述關(guān)鍵詞句進(jìn)行切字處理,得到所述關(guān)鍵詞句包括的各個字符;
查詢所述關(guān)鍵詞句包括的各個字符在所述目標(biāo)字典中對應(yīng)的第一身份標(biāo)識ID;
將所述第一ID作為輸入?yún)?shù)輸入到transformer模型,得到所述目標(biāo)字典中的各個字符在所述關(guān)鍵詞句兩側(cè)的各預(yù)設(shè)位置上的概率。
可選地,根據(jù)所述概率,從所述目標(biāo)字典中選擇出目標(biāo)字符,包括:
根據(jù)各所述預(yù)設(shè)位置在所述目標(biāo)標(biāo)題中與所述關(guān)鍵詞句由小到大的間距順序,從所述目標(biāo)字典中依次確定所述目標(biāo)字符;
其中,所述目標(biāo)標(biāo)題中與所述關(guān)鍵詞句間距最小的目標(biāo)字符依據(jù)概率采樣,以及所述關(guān)鍵詞句中與所述間距最小的目標(biāo)字符相鄰的字符的語義確定,所述目標(biāo)標(biāo)題中的其他目標(biāo)字符依據(jù)概率采樣,以及與該目標(biāo)字符相鄰的所述目標(biāo)標(biāo)題中已確定的字符的語義確定。
可選地,所述概率預(yù)測模型是通過使用元素對應(yīng)的樣本標(biāo)題和該元素作為訓(xùn)練樣本進(jìn)行訓(xùn)練后得到的,其中,所述元素為一元組至N元組包括的元素,一元組包括的元素為所述樣本標(biāo)題包括的各個詞語,二元組包括的元素為所述樣本標(biāo)題包括的各個詞語中相鄰的兩個詞語構(gòu)成的語句,三元組包括的元素為所述樣本標(biāo)題包括的各個詞語中相鄰的三個詞語構(gòu)成的語句,以此類推,N等于所述樣本標(biāo)題包括的詞語的數(shù)量,一元組至N元組是通過對所述樣本標(biāo)題進(jìn)行切詞處理后,由得到的各個詞語構(gòu)建的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京有竹居網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京有竹居網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010989342.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于人工智能的文章標(biāo)題生成方法、裝置、設(shè)備及介質(zhì)
- 一種相同新聞信息的歸類方法及系統(tǒng)
- 一種新聞主副標(biāo)題檢測方法及裝置
- 標(biāo)題識別方法及裝置
- 用于真產(chǎn)品詞識別的系統(tǒng)、方法和計算機(jī)可讀介質(zhì)
- 一種文檔系統(tǒng)的側(cè)邊欄展示方法及系統(tǒng)
- 一種文檔標(biāo)題層級的分析方法、裝置及服務(wù)器
- 一種文章標(biāo)題優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備
- 一種文本標(biāo)注方法、裝置、設(shè)備及可讀存儲介質(zhì)
- 數(shù)據(jù)標(biāo)識方法、裝置、計算機(jī)可讀存儲介質(zhì)及電子設(shè)備





