[發(fā)明專(zhuān)利]用于生成文本模板的方法、裝置、設(shè)備和計(jì)算機(jī)可讀介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201811324881.7 | 申請(qǐng)日: | 2018-11-08 |
| 公開(kāi)(公告)號(hào): | CN110162753B | 公開(kāi)(公告)日: | 2022-12-13 |
| 發(fā)明(設(shè)計(jì))人: | 繆暢宇;譚翊章;田樂(lè) | 申請(qǐng)(專(zhuān)利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F40/295 | 分類(lèi)號(hào): | G06F40/295;G06F40/186 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 王娟 |
| 地址: | 518057 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 生成 文本 模板 方法 裝置 設(shè)備 計(jì)算機(jī) 可讀 介質(zhì) | ||
1.一種用于生成文本模板的方法,包括:
對(duì)于語(yǔ)料庫(kù)中每個(gè)語(yǔ)料,將該語(yǔ)料中的實(shí)體名替換為該實(shí)體名對(duì)應(yīng)的類(lèi)別名,以生成初始文本模板;
將所述初始文本模板的至少一個(gè)單詞替換為相似詞,以獲得候選文本模板;
在所述候選文本模板滿(mǎn)足第一預(yù)設(shè)條件的情況下,將所述候選文本模板確定為擴(kuò)充文本模板;以及
利用所述初始文本模板和所述擴(kuò)充文本模板生成所述文本模板,
所述方法還包括:
將所述文本模板中的類(lèi)別名替換為實(shí)體名,以確定候選語(yǔ)料;
在所述候選語(yǔ)料滿(mǎn)足第二預(yù)設(shè)條件的情況下,將所述候選語(yǔ)料確定為擴(kuò)充語(yǔ)料;以及
將所述擴(kuò)充語(yǔ)料加入所述語(yǔ)料庫(kù)。
2.根據(jù)權(quán)利要求1所述的方法,其中,
所述第一預(yù)設(shè)條件包括:所述候選文本模板的困惑度小于預(yù)設(shè)的第一困惑度閾值;以及
所述第二預(yù)設(shè)條件包括:所述候選語(yǔ)料的困惑度小于預(yù)設(shè)的第二困惑度閾值。
3.根據(jù)權(quán)利要求2所述的方法,其中所述候選文本模板的困惑度是通過(guò)根據(jù)所述初始文本模板確定的第一語(yǔ)言模型確定的,所述候選語(yǔ)料的困惑度是通過(guò)根據(jù)所述語(yǔ)料庫(kù)中的語(yǔ)料確定的第二語(yǔ)言模型確定的。
4.根據(jù)權(quán)利要求3所述的方法,其中,將所述初始文本模板的至少一個(gè)單詞替換為相似詞包括:
基于所述初始文本模板中的至少一個(gè)單詞的詞向量確定所述相似詞。
5.根據(jù)權(quán)利要求4所述的方法,其中所述相似詞包括該單詞的一度相似詞和二度相似詞,所述一度相似詞是通過(guò)該單詞的詞向量確定的與該單詞最相似的N個(gè)單詞,其中N是大于等于1的正整數(shù),所述二度相似詞是該單詞的一度相似詞的一度相似詞。
6.根據(jù)權(quán)利要求4或5所述的方法,其中所述詞向量是根據(jù)所述第一語(yǔ)言模型或所述第二語(yǔ)言模型確定的。
7.一種用于生成文本模板的裝置,包括:
初始文本模板確定單元,配置成對(duì)于語(yǔ)料庫(kù)中每個(gè)語(yǔ)料,將該語(yǔ)料中的實(shí)體名替換為該實(shí)體名對(duì)應(yīng)的類(lèi)別名,以生成初始文本模板;
候選文本模板確定單元,配置成將所述初始文本模板的至少一個(gè)單詞替換為相似詞,以獲得候選文本模板;
擴(kuò)充文本模板確定單元,配置成在所述候選文本模板滿(mǎn)足第一預(yù)設(shè)條件的情況下,將所述候選文本模板確定為擴(kuò)充文本模板;以及
文本模板生成單元,配置成利用所述初始文本模板和所述擴(kuò)充文本模板生成所述文本模板,
所述裝置還包括:
候選語(yǔ)料確定單元,配置成將所述文本模板中的類(lèi)別名替換為實(shí)體名,以確定候選語(yǔ)料;
擴(kuò)充語(yǔ)料確定單元,配置成在所述候選語(yǔ)料滿(mǎn)足第二預(yù)設(shè)條件的情況下,將所述候選語(yǔ)料確定為擴(kuò)充語(yǔ)料;以及
語(yǔ)料庫(kù)擴(kuò)充單元,配置成利用所述擴(kuò)充語(yǔ)料擴(kuò)充所述語(yǔ)料庫(kù)。
8.根據(jù)權(quán)利要求7所述的裝置,其中,
所述第一預(yù)設(shè)條件包括:所述候選文本模板的困惑度小于預(yù)設(shè)的第一困惑度閾值;以及
所述第二預(yù)設(shè)條件包括:所述候選語(yǔ)料的困惑度小于預(yù)設(shè)的第二困惑度閾值。
9.根據(jù)權(quán)利要求8所述的裝置,其中所述候選文本模板的困惑度是通過(guò)根據(jù)所述初始文本模板確定的第一語(yǔ)言模型確定的,所述候選語(yǔ)料的困惑度是通過(guò)根據(jù)所述語(yǔ)料庫(kù)中的語(yǔ)料確定的第二語(yǔ)言模型確定的。
10.根據(jù)權(quán)利要求9所述的裝置,其中,所述候選文本模板確定單元還配置成:
基于所述初始文本模板中的至少一個(gè)單詞的詞向量確定所述相似詞。
11.一種用于生成文本模板的設(shè)備,所述設(shè)備包括存儲(chǔ)有程序指令的存儲(chǔ)器和至少一個(gè)處理器,當(dāng)運(yùn)行所述程序指令時(shí),所述至少一個(gè)處理器配置成執(zhí)行根據(jù)權(quán)利要求1-6之一所述的方法。
12.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有指令,所述指令在被處理器執(zhí)行時(shí),使得所述處理器執(zhí)行根據(jù)權(quán)利要求1-6之一所述的方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811324881.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





