[發(fā)明專利]基于直播場景的對話數(shù)據(jù)集構(gòu)建方法及裝置在審
| 申請?zhí)枺?/td> | 202211534448.2 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN115544237A | 公開(公告)日: | 2022-12-30 |
| 發(fā)明(設(shè)計)人: | 高景盛;連怡鑫;王寶元 | 申請(專利權(quán))人: | 北京紅棉小冰科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/211;G06F40/284;G06F40/30 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 謝志超 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 直播 場景 對話 數(shù)據(jù) 構(gòu)建 方法 裝置 | ||
1.一種基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,包括:
基于主播直播視頻的用戶評論,獲取所述用戶評論發(fā)表后預(yù)設(shè)時間內(nèi)文本格式的主播講話內(nèi)容;
將所述主播講話內(nèi)容中的句子和所述用戶評論進(jìn)行匹配,獲取與所述用戶評論具有重疊詞匯的句子;
計算所述與所述用戶評論具有重疊詞匯的句子與所述用戶評論之間的語義相似度,根據(jù)所述語義相似度獲取針對所述用戶評論的主播回復(fù);
根據(jù)所述用戶評論和所述主播回復(fù)構(gòu)建對話數(shù)據(jù)集。
2.根據(jù)權(quán)利要求1所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,所述根據(jù)所述語義相似度獲取針對所述用戶評論的主播回復(fù),包括:
將所述語義相似度介于第一閾值和第二閾值之間且取值最大時對應(yīng)的所述與所述用戶評論具有重疊詞匯的句子作為所述主播回復(fù);其中,所述第二閾值大于所述第一閾值。
3.根據(jù)權(quán)利要求2所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,在所述根據(jù)所述語義相似度獲取針對所述用戶評論的主播回復(fù)之前,所述方法還包括:
響應(yīng)于所述與所述用戶評論具有重疊詞匯的句子中包含預(yù)設(shè)冗余詞匯,計算所述句子去除所述預(yù)設(shè)冗余詞匯后與所述用戶評論的語義相似度;
響應(yīng)于所述語義相似度大于所述第二閾值,去除相應(yīng)所述與所述用戶評論具有重疊詞匯的句子。
4.根據(jù)權(quán)利要求1所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,在所述基于主播直播視頻的用戶評論,獲取所述用戶評論發(fā)表后預(yù)設(shè)時間內(nèi)文本格式的主播講話內(nèi)容之前,所述方法還包括:
獲取所述直播場景下的主播直播視頻;
根據(jù)所述主播直播視頻得到主播直播音頻;
通過語音識別模型對所述主播直播音頻進(jìn)行語音識別得到所述文本格式的主播講話內(nèi)容。
5.根據(jù)權(quán)利要求1至4任一所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,所述方法還包括:
以所述用戶評論作為預(yù)訓(xùn)練的語言模型的輸入值,以所述主播回復(fù)作為輸出的真實值,根據(jù)所述預(yù)訓(xùn)練的語言模型的輸出值和所述真實值計算損失,不斷迭代訓(xùn)練所述預(yù)訓(xùn)練的語言模型,得到第一對話模型。
6.根據(jù)權(quán)利要求1所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,所述方法還包括:
獲取主播的預(yù)設(shè)基本人物特征及直播場景下的預(yù)設(shè)直播人物特征,得到主播人物特征;
將所述主播人物特征添加到所述對話數(shù)據(jù)集。
7.根據(jù)權(quán)利要求6所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,所述預(yù)設(shè)基本人物特征包括性別、年齡、工作、性格、喜好、習(xí)慣中的至少一種;
所述預(yù)設(shè)直播人物特征包括直播風(fēng)格、直播內(nèi)容、直播才藝、直播目標(biāo)、直播間人群中的至少一種。
8.根據(jù)權(quán)利要求6或7所述的基于直播場景的對話數(shù)據(jù)集構(gòu)建方法,其特征在于,所述方法還包括:
以所述用戶評論和所述主播人物特征作為預(yù)訓(xùn)練的語言模型的輸入值,以所述主播回復(fù)作為輸出的真實值,根據(jù)所述預(yù)訓(xùn)練的語言模型的輸出值和所述真實值計算損失,不斷迭代訓(xùn)練所述預(yù)訓(xùn)練的語言模型,得到第二對話模型。
9.一種基于直播場景的對話數(shù)據(jù)集構(gòu)建裝置,其特征在于,包括:
第一獲取模塊,用于:基于主播直播視頻的用戶評論,獲取所述用戶評論發(fā)表后預(yù)設(shè)時間內(nèi)文本格式的主播講話內(nèi)容;
第二獲取模塊,用于:將所述主播講話內(nèi)容中的句子和所述用戶評論進(jìn)行匹配,獲取與所述用戶評論具有重疊詞匯的句子;
第三獲取模塊,用于:計算所述與所述用戶評論具有重疊詞匯的句子與所述用戶評論之間的語義相似度,根據(jù)所述語義相似度獲取針對所述用戶評論的主播回復(fù);
構(gòu)建模塊,用于:根據(jù)所述用戶評論和所述主播回復(fù)構(gòu)建對話數(shù)據(jù)集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京紅棉小冰科技有限公司,未經(jīng)北京紅棉小冰科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211534448.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





