[發明專利]話題生成方法、裝置、存儲介質和電子設備有效
| 申請號: | 202011052743.5 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN111897965B | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 郭林森;曹雪智;謝睿;王仲遠 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/295;G06F40/35 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 話題 生成 方法 裝置 存儲 介質 電子設備 | ||
本公開涉及一種話題生成方法、裝置、存儲介質和電子設備,所述方法包括:獲取用戶生成內容對應的語料數據;根據所述語料數據確定至少一種場景詞信息,其中,每種所述場景詞信息包括多個場景詞,用于表征所述語料數據的一個目標場景;針對每種所述場景詞信息,確定與所述場景詞信息對應的話題模板,其中,所述話題模板包括多個詞填充位,每一所述詞填充位分別對應于一種場景詞的屬性;根據所述話題模板和所述場景詞信息,生成所述目標場景對應的目標話題。因此,一方面可以有效節省用戶的操作,另一方面可以保證確定出目標話題與用戶生成內容之間的匹配性和適應性,提供確定出的目標話題的覆蓋范圍,拓寬該話題使用方法的適用范圍。
技術領域
本公開涉及計算機技術領域,具體地,涉及一種話題生成方法、裝置、存儲介質和電子設備。
背景技術
話題,也稱話題標簽(hashtag),常應用于社交媒體中,使用同一話題的內容會基于該話題自動聚合到一起,使得用戶可以圍繞同一個話題進行相關內容的討論。
現有技術中可使用的話題通常是基于以下方式生成的:
第一種,用戶編輯內容時,手動輸入話題并進行內容關聯。這種情況下不同的用戶即使是針對同一話題中心點發表內容,但可能會因為不同用戶的表述習慣而添加不同的話題標簽,該話題可關聯的內容有限,局限性較大。
第二種,可以根據用戶手動輸入的話題標簽,通過自定義規則或機器學習的方式生成新的話題,該類方法所需模板依賴于大量的先驗知識,成本較高,難以快速有效地進行遷移。
發明內容
本公開的目的是提供一種話題生成方法、裝置、存儲介質和電子設備,以提高話題生成的簡便性、可用性和全面性。
為了實現上述目的,本公開提供一種話題生成方法,所述方法包括:
獲取用戶生成內容對應的語料數據;
根據所述語料數據確定至少一種場景詞信息,其中,每種所述場景詞信息包括多個場景詞,用于表征所述語料數據的一個目標場景;
針對每種所述場景詞信息,確定與所述場景詞信息對應的話題模板,其中,所述話題模板包括多個詞填充位,每一所述詞填充位分別對應于一種場景詞的屬性;
根據所述話題模板和所述場景詞信息,生成所述目標場景對應的目標話題。
可選地,所述根據所述話題模板和所述場景詞信息,生成所述目標場景對應的目標話題,包括:
根據所述場景詞信息中每一場景詞的屬性,將所述場景詞添加至所述話題模板中該屬性對應的詞填充位,獲得候選話題;
確定每一所述候選話題的匹配參數,其中,所述匹配參數用于表征該候選話題與所述目標場景的匹配程度;
根據所述匹配參數確定所述目標話題。
可選地,所述方法還包括:
在當前時刻滿足模板挖掘時段要求或者接收到模板挖掘指令的情況下,根據所述語料數據中的場景詞,確定話題場景詞組合;
針對每一所述話題場景詞組合,從所述語料數據中確定包含該話題場景詞組合中的全部場景詞的屬性的話題語句;用所述場景詞的屬性來標識所述話題語句中該場景詞對應的詞填充位,以獲得候選模板;通過模板分類模型對所述候選模板進行分類,并根據分類結果確定新挖掘的話題模板;存儲所述新挖掘的話題模板;
所述確定與所述場景詞信息對應的話題模板,包括:
從存儲的話題模板中,將包含所述場景詞信息中的全部場景詞的屬性的話題模板確定為與所述場景詞信息對應的話題模板。
可選地,所述根據所述語料數據確定至少一種場景詞信息,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011052743.5/2.html,轉載請聲明來源鉆瓜專利網。





