[發明專利]話題切換標記方法、裝置及計算機設備有效
| 申請號: | 202110846455.5 | 申請日: | 2021-07-26 |
| 公開(公告)號: | CN113505596B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 熊為星 | 申請(專利權)人: | 深圳市優必選科技股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06F40/30 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 梁韜 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 話題 切換 標記 方法 裝置 計算機 設備 | ||
本申請實施例提供了一種話題切換標記方法、裝置及計算機設備,其中方法包括:將每個對話內的多個連續交互的聊天語句進行詞語分割;根據每個對話分割出的詞語所屬的話題類別,統計每個對話所涉及的話題切換方向及切換頻次,其中,話題切換方向涉及源話題和切換后的目標話題;篩選全部對話的話題切換方向中,切換頻次滿足第一預設條件的目標話題切換方向,并標記所述目標切換方向所涉及的源話題和目標話題。通過統計的方式,將主題切換的概率信息統計出來,應用于對話機器人在對話的過程中,為對話機器人提供更符合人類聊天需求的話題切換數據。
技術領域
本申請涉及數據處理領域,尤其涉及一種話題切換標記方法、裝置及計算機設備。
背景技術
根據人類對話聊天的特點來看,人類在聊一個話題時,隨著聊天內容的深入,通常會切換到與上一個話題關系較為密切的另一個話題上,例如由地域的話題切換到飲食習慣的話題。可見,人類聊天時話題切換的場景較多,且更符合人類的聊天需求。
而在當前的對話或閑聊機器人的閑聊主要分為兩大類,一類是檢索式的閑聊,即獲取大量的閑聊語料對,對當前用戶會話內容進行語義相似度檢索,返回最相似的閑聊語料作為答案返回給用戶;另一類是生成式的閑聊,通過深度學習模型對訓練語料進行學習,該模型架構通常是encoder-decoder模式,并針對用戶會話內容靈活生成答案返回給用戶。
檢索式閑聊機器人給出的閑聊內容語句通順、更接近人類語言的表述,但靈活性低,且受限于閑聊語料庫的大小及語義匹配算法的精度及效率;而生成式閑聊機器人生成的內容靈活的同時,內容確定性較低,體現在語句的通順性、友好性、前后話題的統一性、趣味性等方面。
但限于當前的中文開源的閑聊數據較少,且多數是單輪或多輪的對話數據,數據幾乎沒有其它的額外信息。導致生成式模型無法利用更多的信息來生成具有話題統一的對話內容。可見,現有的閑聊機器人所使用的話題閑聊內容較為單一,無法滿足人類的真實聊天的靈活性和趣味性。
發明內容
為了解決上述技術問題,本申請實施例提供了一種話題切換標記方法、裝置及計算機設備。
第一方面,本申請實施例提供了一種話題切換標記方法,包括:
將每個對話內的多個連續交互的聊天語句進行詞語分割;
根據每個對話分割出的詞語所屬的話題類別,統計每個對話所涉及的話題切換方向及切換頻次,其中,話題切換方向涉及源話題和切換后的目標話題;
篩選全部對話的話題切換方向中,切換頻次滿足第一預設條件的目標話題切換方向,并標記所述目標切換方向所涉及的源話題和目標話題。
第二方面,本申請實施例提供了一種話題切換標記裝置,包括:
分割模塊,用于將每個對話內的多個連續交互的聊天語句進行詞語分割;
統計模塊,用于根據每個對話分割出的詞語所屬的話題類別,統計每個對話所涉及的話題切換方向及切換頻次,其中,話題切換方向涉及源話題和切換后的目標話題;
標記模塊,用于篩選全部對話的話題切換方向中,切換頻次滿足第一預設條件的目標話題切換方向,并標記所述目標切換方向所涉及的源話題和目標話題。
第三方面,本申請實施例提供了一種計算機設備,包括存儲器以及處理器,所述存儲器用于存儲計算機程序,所述計算機程序在所述處理器運行時執行第一方面中任一項所述的話題切換標記方法。
第四方面,本申請實施例還提供了一種計算機可讀存儲介質,其存儲有計算機程序,所述計算機程序在處理器上運行時執行第一方面中任一項所述的話題切換標記方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技股份有限公司,未經深圳市優必選科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110846455.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通信基站和通信基站系統
- 下一篇:不銹鋼體裁切裝置





