[發明專利]對白角色預測方法、裝置、電子設備及存儲介質有效
| 申請號: | 202011099233.3 | 申請日: | 2020-10-14 |
| 公開(公告)號: | CN112270169B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 潘政林;白潔;王毅 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F18/214;G06N20/20 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 谷春靜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對白 角色 預測 方法 裝置 電子設備 存儲 介質 | ||
1.一種對白角色預測方法,包括:
按照從頭到尾的順序遍歷文本中的對白,將遍歷到的每句對白分別作為待處理的對白;從所述文本中獲取所述待處理的對白的上下文;
獲取所述上下文中的上文中的各句文本內容的第一標簽,所述第一標簽為非對白或角色信息,所述角色為對白的說話人;
根據所述上下文及所述第一標簽預測出所述對白的角色信息,包括:構建包含所述上下文、所述第一標簽及所述待處理的對白的輸入信息,將所述輸入信息輸入角色預測模型,得到預測出的所述待處理的對白的角色信息,所述角色預測模型為利用構建出的訓練樣本訓練得到的,每條訓練樣本分別對應于文本中的一句對白,其中包括:所述對白對應的所述輸入信息及第二標簽,所述第二標簽為所述對白的角色信息。
2.根據權利要求1所述的方法,還包括:
將被引號包圍的文本內容作為對白;
和/或,針對任一句文本內容,利用預先訓練得到的分類模型確定所述文本內容是否為對白。
3.一種對白角色預測裝置,包括:
第一獲取模塊,用于按照從頭到尾的順序遍歷文本中的對白,將遍歷到的每句對白分別作為待處理的對白;從所述文本中獲取所述待處理的對白的上下文;
第二獲取模塊,用于獲取所述上下文中的上文中的各句文本內容的第一標簽,所述第一標簽為非對白或角色信息,所述角色為對白的說話人;
預測模塊,用于根據所述上下文及所述第一標簽預測出所述對白的角色信息,包括:構建包含所述上下文、所述第一標簽及所述待處理的對白的輸入信息,將所述輸入信息輸入角色預測模型,得到預測出的所述待處理的對白的角色信息,所述角色預測模型為利用構建出的訓練樣本訓練得到的,每條訓練樣本分別對應于文本中的一句對白,其中包括:所述對白對應的所述輸入信息及第二標簽,所述第二標簽為所述對白的角色信息。
4.根據權利要求3所述的裝置,其中,
所述第一獲取模塊進一步用于,將被引號包圍的文本內容作為對白,和/或,針對任一句文本內容,利用預先訓練得到的分類模型確定所述文本內容是否為對白。
5.一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-2中任一項所述的方法。
6.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行權利要求1-2中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011099233.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帕拉米韋雜質M及其制備方法和用途
- 下一篇:一種茶葉的灌裝糊盒生產線





