[發(fā)明專利]文本處理方法和裝置、存儲介質(zhì)和電子裝置在審
| 申請?zhí)枺?/td> | 202010328492.2 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111507082A | 公開(公告)日: | 2020-08-07 |
| 發(fā)明(設(shè)計)人: | 張紅軍;李小鵬;李順龍 | 申請(專利權(quán))人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/289;G06K9/62 |
| 代理公司: | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 11662 | 代理人: | 劉曉燕 |
| 地址: | 100080 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 處理 方法 裝置 存儲 介質(zhì) 電子 | ||
1.一種文本處理方法,其特征在于,包括:
獲取目標文本,其中,所述目標文本為待拆分成多個子文本的文本;
確定與所述目標文本匹配的目標拆分模式,其中,所述目標拆分模式用于根據(jù)目標要素在所述目標文本中的位置,將所述目標文本拆分為多個子文本;
基于所述目標拆分模式對所述目標文本進行拆分,得到與所述目標文本對應(yīng)的多個目標子文本。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取所述目標文本包括:
接收目標對象通過客戶端上傳的目標劇本,其中,所述目標劇本為待拆分為多個場次的劇本,所述目標劇本為所述目標文本。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定與所述目標文本匹配的所述目標拆分模式包括:
根據(jù)所述目標文本中包含的目標要素在所述目標文本中的位置,從多個拆分模式中確定出與所述目標文本匹配的候選拆分模式;
獲取所述候選拆分模式的更新信息,其中,所述更新信息為更新基于所述候選拆分模式從所述目標文本中確定出的所述目標要素的要素值得到的信息;
使用所述更新信息調(diào)整所述候選拆分模式,得到所述目標拆分模式。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,獲取所述候選拆分模式的所述更新信息包括:
基于所述候選拆分模式對所述目標文本進行拆分,得到一個或多個參考子文本;
將所述參考子文本發(fā)送給目標對象的客戶端,以通過所述客戶端獲取針對所述目標對象輸入的所述更新信息;
接收所述客戶端返回的所述更新信息。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在將所述參考子文本發(fā)送給所述目標對象的所述客戶端之后,所述方法還包括:
通過所述客戶端顯示所述參考子文本和要素信息界面,其中,所述要素信息界面上顯示所述目標要素和所述目標要素的參考要素值,所述參考要素值為所述候選拆分模式從所述參考子文本中提取出的、所述目標要素的要素值;
檢測到所述目標對象對所述要素信息界面執(zhí)行的目標操作,其中,所述目標操作用于更新所述目標要素的參考要素值;
響應(yīng)所述目標操作,根據(jù)更新后的所述參考要素值,生成與所述目標操作對應(yīng)的所述更新信息。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,使用所述更新信息調(diào)整所述候選拆分模式,得到所述目標拆分模式包括:
對所述更新信息執(zhí)行模式化處理,得到模式更新信息,其中,所述模式化處理包括:保留所述更新信息中的所述目標要素,對除了所述目標要素以外的其他要素進行模糊化處理,保留分隔符;
使用所述模式更新信息對所述候選拆分模式進行更新,得到所述目標拆分模式。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述目標拆分模式對所述目標文本進行拆分,得到與所述目標文本對應(yīng)的所述多個目標子文本包括:
基于所述目標拆分模式確定所述目標要素在所述目標文本中的目標位置;
根據(jù)所述目標要素的位置與文本拆分位置之間的位置關(guān)系,確定與所述目標位置對應(yīng)的目標拆分位置;
按照所述目標拆分位置對所述目標文本進行拆分,得到所述多個目標子文本。
8.根據(jù)權(quán)利要求1至7中任一項所述的方法,其特征在于,在基于所述目標拆分模式對所述目標文本進行拆分,得到與所述目標文本對應(yīng)的所述多個目標子文本之后,所述方法還包括:
獲取所述多個目標子文本的文本順序表,其中,所述文本順序表用于表示所述多個目標子文本在所述目標文本中的順序;
生成與所述目標文本對應(yīng)的目標元素信息表,其中,所述目標元素信息表為所述多個目標子文本中的每個目標子文本中包含的目標元素的列表;
保存所述文本順序表和所述目標元素信息表。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇藝世紀科技有限公司,未經(jīng)北京奇藝世紀科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010328492.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





