[發(fā)明專利]文本處理方法及裝置有效
| 申請?zhí)枺?/td> | 202010004138.4 | 申請日: | 2020-01-03 |
| 公開(公告)號: | CN111221951B | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計)人: | 楊明 | 申請(專利權(quán))人: | 北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/31;G06F16/338 |
| 代理公司: | 上海光柵知識產(chǎn)權(quán)代理有限公司 31340 | 代理人: | 馬雯雯 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 處理 方法 裝置 | ||
本公開實施例提供一種文本處理方法及裝置,該方法包括:獲取第一句子的關(guān)鍵詞和熱點詞,所述熱點詞為預(yù)設(shè)時段內(nèi)使用頻率大于第一閾值的詞匯;根據(jù)所述關(guān)鍵詞在所述第一句子中的第一索引信息和所述熱點詞在所述第一句子中的第二索引信息,確定所述關(guān)鍵詞和所述熱點詞中均包括的交集字符,所述關(guān)鍵詞中的所述交集字符在所述第一句子中的索引、與所述熱點詞中的所述交集字符在所述第一句子中的索引相同;根據(jù)所述交集字符顯示所述第一句子,所述交集字符的顯示方式與所述第一句子中除所述交集字符外的其他字符的顯示方式不同。本公開實施例能夠迅速獲取關(guān)鍵詞和熱點詞在文本中的相互關(guān)系。
技術(shù)領(lǐng)域
本公開實施例涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種文本處理方法及裝置。
背景技術(shù)
隨著計算機技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,大量的文本數(shù)據(jù)需要進行展示,其中,文本數(shù)據(jù)是指信息載體的數(shù)據(jù)信息。例如:文本數(shù)據(jù)可以為廣告、文章等。
文本數(shù)據(jù)中通常包括關(guān)鍵詞和熱點詞,其中,關(guān)鍵詞為與文本數(shù)據(jù)中含義緊密相關(guān)的詞匯,熱點詞為一定時期內(nèi)的高頻詞匯。熱點詞和關(guān)鍵詞之間可能互不相關(guān),也可能具有交集,根據(jù)熱點詞和關(guān)鍵詞之間的關(guān)系能夠幫助用戶快速抓取文本數(shù)據(jù)的關(guān)鍵信息。例如,在廣告投放領(lǐng)域,根據(jù)廣告文本中關(guān)鍵詞和熱點詞的關(guān)系,有助于用戶快速獲取廣告文本關(guān)鍵信息,進行廣告文本的審核。因此文本數(shù)據(jù)中關(guān)鍵詞和熱點詞的關(guān)系的快速獲取具有重要的意義。
現(xiàn)有方案中,針對文本數(shù)據(jù)中的關(guān)鍵詞和熱點詞的展示,通常是將文本數(shù)據(jù)中的關(guān)鍵詞和熱點詞標寫在文本數(shù)據(jù)的下方,用戶需要根據(jù)標寫的關(guān)鍵詞和熱點詞,在文本數(shù)據(jù)中找到相應(yīng)的位置,進而得到關(guān)鍵詞和熱點詞的關(guān)系,過程較繁瑣,且效率較低。
發(fā)明內(nèi)容
本公開實施例提供一種文本處理方法及裝置,以解決無法迅速獲取關(guān)鍵詞和熱點詞在文本中的相互關(guān)系的問題。
第一方面,本公開實施例提供一種文本處理方法,包括:
獲取第一句子的關(guān)鍵詞和熱點詞,所述熱點詞為預(yù)設(shè)時段內(nèi)使用頻率大于第一閾值的詞匯;
根據(jù)所述關(guān)鍵詞在所述第一句子中的第一索引信息和所述熱點詞在所述第一句子中的第二索引信息,確定所述關(guān)鍵詞和所述熱點詞中均包括的交集字符,所述關(guān)鍵詞中的所述交集字符在所述第一句子中的索引、與所述熱點詞中的所述交集字符在所述第一句子中的索引相同;
根據(jù)所述交集字符顯示所述第一句子,所述交集字符的顯示方式與所述第一句子中除所述交集字符外的其他字符的顯示方式不同。
在一種可能的實施方式中,所述第一索引信息包括所述關(guān)鍵詞中每個字符在所述第一句子中的索引;
所述第二索引信息包括所述熱點詞中每個字符在所述第一句子中的索引。
在一種可能的實施方式中,根據(jù)所述關(guān)鍵詞在所述第一句子中的第一索引信息和所述熱點詞在所述第一句子中的第二索引信息,確定所述關(guān)鍵詞和所述熱點詞中均包括的交集字符,包括:
在所述第一索引信息和所述第二索引信息中確定目標索引,所述第一索引信息和所述第二索引信息均包括所述目標索引;
將所述目標索引對應(yīng)的字符確定為所述交集字符。
在一種可能的實施方式中,根據(jù)所述交集字符顯示所述第一句子,包括:
確定所述交集字符的第一顯示方式和非交集字符的第二顯示方式,所述非交集字符為所述第一句子中除所述交集字符之外的其它字符;
按照所述第一顯示方式顯示所述交集字符;
按照所述第二顯示方式顯示所述非交集字符。
在一種可能的實施方式中,根據(jù)所述關(guān)鍵詞在所述第一句子中的第一索引信息和所述熱點詞在所述第一句子中的第二索引信息,確定所述關(guān)鍵詞和所述熱點詞中均包括的交集字符之后,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010004138.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





