[發(fā)明專利]文本處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010073135.6 | 申請(qǐng)日: | 2020-01-22 |
| 公開(kāi)(公告)號(hào): | CN111291551B | 公開(kāi)(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 俞一鵬 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06F40/216 | 分類號(hào): | G06F40/216;G06F40/289;G06F40/30;G06F16/35;G06N3/088 |
| 代理公司: | 北京市立方律師事務(wù)所 11330 | 代理人: | 張?bào)銓?/td> |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 處理 方法 裝置 電子設(shè)備 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┝艘环N文本處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),涉及處理領(lǐng)域。該方法包括:獲取游戲的文本;獲取所述文本的互動(dòng)信息;當(dāng)所述互動(dòng)信息符合預(yù)設(shè)條件時(shí),確定所述文本是否包括預(yù)設(shè)關(guān)鍵詞;當(dāng)所述文本不包含預(yù)設(shè)關(guān)鍵詞時(shí),基于預(yù)設(shè)的字符統(tǒng)計(jì)規(guī)則對(duì)所述文本進(jìn)行檢測(cè)以確定所述文本是否符合統(tǒng)計(jì)相關(guān)條件;當(dāng)檢測(cè)符合所述統(tǒng)計(jì)相關(guān)條件時(shí),基于預(yù)設(shè)的語(yǔ)義規(guī)則確定所述文本是否語(yǔ)義有效;當(dāng)確定所述文本語(yǔ)義無(wú)效時(shí),確定所述文本為無(wú)效文本,并對(duì)所述文本進(jìn)行過(guò)濾。本申請(qǐng)實(shí)現(xiàn)了用戶從評(píng)論區(qū)域內(nèi)獲得有效的評(píng)論內(nèi)容的效率更高,用戶體驗(yàn)更好。
技術(shù)領(lǐng)域
本申請(qǐng)涉及處理技術(shù)領(lǐng)域,具體而言,本申請(qǐng)涉及一種文本處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,用戶通過(guò)互聯(lián)網(wǎng)進(jìn)行各種各樣的互動(dòng)。比如:用戶可以在被評(píng)論主體下方的評(píng)論欄發(fā)表評(píng)論,其他用戶可以對(duì)評(píng)論區(qū)的評(píng)論進(jìn)行互動(dòng)。
目前,在對(duì)評(píng)論進(jìn)行分析時(shí),由于針對(duì)同一評(píng)論主體會(huì)有大量的評(píng)論內(nèi)容,在這些評(píng)論中混有高重復(fù)率且無(wú)實(shí)際意義的內(nèi)容,比如:“沙發(fā)”;甚至有些評(píng)論區(qū)域出現(xiàn)很多胡亂輸入的無(wú)意義語(yǔ)句,比如:“伏羲撥拉地方不額外費(fèi)阿集散地哈達(dá)口味”。由于高重復(fù)率且無(wú)實(shí)際意義的評(píng)論內(nèi)容的存在,使得評(píng)論區(qū)域內(nèi)的有價(jià)值的文本內(nèi)容被淹沒(méi),導(dǎo)致用戶從評(píng)論區(qū)域內(nèi)獲得有效的評(píng)論內(nèi)容的效率很低,用戶體驗(yàn)較差。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┝艘环N文本處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),可以解決用戶從評(píng)論區(qū)域內(nèi)獲得有效的評(píng)論內(nèi)容的效率很低,用戶體驗(yàn)較差的問(wèn)題。所述技術(shù)方案如下:
第一方面,提供了一種文本處理方法,該方法包括:
獲取游戲的文本;
獲取所述文本的互動(dòng)信息;當(dāng)所述互動(dòng)信息符合預(yù)設(shè)條件時(shí),確定所述文本是否包括預(yù)設(shè)關(guān)鍵詞;
當(dāng)所述文本不包含預(yù)設(shè)關(guān)鍵詞時(shí),基于預(yù)設(shè)的字符統(tǒng)計(jì)規(guī)則對(duì)所述文本進(jìn)行檢測(cè)以確定所述文本是否符合統(tǒng)計(jì)相關(guān)條件;
當(dāng)檢測(cè)符合所述統(tǒng)計(jì)相關(guān)條件時(shí),基于預(yù)設(shè)的語(yǔ)義規(guī)則確定所述文本是否語(yǔ)義有效;
當(dāng)確定所述文本語(yǔ)義無(wú)效時(shí),確定所述文本為無(wú)效文本,并對(duì)所述文本進(jìn)行過(guò)濾。
優(yōu)選地,所述互動(dòng)信息包括所述文本的評(píng)論數(shù)量、支持?jǐn)?shù)量、反對(duì)數(shù)量以及分享數(shù)量中的至少一種;
所述互動(dòng)信息符合預(yù)設(shè)條件,包括:
當(dāng)評(píng)論數(shù)量超過(guò)預(yù)設(shè)評(píng)論閾值,和/或,所述支持?jǐn)?shù)量超過(guò)預(yù)設(shè)支持閾值,和/或所述反對(duì)數(shù)量不超過(guò)預(yù)設(shè)反對(duì)閾值,和/或分享數(shù)量超過(guò)預(yù)設(shè)分享閾值時(shí),則判定所述互動(dòng)信息符合預(yù)設(shè)條件。
優(yōu)選地,所述基于預(yù)設(shè)的字符統(tǒng)計(jì)規(guī)則對(duì)所述文本進(jìn)行檢測(cè)以確定所述文本是否符合統(tǒng)計(jì)條件的步驟,包括:
獲取所述文本中的中文字符,并統(tǒng)計(jì)出中文字符的數(shù)量;
當(dāng)中文字符的數(shù)量超過(guò)中文字符的數(shù)量閾值時(shí),確定所述文本符合統(tǒng)計(jì)條件。
優(yōu)選地,所述基于預(yù)設(shè)的字符統(tǒng)計(jì)規(guī)則對(duì)所述信息進(jìn)行檢測(cè)以確定所述文本是否符合統(tǒng)計(jì)條件的步驟,包括:
獲取所述文本中的非中文字符,并統(tǒng)計(jì)出非中文字符的數(shù)量;
當(dāng)非中文字符的數(shù)量小于非中文字符的數(shù)量閾值時(shí),確定所述文本符合統(tǒng)計(jì)條件。
優(yōu)選地,所述基于預(yù)設(shè)的字符統(tǒng)計(jì)規(guī)則對(duì)所述文本進(jìn)行檢測(cè)以確定所述文本是否符合統(tǒng)計(jì)條件的步驟,包括:
獲取所述文本中的全部字符;
檢測(cè)全部字符中是否存在連續(xù)重復(fù)的字符;
當(dāng)檢測(cè)到全部字符中存在連續(xù)重復(fù)的字符時(shí),統(tǒng)計(jì)出各個(gè)連續(xù)重復(fù)的字符的重復(fù)次數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010073135.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





