[發(fā)明專利]文章內(nèi)容識別方法、裝置及計算機存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010041427.1 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111241284A | 公開(公告)日: | 2020-06-05 |
| 發(fā)明(設(shè)計)人: | 周瑾萱;陳淵 | 申請(專利權(quán))人: | 北京松果電子有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/30;G06F40/279 |
| 代理公司: | 北京善任知識產(chǎn)權(quán)代理有限公司 11650 | 代理人: | 康艷青 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文章內(nèi)容 識別 方法 裝置 計算機 存儲 介質(zhì) | ||
1.一種文章內(nèi)容識別方法,其特征在于,包括:
獲取文章內(nèi)容;
對所述文章內(nèi)容進行語義識別,得到所述文章內(nèi)容的時效性識別結(jié)果;
響應(yīng)于確定所述時效性識別結(jié)果為第一類時效性,對所述文章內(nèi)容進行模式匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的文章內(nèi)容識別方法,其特征在于,所述對所述文章內(nèi)容進行語義識別,得到所述文章內(nèi)容的時效性識別結(jié)果,包括:
利用已訓(xùn)練好的分類模型對所述文章內(nèi)容進行語義識別,得到所述文章內(nèi)容屬于第一類時效性的第一概率以及所述文章內(nèi)容屬于第二類時效性的第二概率;
響應(yīng)于所述第一概率大于第一預(yù)設(shè)閾值或所述第二概率小于第二預(yù)設(shè)閾值,確定所述時效性識別結(jié)果為第一類時效性。
3.根據(jù)權(quán)利要求1所述的文章內(nèi)容識別方法,其特征在于,所述模式包括第一模式,所述對所述文章內(nèi)容進行模式匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果,包括:將所述文章內(nèi)容與所述第一模式進行匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果;或者
所述模式包括第二模式,所述對所述文章內(nèi)容進行模式匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果,包括:將所述文章內(nèi)容與所述第二模式進行匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果;或者
所述模式包括第一模式和第二模式,所述對所述文章內(nèi)容進行模式匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果,包括:將所述文章內(nèi)容與所述第一模式進行匹配;響應(yīng)于所述文章內(nèi)容不能與所述第一模式匹配,將所述文章內(nèi)容與所述第二模式進行匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果;或者將所述文章內(nèi)容與所述第二模式進行匹配;響應(yīng)于所述文章內(nèi)容不能與所述第二模式匹配,將所述文章內(nèi)容與所述第一模式進行匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果。
4.根據(jù)權(quán)利要求3所述的文章內(nèi)容識別方法,其特征在于,所述將所述文章內(nèi)容與所述第一模式進行匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果,包括:
確定所述文章內(nèi)容中是否含有所述第一模式下的至少一個預(yù)設(shè)關(guān)鍵詞;
響應(yīng)于所述文章內(nèi)容含有至少一個所述預(yù)設(shè)關(guān)鍵詞,確定所述文章內(nèi)容能與所述第一模式匹配,并確定所述文章內(nèi)容的時效性類別為第二類時效性;
響應(yīng)于所述文章內(nèi)容未含有所述預(yù)設(shè)關(guān)鍵詞,確定所述文章內(nèi)容不能與所述第一模式匹配,并確定所述文章內(nèi)容的時效性類別為第一類時效性;
所述將所述文章內(nèi)容與所述第二模式進行匹配,根據(jù)模式匹配情況重新確定所述文章內(nèi)容的時效性識別結(jié)果,包括:
確定所述文章內(nèi)容中是否含有第二模式下的至少一個日期和/或時間格式的詞;
響應(yīng)于所述文章內(nèi)容含有至少一個所述日期和/或時間格式的詞,確定所述文章內(nèi)容能與所述第二模式匹配,并確定所述文章內(nèi)容的時效性類別為第二類時效性;
響應(yīng)于所述文章內(nèi)容未含有所述日期和/或時間格式的詞,確定所述文章內(nèi)容不能與所述第二模式匹配,并確定所述文章內(nèi)容的時效性類別為第一類時效性。
5.根據(jù)權(quán)利要求1至4任一項所述的文章內(nèi)容識別方法,其特征在于,所述方法還包括:
響應(yīng)于經(jīng)重新確定后所述文章內(nèi)容的時效性識別結(jié)果仍為第一類時效性,為所述文章內(nèi)容設(shè)置第一過期時間;或
響應(yīng)于確定所述時效性識別結(jié)果為第二類時效性,或經(jīng)重新確定后所述文章內(nèi)容的時效性識別結(jié)果為第二類時效性,為所述文章內(nèi)容設(shè)置第二過期時間。
6.根據(jù)權(quán)利要求5所述的文章內(nèi)容識別方法,其特征在于,采用如下方式為所述文章內(nèi)容設(shè)置過期時間:
結(jié)合所述文章內(nèi)容中出現(xiàn)的時間詞和所述文章內(nèi)容的發(fā)布時間,為所述文章內(nèi)容設(shè)置過期時間,其中,所述過期時間包括第二過期時間和第一過期時間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京松果電子有限公司,未經(jīng)北京松果電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010041427.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 輔助背誦的方法和裝置
- 一種特定內(nèi)容的去除方法和裝置
- 一種生成文章大綱的方法和裝置
- 一種內(nèi)容分類聚合方法、電子設(shè)備、存儲介質(zhì)及引擎
- 基于相似度的標(biāo)題生成模型的訓(xùn)練方法及計算設(shè)備
- 文章內(nèi)容質(zhì)量數(shù)據(jù)計算方法、計算設(shè)備及存儲介質(zhì)
- 文章內(nèi)容識別方法、裝置及計算機存儲介質(zhì)
- 文章處理方法、裝置、電子設(shè)備及計算機可讀存儲介質(zhì)
- 文章處理方法、裝置、電子設(shè)備及計算機存儲介質(zhì)
- 一種文章內(nèi)容的推薦方法、裝置、電子設(shè)備及存儲介質(zhì)





