[發(fā)明專利]一種待搜索信息的確定方法、確定裝置及可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010157007.X | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111291150B | 公開(公告)日: | 2023-08-25 |
| 發(fā)明(設(shè)計)人: | 張杰;周芳伊 | 申請(專利權(quán))人: | 北京明智和術(shù)科技有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/335;G06F16/33 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 鄧超 |
| 地址: | 100000 北京市朝陽區(qū)高碑店鄉(xiāng)高碑店村民*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 搜索 信息 確定 方法 裝置 可讀 存儲 介質(zhì) | ||
本申請?zhí)峁┝艘环N待搜索信息的確定方法、確定裝置及可讀存儲介質(zhì),其中,所述確定方法包括:獲取數(shù)據(jù)庫中的多條警情數(shù)據(jù),以及每一條警情數(shù)據(jù)對應(yīng)的警情編號和事件信息;針對每一條警情數(shù)據(jù),根據(jù)預(yù)設(shè)的待提取字段的特征,從該警情數(shù)據(jù)的事件信息中提取出符合待提取字段的特征的至少一個目標(biāo)字段;將至少一個目標(biāo)字段與該警情數(shù)據(jù)的警情編號進(jìn)行合并,得到以警情編號作為標(biāo)識的該警情數(shù)據(jù)的待搜索信息。這樣,能夠根據(jù)警情編號確定出與警情編號對應(yīng)的目標(biāo)字段及事件信息,可以避免遺漏目標(biāo)字段,有助于提高后續(xù)對警情數(shù)據(jù)的處理效率。
技術(shù)領(lǐng)域
本申請涉及文本挖掘技術(shù)領(lǐng)域,尤其是涉及一種待搜索信息的確定方法、確定裝置及可讀存儲介質(zhì)。
背景技術(shù)
隨著網(wǎng)絡(luò)時代的到來,用戶能夠以多種形式獲取各類文本信息,構(gòu)成了一個異常龐大的具有異構(gòu)性、開放性特點的分布式數(shù)據(jù)庫,而這個數(shù)據(jù)庫中存放的是非結(jié)構(gòu)化的文本數(shù)據(jù),給信息的提取帶來了困難。文本挖掘技術(shù)是利用計算機處理技術(shù)從文本數(shù)據(jù)中抽取有價值的信息,通過文本挖掘可以將文本信息轉(zhuǎn)化為便于處理的構(gòu)型,有助于后續(xù)對文本信息的快速分析處理。
以警情數(shù)據(jù)為例,警情信息通常是由各地負(fù)責(zé)接警、處警的警務(wù)人員錄入,雖然有基本的錄入要求,每條警情數(shù)據(jù)包括時間、地點、事件、人物等關(guān)鍵信息,但由于每個人錄入信息的習(xí)慣不同,警情數(shù)據(jù)的結(jié)構(gòu)多樣,并且每條警情信息中可能包含不止一個關(guān)鍵字段,導(dǎo)致無法獲取關(guān)鍵字段或遺漏關(guān)鍵字段,影響后續(xù)對警情信息的處理效果。
發(fā)明內(nèi)容
有鑒于此,本申請的目的在于提供一種待搜索信息的確定方法、確定裝置及可讀存儲介質(zhì),通過獲取每條警情數(shù)據(jù)的目標(biāo)字段,并與警情編號進(jìn)行合并,得到待搜索信息,這樣,能夠根據(jù)警情編號確定出與警情編號對應(yīng)的目標(biāo)字段及事件信息,可以避免遺漏目標(biāo)字段,有助于提高后續(xù)對警情數(shù)據(jù)的處理效率。
第一方面,本申請實施例提供了一種待搜索信息的確定方法,所述確定方法包括:
獲取數(shù)據(jù)庫中的多條警情數(shù)據(jù),以及每一條警情數(shù)據(jù)對應(yīng)的警情編號和事件信息;
針對每一條警情數(shù)據(jù),根據(jù)預(yù)設(shè)的待提取字段的特征,從該警情數(shù)據(jù)的事件信息中提取出符合所述待提取字段的特征的至少一個目標(biāo)字段;
將所述至少一個目標(biāo)字段與該警情數(shù)據(jù)的警情編號進(jìn)行合并,得到以所述警情編號作為標(biāo)識的該警情數(shù)據(jù)的待搜索信息。
結(jié)合第一方面,本申請實施例提供了第一方面的第一種可能的實施方式,其中,所述待提取字段包括多個關(guān)鍵字、多個關(guān)鍵詞和人員身份標(biāo)識中的一個或者多個。
結(jié)合第一方面的第一種可能的實施方式,本申請實施例提供了第一方面的第二種可能的實施方式,其中,當(dāng)所述待提取字段包括多個關(guān)鍵詞時,所述針對每一條警情數(shù)據(jù),根據(jù)預(yù)設(shè)的待提取字段的特征,從該警情數(shù)據(jù)的事件信息中提取出符合所述待提取字段的特征的至少一個目標(biāo)字段,包括:
獲取該警情數(shù)據(jù)的事件信息,以及預(yù)設(shè)的多個關(guān)鍵詞;
將所述事件信息與預(yù)設(shè)的多個關(guān)鍵詞中的每一個關(guān)鍵詞進(jìn)行匹配,針對每一個關(guān)鍵詞,判斷所述事件信息是否包括該關(guān)鍵詞,在所述事件信息包括該關(guān)鍵詞的情況下,將該關(guān)鍵詞確定為該警情數(shù)據(jù)的目標(biāo)字段。
結(jié)合第一方面的第一種可能的實施方式,本申請實施例提供了第一方面的第三種可能的實施方式,其中,當(dāng)所述待提取字段包括人員身份標(biāo)識時,所述針對每一條警情數(shù)據(jù),根據(jù)預(yù)設(shè)的待提取字段的特征,從該警情數(shù)據(jù)的事件信息中提取出符合所述待提取字段的特征的至少一個目標(biāo)字段,包括:
獲取該警情數(shù)據(jù)的事件信息,以及預(yù)設(shè)的人員身份標(biāo)識;
根據(jù)所述人員身份標(biāo)識,確定出所述人員身份標(biāo)識的特征;
將所述事件信息中符合所述特征的字段,確定為該警情數(shù)據(jù)的目標(biāo)字段。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明智和術(shù)科技有限公司,未經(jīng)北京明智和術(shù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010157007.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





