[發(fā)明專利]文本信息的地域?qū)傩宰R別方法及裝置、電子設(shè)備有效
| 申請?zhí)枺?/td> | 201811348717.X | 申請日: | 2018-11-13 |
| 公開(公告)號: | CN109271640B | 公開(公告)日: | 2021-09-17 |
| 發(fā)明(設(shè)計)人: | 鄧文超;鄭茂 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/289;G06K9/62;G06F16/9537 |
| 代理公司: | 深圳市隆天聯(lián)鼎知識產(chǎn)權(quán)代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 信息 地域 屬性 識別 方法 裝置 電子設(shè)備 | ||
本發(fā)明揭示了一種文本信息的地域?qū)傩宰R別方法及裝置、電子設(shè)備,該方法包括:通過已構(gòu)建的地域判斷模型對待識別的文本信息進行地域性判斷;在判斷出文本信息具備地域性時,對文本信息中的地域詞,按照在文本信息中的先后位置配置不同的數(shù)值;根據(jù)行政區(qū)域的層級關(guān)系,對歸屬同一行政區(qū)域的地域詞對應(yīng)的數(shù)值進行融合,得到行政區(qū)域的地域詞數(shù)值融合結(jié)果;逐層比較相同層級的各個行政區(qū)域的地域詞數(shù)值融合結(jié)果,確定文本信息歸屬的行政區(qū)域,獲得文本信息的地域?qū)傩?。由此即使文本信息中包括多個地域詞,通過對地域詞配置數(shù)值以及地域詞數(shù)值融合的方式,也可以實現(xiàn)文本信息地域?qū)傩缘臏蚀_識別,進而可以實現(xiàn)文本信息的個性化推薦。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種文本信息的地域?qū)傩宰R別及裝置、電子設(shè)備。
背景技術(shù)
智能推薦是人工智能領(lǐng)域內(nèi)的一個子領(lǐng)域,智能推薦是指根據(jù)用戶的特征,向用戶推薦與其特征相匹配的信息。例如根據(jù)用戶所在的地域,向該用戶推送與該地域相關(guān)的信息。所以,識別出信息的地域?qū)傩允秦酱鉀Q的問題。
目前一般是通過采用分詞技術(shù),將文本信息切分多個詞組,與事先定義好各行政區(qū)域的地域詞庫進行比較,設(shè)置匹配閾值,找出大于該匹配閾值的地域詞庫,判斷得到該文本信息屬于該地域詞庫所對應(yīng)行政區(qū)域發(fā)生的事件。
但是,如果文信息本中存在多個地域詞,例如文本信息中包含北京、上海、廣州、深圳等地域詞,則無法通過簡單的地域詞庫匹配方式,確定文本信息屬于哪個行政區(qū)域發(fā)生的事件,無法準確識別出文本信息的地域?qū)傩浴?/p>
發(fā)明內(nèi)容
為了解決相關(guān)技術(shù)中存在的無法準確識別出文本信息的地域?qū)傩缘膯栴},本發(fā)明提供了一種文本信息的地域?qū)傩宰R別方法。
一方面,本發(fā)明提供了一種文本信息的地域?qū)傩宰R別方法,包括:
通過已構(gòu)建的地域判斷模型對待識別的文本信息進行地域性判斷;
在判斷出所述文本信息具備地域性時,對所述文本信息中的地域詞,按照在所述文本信息中的先后位置配置不同的數(shù)值;
根據(jù)行政區(qū)域的層級關(guān)系,對歸屬同一行政區(qū)域的地域詞對應(yīng)的數(shù)值進行融合,得到所述行政區(qū)域的地域詞數(shù)值融合結(jié)果;
逐層比較相同層級的各個行政區(qū)域的地域詞數(shù)值融合結(jié)果,確定所述文本信息歸屬的行政區(qū)域,獲得所述文本信息的地域?qū)傩浴?/p>
另一方面,本發(fā)明提供了一種文本信息的地域?qū)傩宰R別裝置,所述裝置包括:
地域性判斷模塊,用于通過已構(gòu)建的地域判斷模型對待識別的文本信息進行地域性判斷;
數(shù)值配置模塊,用于在判斷出所述文本信息具備地域性時,對所述文本信息中的地域詞,按照在所述文本信息中的先后位置配置不同的數(shù)值;
數(shù)值融合模塊,用于根據(jù)行政區(qū)域的層級關(guān)系,對歸屬同一行政區(qū)域的地域詞對應(yīng)的數(shù)值進行融合,得到所述行政區(qū)域的地域詞數(shù)值融合結(jié)果;
地域確定模塊,用于逐層比較相同層級的各個行政區(qū)域的地域詞數(shù)值融合結(jié)果,確定所述文本信息歸屬的行政區(qū)域,獲得所述文本信息的地域?qū)傩浴?/p>
此外,本發(fā)明還提供了一種電子設(shè)備,所述電子設(shè)備包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器被配置為執(zhí)行上述文本信息的地域?qū)傩宰R別方法。
進一步的,本發(fā)明還提供了一種計算機可讀存儲介質(zhì),其所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序可由處理器執(zhí)行上述文本信息的地域?qū)傩宰R別方法。
本發(fā)明的實施例提供的技術(shù)方案可以包括以下有益效果:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811348717.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





