[發(fā)明專利]地址文本的分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010811547.5 | 申請(qǐng)日: | 2020-08-13 |
| 公開(kāi)(公告)號(hào): | CN112069273A | 公開(kāi)(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 吳帝;孔令其;程昆;王曉煒;王勝;張定棋 | 申請(qǐng)(專利權(quán))人: | 豐圖科技(深圳)有限公司 |
| 主分類號(hào): | G06F16/29 | 分類號(hào): | G06F16/29;G06F40/289;G06F16/903;G06K9/62 |
| 代理公司: | 深圳紫藤知識(shí)產(chǎn)權(quán)代理有限公司 44570 | 代理人: | 官建紅 |
| 地址: | 518052 廣東省深圳市南*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 地址 文本 分類 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┝艘环N地址文本的分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該地址文本的分類方法包括:獲取地址文本;基于詞性對(duì)地址文本進(jìn)行分詞,得到多個(gè)第一地址分詞和多個(gè)第一地址分詞對(duì)應(yīng)的詞性;基于預(yù)設(shè)詞性范圍對(duì)多個(gè)第一地址分詞進(jìn)行篩選,得到篩選結(jié)果;基于篩選結(jié)果確定地址文本的地址類型。本申請(qǐng)地址文本的分類方法首先基于詞性對(duì)地址文本分詞得到多個(gè)第一地址分詞和對(duì)應(yīng)的詞性,然后根據(jù)預(yù)設(shè)詞性范圍對(duì)分詞后的第一地址分詞進(jìn)行篩選,得到篩選結(jié)果,可以根據(jù)需求去除干擾詞性對(duì)應(yīng)的第一地址分詞,從而提高地址文本分類的效率和準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,具體涉及一種地址文本的分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
自然語(yǔ)言處理(Nature Language processing,NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法。自然語(yǔ)言處理是一門融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。因此,這一領(lǐng)域的研究將涉及自然語(yǔ)言,即人們?nèi)粘J褂玫恼Z(yǔ)言,所以它與語(yǔ)言學(xué)的研究有著密切的聯(lián)系。自然語(yǔ)言處理技術(shù)通常包括文本處理、語(yǔ)義理解、機(jī)器翻譯、機(jī)器人問(wèn)答、知識(shí)圖譜等技術(shù)。
在信息化技術(shù)高速發(fā)展的今天,計(jì)算機(jī)識(shí)別已經(jīng)代替人工識(shí)別成為一種高效處理信息的方法。在快遞領(lǐng)域,一條地址里包含了豐富信息,通常通過(guò)人工核實(shí)來(lái)提取出其中相關(guān)信息,并對(duì)地址文本進(jìn)行分類,當(dāng)數(shù)據(jù)量倍增時(shí)人工核實(shí)的方法效率較低且準(zhǔn)確率較低。
發(fā)明內(nèi)容
本申請(qǐng)旨在提供一種地址文本的分類方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中地址文本分類效率較低且準(zhǔn)確率較低的問(wèn)題。
一方面,本申請(qǐng)?zhí)峁┮环N地址文本的分類方法,所述分類方法包括:
獲取地址文本;
基于詞性對(duì)所述地址文本進(jìn)行分詞,得到多個(gè)第一地址分詞和所述多個(gè)第一地址分詞對(duì)應(yīng)的詞性;
基于預(yù)設(shè)詞性范圍對(duì)所述多個(gè)第一地址分詞進(jìn)行篩選,得到篩選結(jié)果;
基于所述篩選結(jié)果確定所述地址文本的地址類型。
其中,所述基于預(yù)設(shè)詞性范圍對(duì)所述多個(gè)第一地址分詞進(jìn)行篩選,得到篩選結(jié)果,包括:
判斷所述多個(gè)第一地址分詞中是否存在預(yù)設(shè)的指示方位詞;
若所述多個(gè)第一地址分詞中不存在所述指示方位詞,則基于預(yù)設(shè)詞性范圍對(duì)所述多個(gè)第一地址分詞進(jìn)行篩選。
其中,所述地址文本的分類方法還包括:
若所述多個(gè)第一地址分詞中存在所述指示方位詞,則獲取所述指示方位詞與所述多個(gè)第一地址分詞的位置關(guān)系;
基于所述位置關(guān)系和所述指示方位詞的類型對(duì)所述多個(gè)第一地址分詞進(jìn)行篩選,得到多個(gè)第二地址分詞;
基于所述預(yù)設(shè)詞性范圍對(duì)所述多個(gè)第二地址分詞進(jìn)行篩選,得到所述篩選結(jié)果。
其中,所述基于所述篩選結(jié)果確定所述地址文本的地址類型,包括:
基于所述篩選結(jié)果中的地址分詞獲取地址主體詞;
基于所述地址主體詞確定所述地址文本的地址類型。
其中,所述基于所述篩選結(jié)果中的地址分詞獲取地址主體詞,包括:
當(dāng)所述篩選結(jié)果中的地址分詞的數(shù)量為至少兩個(gè)時(shí),基于預(yù)設(shè)詞性組合策略對(duì)所述篩選結(jié)果中的地址分詞進(jìn)行組合,得到所述地址主體詞。
其中,所述基于所述地址主體詞確定所述地址文本的地址類型,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于豐圖科技(深圳)有限公司,未經(jīng)豐圖科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010811547.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





