[發明專利]一種用于識別服務門店名的方法、設備及存儲介質有效
| 申請號: | 201910223458.6 | 申請日: | 2019-03-22 |
| 公開(公告)號: | CN109977951B | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 劉丹 | 申請(專利權)人: | 北京泰迪熊移動科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06F40/242;G06K9/62 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 白瑞強;李杏 |
| 地址: | 100085 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 識別 服務 店名 方法 設備 存儲 介質 | ||
1.一種用于識別服務門店名的方法,其特征在于,所述方法包括:
獲取測試文本;
獲取包括服務門店名的文本集;
對文本集進行數據預處理,得到服務門店名的詞及對應的詞頻和服務門店名特征詞及對應的詞頻,形成用于識別服務門店名的詞典;
對應服務門店名的特征詞包括服務門店名的前一個特征詞和后一個特征詞;
利用所得到的用于識別服務門店名的詞典進行決策樹構建,以形成用于識別服務門店名的規則模板;
通過所述用于識別服務門店名的詞典對所述測試文本進行切分處理,生成詞圖;
將所生成的詞圖與用于識別服務門店名的規則模板進行匹配;
若存在匹配,則將所生成的詞圖與用于識別服務門店名的規則模板二者之間的匹配項確定為對應服務門店名的登陸詞。
2.根據權利要求1所述的方法,其特征在于,將所生成的詞圖與用于識別服務門店名的規則模板進行匹配之后,所述方法還包括:
若存在匹配且所生成的詞圖與用于識別服務門店名的規則模板二者之間的匹配項為多個,則將字段最長的匹配項確定為對應服務門店名的登陸詞。
3.根據權利要求1所述的方法,其特征在于,將所生成的詞圖與用于識別服務門店名的規則模板進行匹配之后,所述方法還包括:
若存在非匹配項,則針對所述非匹配項是否為服務門店名本身進行判定。
4.根據權利要求1所述的方法,其特征在于,針對所述包括服務門店名的文本集中的文本進行數據預處理,包括:
獲取文本中的服務門店名,作為標注對象;
對所述標注對象進行分詞處理,得到作為服務門店名的詞及對應的詞頻;
根據所述標注對象從文本中獲取對應服務門店名的特征詞及對應的詞頻;
利用所述作為服務門店名的詞及對應的詞頻和所述對應服務門店名的特征詞及對應的詞頻,形成用于識別服務門店名的詞典。
5.根據權利要求1所述的方法,其特征在于,作為服務門店名的詞包括如下組合形式至少之一:
服務門店名本身;或,
一個開頭詞和一個結尾詞;或,
一個開頭詞、一個結尾詞和至少一個中間詞;
所述對應服務門店名的特征詞包括服務門店名的前一個特征詞和后一個特征詞;
相應的,所述用于識別服務門店名的規則模板包括如下組合形式至少之一:
前一個特征詞、服務門店名本身及后一個特征詞;或,
前一個特征詞、一個開頭詞、一個結尾詞及后一個特征詞;或,
前一個特征詞、一個開頭詞、至少一個中間詞、一個結尾詞及后一個特征詞。
6.一種用于識別服務門店名的設備,其特征在于,所述設備包括:
獲取裝置,用于獲取測試文本;
獲取模塊,用于獲取包括服務門店名的文本集;
數據預處理模塊,用于針對所述包括服務門店名的文本集中的文本進行數據預處理,得到服務門店名的詞及對應的詞頻和服務門店名特征詞及對應的詞頻,形成用于識別服務門店名的詞典,對應服務門店名的特征詞包括服務門店名的前一個特征詞和后一個特征詞;
決策樹構建模塊,用于利用所得到的用于識別服務門店名的詞典進行決策樹構建,以形成用于識別服務門店名的規則模板;
切分處理裝置,用于通過用于識別服務門店名的詞典對所述測試文本進行切分處理,生成詞圖;
匹配裝置,用于將所生成的詞圖與用于識別服務門店名的規則模板進行匹配;
確定裝置,用于若存在匹配,則將所生成的詞圖與用于識別服務門店名的規則模板二者之間的匹配項確定為對應服務門店名的登陸詞。
7.根據權利要求6所述的設備,其特征在于,
所述確定裝置還用于,若存在匹配且所生成的詞圖與用于識別服務門店名的規則模板二者之間的匹配項為多個,則將字段最長的匹配項確定為對應服務門店名的登陸詞。
8.一種計算機可讀存儲介質,其特征在于,所述存儲介質包括一組計算機可執行指令,當所述指令被執行時用于執行權利要求1-5任一項所述用于識別服務門店名的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京泰迪熊移動科技有限公司,未經北京泰迪熊移動科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910223458.6/1.html,轉載請聲明來源鉆瓜專利網。





