[發明專利]中文分詞方法及裝置在審
| 申請號: | 201810463351.4 | 申請日: | 2018-05-15 |
| 公開(公告)號: | CN108763200A | 公開(公告)日: | 2018-11-06 |
| 發明(設計)人: | 王江;高翔;紀達麒;陳運文 | 申請(專利權)人: | 達而觀信息科技(上海)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京卓唐知識產權代理有限公司 11541 | 代理人: | 唐海力;李志剛 |
| 地址: | 201203 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標類別 目標文本信息 中文分詞 查詢操作 數據映射 分類器 預設 查詢結果返回 準確度 技術效果 接收用戶 用戶發送 準確率 分詞 發送 申請 | ||
1.一種中文分詞方法,將用戶在移動終端輸入的待分詞文本發送至后臺服務器,其特征在于,所述方法包括:
接收用戶發送來的第一目標文本信息;
將所述第一目標文本信息通過第一分類器進行數據映射,得到對應的第一目標類別信息,
其中,所述第一分類器用于作為將所述第一目標文本信息中的文本數據映射到指定類別的分類模型;
根據所述第一目標類別信息進行預設查詢操作并將查詢結果返回至所述用戶。
2.根據權利要求1所述的中文分詞方法,其特征在于,所述將所述第一目標文本信息通過第一分類器進行數據映射,得到對應的第一目標類別信息包括:
建立機器學習模型,并根據預設類別訓練語料進行模型訓練,得到第一機器學習模型;
通過所述第一機器學習模型對所述第一目標文本信息進行解析,得到所述第一目標類別信息。
3.根據權利要求1所述的中文分詞方法,其特征在于,所述將所述第一目標文本信息通過第一分類器進行數據映射,得到對應的第一目標類別信息還包括:
根據所述第一目標文本信息,得到第一類別字典,其中,所述第一類別字典用于作為所述第一目標文本信息所對應的類別;
根據所述第一類別字典和所述第一目標文本信息,得到對應的第二類別字典,其中,所述第二類別字典從屬與所述第一類別字典。
4.根據權利要求1所述的中文分詞方法,其特征在于,所述根據所述第一目標類別信息進行預設查詢操作并將查詢結果返回至所述用戶包括:
建立所述移動終端與所述服務器之間基于RPC通信協議的長連接通信;
建立所述長連接通信與預設業務線程的關聯關系;
監測所述業務線程是否被線程池回收;
如果監測所述預設業務線程被線程池回收,則斷開所述長連接通信。
5.根據權利要求4所述的中文分詞方法,其特征在于,所述根據所述第一目標類別信息進行預設查詢操作并將查詢結果返回至所述用戶還包括:
建立所述長連接與唯一標識符的關聯關系;
根據所述唯一標識符,將對應的所述業務線程的查詢結果返回至所述用戶。
6.一種中文分詞裝置,將用戶在移動終端輸入的待分詞文本發送至后臺服務器,其特征在于,包括:
文本接收單元,用于接收用戶發送來的第一目標文本信息;
分詞單元,用于將所述第一目標文本信息通過第一分類器進行數據映射,得到對應的第一目標類別信息;
查詢單元,用于根據所述第一目標類別信息進行預設查詢操作并將查詢結果返回至所述用戶。
7.根據權利要求6所述的中文分詞裝置,所述分詞單元包括:
機器學習模型獲取模塊,用于建立機器學習模型,并根據預設類別訓練語料進行模型訓練,得到第一機器學習模型;
機器學習模型分詞模塊,用于通過所述第一機器學習模型對所述第一目標文本信息進行解析,得到所述第一目標類別信息。
8.根據權利要求6所述的中文分詞裝置,所述分詞單元還包括:
主字典獲取模塊,用于根據所述第一目標文本信息,得到第一類別字典,其中,所述第一類別字典用于作為所述第一目標文本信息所對應的類別;
子字典獲取模塊,用于根據所述第一類別字典和所述第一目標文本信息,得到對應的第二類別字典,其中,所述第二類別字典從屬與所述第一類別字典。
9.根據權利要求6所述的中文分詞裝置,所述查詢單元包括:
RPC建立模塊,用于建立所述移動終端與所述服務器之間基于RPC通信協議的長連接通信;
綁定關系建立模塊,用于建立所述長連接通信與預設業務線程的關聯關系;
監測模塊,用于監測所述業務線程是否被線程池回收;
斷開模塊,用于如果監測所述預設業務線程被線程池回收,則斷開所述長連接通信。
10.根據權利要求6所述的中文分詞裝置,所述查詢單元還包括:
關聯關系建立模塊,用于建立所述業務線程與唯一標識符的關聯關系;
查詢模塊,用于根據所述唯一標識符,將對應的所述業務線程的查詢結果返回至所述用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于達而觀信息科技(上海)有限公司,未經達而觀信息科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810463351.4/1.html,轉載請聲明來源鉆瓜專利網。





