[發明專利]文本信息的獲取方法、裝置、存儲介質及計算機設備在審
| 申請號: | 202010190440.3 | 申請日: | 2020-03-18 |
| 公開(公告)號: | CN111563382A | 公開(公告)日: | 2020-08-21 |
| 發明(設計)人: | 趙秋博 | 申請(專利權)人: | 大箴(杭州)科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F16/35 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威;賈依嬌 |
| 地址: | 310000 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 信息 獲取 方法 裝置 存儲 介質 計算機 設備 | ||
1.一種文本信息的獲取方法,其特征在于,包括:
接收文本信息的獲取請求,所述獲取請求攜帶有業務的標識信息;
根據所述標識信息,確定所述業務所需的多維度文本標簽;
根據所述多維度文本分類標簽查詢預設文本信息庫,分別抓取所述業務所需的多維度文本信息。
2.根據權利要求1所述的方法,其特征在于,在所述接收文本信息的獲取請求之前,所述方法還包括:
獲取原始文本數據和不同業務各自所需的多個分類維度;
根據所述多個分類維度對所述原始文本數據進行打標處理,得到所述不同業務所需的多維度文本信息;
將所述多維度文本信息按照其被標注的多維度文本標簽分別存儲至預設文本信息庫。
3.根據權利要求2所述的方法,其特征在于,針對所述多個分類維度中的目標分類維度,根據所述目標分類維度對所述原始文本數據進行打標處理,得到所述不同業務所需的目標維度下的文本信息,包括:
根據所述目標分類維度構建預設自然語言分類模型,并利用所述預設自然語言分類模型對所述原始文本數據進行打標處理,得到所述不同業務所需的目標維度下的文本信息。
4.根據權利要求2所述的方法,其特征在于,針對所述多個分類維度中的實體分類維度,根據所述實體分類維度對所述原始文本數據進行打標處理,得到所述不同業務所需的實體維度下的文本信息,包括:
根據所述實體分類維度,構建預設實體字典和/或設定預設分類規則;
利用預設實體識別模型對所述原始文本數據進行實體識別,得到所述原始文本數據中存在的實體信息;
利用所述預設實體字典和/或所述預設分類規則對所述實體信息進行實體打標處理,得到所述不同業務所需的實體維度下的文本信息。
5.根據權利要求2所述的方法,其特征在于,針對所述多個分類維度中的目標分類維度,根據所述目標分類維度對所述原始文本數據進行打標處理,得到所述不同業務所需的目標維度下的文本信息,包括:
根據所述目標分類維度構建預設正則分類模型;
根據預設提取規則提取所述原始文本數據中的各個關鍵詞;
利用所述預設正則分類模型對所述各個關鍵詞進行打標處理,得到所述不同業務所需的目標維度下的文本信息。
6.根據權利要求2所述的方法,其特征在于,所述方法還包括:
響應于所述業務方新增業務,根據所述新增業務增加的分類維度對所述原始文本數據進行打標處理。
7.根據權利要求1-6任一項所述的方法,其特征在于,在所述根據所述多維度文本分類標簽查詢預設文本信息庫,分別抓取所述業務所需的多維度文本信息之后,所述方法還包括:
根據輸出的多維度文本信息,構建所述業務對應的預設業務模型。
8.一種文本信息的獲取裝置,其特征在于,包括:
接收單元,用于接收文本信息的獲取請求,所述獲取請求攜帶有業務的標識信息;
確定單元,用于根據所述標識信息,確定所述業務所需的多維度文本標簽;
查詢單元,用于根據所述多維度文本分類標簽查詢預設文本信息庫,分別抓取所述業務所需的多維度文本信息。
9.一種存儲介質,所述存儲介質中存儲有至少一可執行指令,所述可執行指令使處理器執行如權利要求1-7中任一項所述的文本信息的獲取方法對應的操作。
10.一種終端,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;
所述存儲器用于存放至少一可執行指令,所述可執行指令使所述處理器執行如權利要求1-7中任一項所述的文本信息的獲取方法對應的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大箴(杭州)科技有限公司,未經大箴(杭州)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010190440.3/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





