[發(fā)明專利]行業(yè)信息獲取方法和裝置、電子設備和介質在審
| 申請?zhí)枺?/td> | 201911115346.5 | 申請日: | 2019-11-14 |
| 公開(公告)號: | CN111104791A | 公開(公告)日: | 2020-05-05 |
| 發(fā)明(設計)人: | 胡作海;杜波;周晗;范成;柳超 | 申請(專利權)人: | 北京金堤科技有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06F40/30;G06F16/35;G06F16/335;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京思源智匯知識產(chǎn)權代理有限公司 11657 | 代理人: | 毛麗琴 |
| 地址: | 100086 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行業(yè) 信息 獲取 方法 裝置 電子設備 介質 | ||
1.一種行業(yè)信息獲取方法,其特征在于,包括:
將待識別對象輸入神經(jīng)網(wǎng)絡,利用所述神經(jīng)網(wǎng)絡預測所述待識別對象中的行業(yè)詞匯;
從行業(yè)目錄信息中獲取與所述待識別對象中的行業(yè)詞匯匹配的行業(yè)詞匯中文本長度最長的行業(yè)詞匯;
基于所述文本長度最長的行業(yè)詞匯確定所述待識別對象的行業(yè)信息。
2.根據(jù)權利要求1所述的方法,其特征在于,所述行業(yè)目錄信息基于所述神經(jīng)網(wǎng)絡對多個待識別對象預測的行業(yè)詞匯構建得到。
3.根據(jù)權利要求2所述的方法,其特征在于,所述行業(yè)目錄信息包括至少一個層級的行業(yè)詞匯,較高層級的行業(yè)詞匯的文本長度小于較低層級的行業(yè)詞匯的文本長度;
基于所述神經(jīng)網(wǎng)絡對多個待識別對象預測的行業(yè)詞匯構建得到所述行業(yè)目錄信息,包括:
基于所述神經(jīng)網(wǎng)絡分別預測多個待識別對象中的行業(yè)詞匯;
識別所述多個待識別對象中的行業(yè)詞匯的文本長度和相互之間包含關系,
將文本長度最短的行業(yè)詞匯作為最高層級的目錄,按照文本長度較短的行業(yè)詞匯包含于文本長度較長的行業(yè)詞匯、以及文本長度較短的行業(yè)詞匯的層級高于文本長度較長的行業(yè)詞匯的層級的原則,基于所述多個待識別對象中的行業(yè)詞匯架構至少一個層級的目錄,得到所述行業(yè)目錄信息。
4.根據(jù)權利要求3所述的方法,其特征在于,所述基于所述神經(jīng)網(wǎng)絡分別預測多個待識別對象中的行業(yè)詞匯之后,還包括:
對所述多個待識別對象中的行業(yè)詞匯進行聚類;
所述識別所述多個待識別對象中的行業(yè)詞匯的文本長度和相互之間包含關系,包括:識別聚類后的所述多個待識別對象中的行業(yè)詞匯的文本長度和相互之間包含關系,以基于聚類后的所述多個待識別對象中的行業(yè)詞匯架構至少一個層級的目錄,得到所述行業(yè)目錄信息。
5.根據(jù)權利要求3或4所述的方法,其特征在于,還包括:
按照預設周期獲取至少一個新增待識別對象;
基于所述神經(jīng)網(wǎng)絡分別預測所述至少一個新增待識別對象中的行業(yè)詞匯;
基于所述新增待識別對象中的行業(yè)詞匯與所述行業(yè)目錄信息中行業(yè)詞匯的文本長度和包含關系,對所述行業(yè)目錄信息進行更新。
6.根據(jù)權利要求5所述的方法,其特征在于,所述基于所述神經(jīng)網(wǎng)絡分別預測所述至少一個新增待識別對象中的行業(yè)詞匯之后,還包括:
對所述至少一個新增待識別對象中的行業(yè)詞匯和所述行業(yè)目錄信息中的行業(yè)詞匯進行聚類;
所述基于所述新增待識別對象中的行業(yè)詞匯與所述行業(yè)目錄信息中行業(yè)詞匯的文本長度和包含關系,對所述行業(yè)目錄信息進行更新,包括:基于聚類后的所述新增待識別對象中的行業(yè)詞匯與所述行業(yè)目錄信息中行業(yè)詞匯的文本長度和包含關系,對所述行業(yè)目錄信息進行更新。
7.根據(jù)權利要求1-6任一所述的方法,其特征在于,所述將待識別對象輸入神經(jīng)網(wǎng)絡之前,還包括:
接收搜索請求,所述搜索請求中包括所述待識別對象;
基于所述搜索請求進行搜索,得到多個候選對象;
所述基于所述文本長度最長的行業(yè)詞匯確定所述待識別對象的行業(yè)信息之后,還包括:
基于所述行業(yè)信息對所述候選對象進行排序,并返回搜索結果,所述搜索結果中包括排序后的候選對象。
8.根據(jù)權利要求1-7任一所述的方法,其特征在于,所述基于所述文本長度最長的行業(yè)詞匯確定所述待識別對象的行業(yè)信息之后,還包括:
獲取與所述待識別對象的行業(yè)信息匹配度最高的至少一個推薦對象;
返回搜索結果,所述搜索結果中包括所述多個候選對象和所述至少一個推薦對象。
9.根據(jù)權利要求1-8任一所述的方法,其特征在于,所述神經(jīng)網(wǎng)絡的訓練,包括:
利用所述神經(jīng)網(wǎng)絡標注所述訓練樣本中各詞的詞性;所述訓練樣本上標注有行業(yè)詞匯信息,所述訓練樣本上標注的行業(yè)詞匯信息包括:所述訓練樣本中各詞的詞性;
根據(jù)所述神經(jīng)網(wǎng)絡標注的所述訓練樣本中各詞的詞性與所述訓練樣本上標注的各詞的詞性之間的差異,對所述神經(jīng)網(wǎng)絡進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金堤科技有限公司,未經(jīng)北京金堤科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911115346.5/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





