[發明專利]一種數據查詢方法、裝置、電子設備和存儲介質在審
| 申請號: | 202210436608.3 | 申請日: | 2022-04-25 |
| 公開(公告)號: | CN114780601A | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 楊萬征;蔡超;武學敏;徐芳;王雪 | 申請(專利權)人: | 中譯語通科技股份有限公司 |
| 主分類號: | G06F16/2457 | 分類號: | G06F16/2457;G06F16/2455;G06F16/2453 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張萌 |
| 地址: | 100049 北京市石*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 查詢 方法 裝置 電子設備 存儲 介質 | ||
1.一種數據查詢方法,其特征在于,所述方法包括:
從查詢終端發送的待查詢內容中提取待查詢詞匯;
從數據庫中篩選所述待查詢詞匯的至少一個技術詞;所述技術詞與所述待查詢詞匯的第一相關度超過第一閾值;所述技術詞是預先錄入的用于描述技術手段的詞匯;
針對預設的每個業務維度,基于所述數據庫中存儲的多個第一企業、每個第一企業在該業務維度下的業務數據、所述業務數據與所述待查詢詞匯的第二相關度、所述業務數據與所述技術詞的匹配度,從所述多個第一企業中確定至少一個第二企業;所述業務維度包括經營維度、技術維度、產品維度、商標維度;
基于所述第一相關度、所述第二相關度、所述匹配度以及預先為每個所述業務維度設置的權重,計算每個第二企業與所述待查詢內容的第三相關度;
將包含每個目標企業、所述目標企業的第三相關度的查詢結果發送到所述查詢終端;所述目標企業為所述第三相關度超過第二閾值的第二企業。
2.根據權利要求1所述的方法,其特征在于,針對預設的每個業務維度,基于所述數據庫中存儲的多個第一企業、每個第一企業在該業務維度下的業務數據、所述業務數據與所述待查詢詞匯的第二相關度、所述業務數據與所述技術詞的匹配度,從所述多個第一企業中確定至少一個第二企業,包括:
針對每個所述業務維度,基于所述數據庫中存儲的每個所述第一企業的業務維度標簽,從所述數據庫中篩選包含該業務維度的第一企業;每個所述業務維度標簽對應一個所述業務維度;
針對篩選的每個所述第一企業,從所述數據庫中提取屬于該業務維度內的業務數據;所述業務數據所屬的業務維度是預先標記的;
從所述業務數據中提取與所述待查詢詞匯的語義相關度超過第三閾值的第一數據;
針對每個所述第一數據,若所述第一數據與目標技術詞的匹配度超過第四閾值,則將所述第一數據確定為第二數據;所述目標技術詞為所述技術詞中的至少一個;
基于每個第一企業的第二數據,根據所述第二數據的數據量、每個所述第二數據的匹配度、每個所述第二數據的語義相關度,從所述多個第一企業中確定至少一個第二企業。
3.根據權利要求2所述的方法,其特征在于,所述業務維度的標記方法包括:
基于所述數據庫中存儲的所述第一企業的企業數據,針對每個所述第一企業,通過實體識別算法從所述企業數據中提取至少一個企業特征;所述企業數據包括所述第一企業在每個所述業務維度下的業務數據;所述企業特征用于描述所述第一企業的屬性;
通過預先訓練好的維度標記模型,確定每個所述企業特征所屬的目標業務維度,并為所述企業特征標記與該目標業務維度中每個業務維度對應的第一標簽;所述目標業務維度為所述業務維度中的至少一個;
基于為所述第一企業的每個企業特征標記的第一標簽、所述第一標簽對應的目標業務維度,統計所述第一企業的業務維度標簽。
4.根據權利要求3所述的方法,其特征在于,在為所述企業特征標記與該目標業務維度中每個業務維度對應的第一標簽之前,所述方法還包括:
通過實體對齊方法、屬性對齊方法對所述企業特征進行清洗;
通過語義識別算法識別清洗后的每個企業特征的語義,并基于所述語義為所述企業特征標記第二標簽;所述第二標簽包括:技術標簽、屬性標簽;
基于所述第二標簽和所述企業特征,為每個所述第一企業生成企業畫像。
5.根據權利要求1所述的方法,其特征在于,從數據庫中篩選所述待查詢詞匯的至少一個技術詞,包括:
基于所述待查詢詞匯,在所述數據庫中查找所述待查詢詞匯的目標圖譜;
從所述目標圖譜中提取與所述待查詢詞匯存在目標關系的至少一個技術詞;所述目標關系包括:從屬關系、應用關系。
6.根據權利要求1所述的方法,其特征在于,將所述查詢結果發送到所述查詢終端之前,所述方法還包括:
從所述查詢結果中提取每個所述目標企業的第三相關度;
基于所述第三相關度的數值,將所述查詢結果中的目標企業進行排序,以得到包含排序結果的企業列表;
將所述企業列表存儲到所述查詢結果中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中譯語通科技股份有限公司,未經中譯語通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210436608.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





