[發(fā)明專利]回饋數(shù)據(jù)圖譜生成方法、生成設備、問答設備及冰箱在審
| 申請?zhí)枺?/td> | 202210713627.6 | 申請日: | 2022-06-22 |
| 公開(公告)號: | CN115129890A | 公開(公告)日: | 2022-09-30 |
| 發(fā)明(設計)人: | 孔令磊;劉昊;魏志強;李桂璽;張景瑞;曾誰飛;于麗紅;張佩佩 | 申請(專利權)人: | 青島海爾電冰箱有限公司;中國海洋大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/33;G06F40/211;G06F40/289 |
| 代理公司: | 蘇州威世朋知識產權代理事務所(普通合伙) 32235 | 代理人: | 沈曉敏 |
| 地址: | 266101 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 回饋 數(shù)據(jù) 圖譜 生成 方法 設備 問答 冰箱 | ||
本發(fā)明揭示了一種回饋數(shù)據(jù)圖譜生成方法、生成設備、問答設備及冰箱,其中,方法包括:遍歷原始信息庫中所有原始語料,生成基礎目錄數(shù)據(jù);根據(jù)基礎目錄數(shù)據(jù),抽取形成實體信息元素以及實體關系元素;根據(jù)基礎目錄數(shù)據(jù)和原始信息庫,依次執(zhí)行屬性融合以及同屬性句段聚合,生成對應于不同文本句段數(shù)據(jù)的多組句段屬性元素;根據(jù)實體信息元素構建實體節(jié)點,根據(jù)實體關系元素建立實體間的關聯(lián)關系,將句段屬性元素按照句段與實體間的關聯(lián)關系,對應存入所述實體節(jié)點中,生成回饋數(shù)據(jù)圖譜。本發(fā)明提供的回饋數(shù)據(jù)圖譜生成方法,生成效率高,生成的圖譜上下文一致性更好,粒度級更細,支持精度更高和速度更快的檢索需求。
技術領域
本發(fā)明涉及信息技術領域,尤其涉及一種回饋數(shù)據(jù)圖譜生成方法、生成設備、問答設備及冰箱。
背景技術
現(xiàn)如今,搭載自然語言處理系統(tǒng)以便于進行信息檢索,已經(jīng)成為人們工作和生活中不可或缺的一部分,當前的檢索引擎主要通過對輸入的語句進行關鍵詞拆分,對既有的數(shù)據(jù)庫進行遍歷檢索,并按照關鍵詞的重復度進行降序排列,以方便人們獲取想要得到的信息。然而,由于數(shù)據(jù)庫內的數(shù)據(jù)排列較為零散,每次更換檢索關鍵詞都需要對整個數(shù)據(jù)庫進行遍歷,檢索效果差,且回饋數(shù)據(jù)生成的速度緩慢。
現(xiàn)有技術中還提供一種對數(shù)據(jù)庫建立知識圖譜,將數(shù)據(jù)庫中較為核心的內容提煉為實體,從而建立實體節(jié)點以及實體之間的關聯(lián)關系,以使用戶輸入關鍵詞后,可以根據(jù)關鍵詞與實體之間的相似度進行檢索,從而加快檢索速度。但此種技術方案仍然存在一些缺陷:(1)更多地關注與實體本身及實體之間的關系,輕視了實體與數(shù)據(jù)庫中其他內容之間的關聯(lián)關系,導致檢索抽取時輸出的內容紛繁復雜,且與輸入檢索關鍵詞的匹配度不高;(2)抽取實體及相關數(shù)據(jù)的過程中,在相關數(shù)據(jù)分布于數(shù)據(jù)庫中多個位置時,仍然需要對數(shù)據(jù)庫進行遍歷才能得到完整的相關數(shù)據(jù),對提升檢索速度的貢獻較小;(3)即使建立了實體與相關數(shù)據(jù)的關聯(lián)性,現(xiàn)有技術中相關數(shù)據(jù)的劃分較為大略,通常是以大量的數(shù)據(jù)作為一組相關數(shù)據(jù),數(shù)據(jù)圖譜的粒度級較大,導致檢索精準度較低。
發(fā)明內容
本發(fā)明的目的之一在于提供一種回饋數(shù)據(jù)圖譜生成方法,以解決現(xiàn)有技術中生成方法搭建的圖譜檢索結果內容復雜、匹配度低,提高檢索速度的程度有限,以及粒度級較粗所導致的檢索精準度低的技術問題。
本發(fā)明的目的之一在于提供一種回饋數(shù)據(jù)圖譜生成設備。
本發(fā)明的目的之一在于提供一種問答設備。
本發(fā)明的目的之一在于提供一種冰箱。
為實現(xiàn)上述發(fā)明目的之一,本發(fā)明一實施方式提供一種回饋數(shù)據(jù)圖譜生成方法,包括:遍歷原始信息庫中所有原始語料,生成基礎目錄數(shù)據(jù);根據(jù)所述基礎目錄數(shù)據(jù),抽取形成實體信息元素以及實體關系元素;根據(jù)所述基礎目錄數(shù)據(jù)和所述原始信息庫,依次執(zhí)行屬性融合以及同屬性句段聚合,生成對應于不同文本句段數(shù)據(jù)的多組句段屬性元素;其中,所述文本句段數(shù)據(jù)在所述原始語料中包含有多組;根據(jù)所述實體信息元素構建實體節(jié)點,根據(jù)所述實體關系元素建立實體間的關聯(lián)關系,將所述句段屬性元素按照句段與實體間的關聯(lián)關系,對應存入所述實體節(jié)點中,生成回饋數(shù)據(jù)圖譜。
作為本發(fā)明一實施方式的進一步改進,所述方法具體包括:根據(jù)所述基礎目錄數(shù)據(jù)在所述原始信息庫中檢索,得到對應于不同基礎目錄數(shù)據(jù)的多組待處理文本;根據(jù)所述待處理文本,依次執(zhí)行雙向特征表示以及屬性分類識別,得到對應于不同文本句段數(shù)據(jù)的多組初級屬性數(shù)據(jù);根據(jù)所述初級屬性數(shù)據(jù)、所述文本句段數(shù)據(jù)以及實體指向數(shù)據(jù),依次執(zhí)行屬性融合和同屬性句段聚合,生成所述句段屬性元素;其中,所述實體指向數(shù)據(jù)表征所述文本句段數(shù)據(jù)與所述實體間的關聯(lián)關系。
作為本發(fā)明一實施方式的進一步改進,所述方法具體包括:根據(jù)所述初級屬性數(shù)據(jù)之間的相似度,對所述初級屬性數(shù)據(jù)執(zhí)行屬性融合,重新確定對應于不同文本句段數(shù)據(jù)的多組句段屬性數(shù)據(jù),并根據(jù)所述句段屬性數(shù)據(jù),對句段屬性數(shù)據(jù)相同的多組文本句段數(shù)據(jù)執(zhí)行同屬性句段聚合,重新確定對應于不同文本句段數(shù)據(jù)的多組實體指向數(shù)據(jù);根據(jù)所述實體指向數(shù)據(jù)、所述句段屬性數(shù)據(jù)以及所述文本句段數(shù)據(jù),生成所述句段屬性元素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島海爾電冰箱有限公司;中國海洋大學,未經(jīng)青島海爾電冰箱有限公司;中國海洋大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210713627.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





