[發明專利]一種容錯的基于圖譜架構的智能語義搜索方法有效
| 申請號: | 201710435186.7 | 申請日: | 2017-06-10 |
| 公開(公告)號: | CN107103100B | 公開(公告)日: | 2019-07-30 |
| 發明(設計)人: | 段玉聰;邵禮旭 | 申請(專利權)人: | 海南大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 570228 海*** | 國省代碼: | 海南;46 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 投入 驅動 容錯 基于 數據 圖譜 信息 知識 架構 智能 語義 搜索 方法 | ||
1.一種容錯的基于圖譜架構的智能語義搜索方法,其所包含的步驟如下:
步驟1)根據已有資源,建立處理資源框架;
步驟2)獲取用戶投入的金額和預等待時間,建立用戶投入模型,預等待時間決定搜索的次數、每次搜索的項數和每次要搜索的時間,設定每次搜索的項數和每項要搜索的時間是固定的:
步驟3)獲取用戶搜索需求,允許用戶以自然語言文本描述的形式輸入其信息需求;
步驟4)提取用戶搜索需求關鍵詞;
步驟5)遍歷處理資源架構,搜索相關資源,根據步驟4提取出的關鍵詞,遍歷處理資源架構,尋找相關資源;
步驟6)判斷能否找到相關資源,若不能找到,在知識圖譜上通過關系推理挖掘新的實體和關聯關系,增強圖譜結點密度和邊密度,更新處理資源架構,然后重新遍歷處理資源架構,尋找資源;
步驟7)構建模糊傾向性詞匯表,模糊傾向性詞匯指的是 “可能”、“或許”這種傾向性不確定的詞語;
步驟8)對找到的資源根據傾向性按照正向和反向進行分類,答案中包括模糊傾向詞匯表中詞匯的資源視為無用資源;
步驟9)根據步驟(8)得到兩種傾向性資源,統計正向資源和反向資源在資源總數所占的比重” “M表示用戶投入的金額,T表示預等待時間,S_times表示搜索的次數、S_item表示每次搜索的項數,Pert_item表示每次要搜索的時間”、“weight表示兩種傾向性資源,統計正向資源和反向資源在資源總數所占的比重,其中Resource正表示正向資源數,Resource反表示反向資源數,Resource總表示資源總數:
步驟10)根據步驟9得到的正反雙向資源所占權重分配用戶投入,確定正向和反向搜索分別要花費的時間和金額,進而確定正反雙向搜索分別要遞進搜索的次數:
其中T(正/反)表示正向與反向搜索分別要花費的時間、M(正/反)表示正向與反向搜索分別要花費的金額、weight(正/反)表示正反雙向資源所占權重,正/反表示的含義是正或反;
步驟11)根據步驟8得到的資源按照資源中的關鍵詞進行關聯因素遞進搜索,并計算得到信息的熵值,熵值范圍是0到1,熵值越大,信息傾向越分散,可信度越低,資源是有時效性的,是按照某一關聯因素進行遞進搜索時,在Tk時間下得到的資源的熵值,pi是每類答案出現的概率,entropy表示按照某一關聯因素進行遞進搜索時,在不同時效下得到資源的加權平均熵值,Timeliness是Tk時間資源的時效性,Ts是資源開始出現的時間,Tt是資源終止傳播的時間,Tc是當前搜索者搜索資源的時間:
(7)
步驟12)根據步驟9得到的遞進搜索項的熵,計算資源可信度Confidence,設定在搜索前正反傾向的資源可信度都為1,n是搜索的次數,m是每次搜索的條目總數,itemi表示條目i,是按條目i遞進搜索得到的資源的熵:
(9)
步驟13)根據步驟10得到的資源的可信度,判斷正向資源可信度和反向資源可信度的比值是否大于閾值T或小于1/T,該閾值可根據學習算法得到,若可信度比值滿足閾值條件,返回可信度大的資源給搜索者;否則步驟11遍歷處理資源架構繼續遞進搜索;
步驟14)獲取用戶反饋,若用戶對答案不滿意,提示用戶是否增加投入重新檢索,若用戶增加了投入,返回步驟10重新分配正向和反向投入比例,繼續遞進搜索。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海南大學,未經海南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710435186.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:帶溫控瞬熱模組的智能凈水機
- 下一篇:一種柔性印制電路板構造





