[發明專利]用于從用戶生成的內容建立演化本體的系統和方法在審
| 申請號: | 201911031161.6 | 申請日: | 2019-10-28 |
| 公開(公告)號: | CN111104518A | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 劉石竹;黃凱琳;陳力;孫建勛;許寧;張程沖;周輝 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;京東美國科技公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/284;G06F40/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 倪斌 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 用戶 生成 內容 建立 演化 本體 系統 方法 | ||
1.一種用于構建演化本體數據庫的方法,包括:
計算設備接收多個數據條目;
所述計算設備基于所述數據條目的特征源和特征相似度來計算所述數據條目中的任何兩個數據條目之間的語義相似度得分;
所述計算設備基于所述語義相似度得分來將所述數據條目集群為多個當前主題;
所述計算設備通過將所述當前主題與使用先前數據條目準備的多個先前主題進行比較來從所述當前主題中選擇新概念;以及
所述計算設備使用所述新概念來更新所述演化本體數據庫。
2.根據權利要求1所述的方法,其中,通過下式計算所述數據條目中的任何兩個數據條目之間的語義相似度得分:
其中,si是所述特征源的權重,fj是所述數據條目中的所述兩個數據條目之間的特征相似度之一,wj是fj的權重,并且j、k和n是正整數。
3.根據權利要求2所述的方法,其中,所述數據條目是用戶生成的反饋,并且計算語義相似度得分的步驟包括:
通過情緒分析器預測情緒相似度值,所述情緒相似度值表示所述兩個數據條目之間在正面反饋、負面反饋、中性反饋、非常負面反饋和互聯網濫用方面的相似度;
通過相似度計算器預測文本相似度值,所述文本相似度值表示從所述兩個數據條目中提取的文本的語義之間的相似度;以及
通過中性語言解析器預測句法相似度值,所述句法相似度值表示所述兩個數據條目的文本的句法復雜度。
4.根據權利要求3所述的方法,其中,將所述數據條目集群的步驟還包括:
使用所述情緒相似度值、所述文本相似度值和所述句法相似度值來計算所述兩個數據條目的語義相似度得分。
5.根據權利要求2所述的方法,其中,從所述當前主題中選擇新概念的步驟包括:
檢索所述當前主題和所述先前主題;
從所述當前主題和所述先前主題中識別近似重復主題;
從所述當前主題中去除所述近似重復主題以獲得非重復主題;
將所述非重復主題與所述本體數據庫中的概念進行比較,以獲得新穎概念候選,其中,所述新穎概念候選是與所述本體數據庫中的任何概念的相似度低的非重復主題;以及
根據來自所述本體數據庫的管理員的指令來驗證所述新穎概念候選,以獲得所述新概念。
6.根據權利要求5所述的方法,其中,更新所述演化本體數據庫的步驟包括:
通過將至少一個經驗證的概念與所述本體中的概念進行比較來檢測最相關的父概念;
計算所述至少一個經驗證的概念與兄弟概念之間的相似度以獲得最相似的兄弟概念,其中,所述兄弟概念是所述最相關的父概念的子概念;
基于所述最相關的父概念和所述最相似的兄弟概念來提出本體調整;以及
使用所提出的本體調整中的最優調整來更新所述本體。
7.根據權利要求6所述的方法,其中,所提出的調整包括插入調整,在所述插入調整中,所述新概念被定義為所述最相關的父概念的子節點。
8.根據權利要求6所述的方法,其中,所提出的調整包括提升調整,在所述提升調整中,所述新概念被定義為所述最相關的父概念的兄弟節點。
9.根據權利要求6所述的方法,其中,所提出的調整包括移位調整,在所述移位調整中,所述新概念被定義為所述最相似的兄弟概念的子節點。
10.根據權利要求6所述的方法,其中,所提出的調整包括合并調整,在所述合并調整中,將所述新主題與所述最相似的兄弟概念進行組合以形成組合概念,所述組合概念被定義為所述最相關的父概念的子節點,并且所述新主題和所述最相似的兄弟概念被定義為所述組合概念的子節點。
11.根據權利要求2所述的方法,其中,所述本體數據庫中的每個概念由分類模型定義,所述分類模型包括邏輯遞歸模型和梯度提升分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;京東美國科技公司,未經北京京東尚科信息技術有限公司;京東美國科技公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911031161.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示裝置
- 下一篇:柔性熱電發電器及其制造方法
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





