[發明專利]用于從用戶生成的內容建立演化本體的系統和方法在審
| 申請號: | 201911031161.6 | 申請日: | 2019-10-28 |
| 公開(公告)號: | CN111104518A | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 劉石竹;黃凱琳;陳力;孫建勛;許寧;張程沖;周輝 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;京東美國科技公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/284;G06F40/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 倪斌 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 用戶 生成 內容 建立 演化 本體 系統 方法 | ||
一種用于構建演化本體數據庫的方法和系統。該方法包括:接收多個數據條目;計算任何兩個數據條目之間的語義相似度得分;基于語義相似度得分來將數據條目集群為多個當前主題;通過將當前主題與使用先前數據條目準備的多個先前主題進行比較來從當前主題中選擇新概念;以及使用新概念來更新演化本體數據庫。通過下式計算任何兩個數據條目之間的語義相似度得分,其中si是特征源的權重,fj是兩個數據條目之間的特征相似度,wj是fj的權重,j、k和n是正整數。
交叉引用
在本公開的描述中引用和討論了包括專利、專利申請和各種出版物的一些參考文獻。提供這樣的參考文獻的引用和/或討論僅是為了闡明本公開的描述,而不是承認任何這樣的參考文獻是本文描述的公開的“現有技術”。在本說明書中引用和討論的所有參考文獻均通過引用以其整體并入本文,其程度與每個參考文獻通過引用獨立地并入本文的程度相同。
技術領域
本公開總體上涉及從復雜和動態數據建立演化本體,更具體地,涉及用于從電子商務網站上用戶生成的內容建立演化本體的系統和方法。
背景技術
本文提供的背景描述是為了總體上呈現本公開內容的目的。在此背景技術部分中所描述的范圍內,目前命名的發明人的工作,以及申請時可能無法視為現有技術的說明書中的某些方面,均未明確地或暗示地承認本公開為現有技術。
計算機中介通信正在成為當今社會共享和交換信息的最便捷、最重要的方式。人們可以直接將他們的反饋意見提交給特定的商家或制造商,并通過讀取其他用戶的評論,來在做出許多常規消費者購買決定之前進行在線研究。然而,僅通過檢查單個評論得分或多個正面或負面評論,很難有效利用網絡上大量且多樣的用戶生成的內容。
因此,在本領域中存在解決前述缺陷和不足的未解決的需求。
發明內容
在某些方面,本公開涉及一種用于構建演化本體數據庫的方法。在某些實施例中,該方法包括:
計算設備接收多個數據條目;
計算設備基于數據條目的特征源和特征相似度來計算任何兩個數據條目之間的語義相似度得分;
計算設備基于語義相似度得分將數據條目集群為多個當前主題;
計算設備通過將當前主題與使用先前數據條目準備的多個先前主題進行比較來從當前主題中選擇新概念;以及
計算設備使用新概念來更新演化本體數據庫。
在某些實施例中,任何兩個數據條目之間的語義得分通過下式計算:
其中si是特征源的權重,fj是兩個數據條目之間的特征相似度之一,wj是fj的權重,j、k和n是正整數。
在某些實施例中,數據條目是用戶生成的反饋,并且計算語義相似度得分的步驟包括:通過情緒分析器預測情緒相似度值,情緒相似度值表示兩個數據條目之間關于正面反饋、負面反饋、中性反饋、非常負面反饋以及互聯網濫用的相似度;通過相似度計算器預測文本相似度值,文本相似度值表示從兩個數據條目中提取的文本的語義之間的相似度;通過中性語言解析器預測句法相似度值,句法相似度值表示兩個數據條目的文本的句法復雜度。
在某些實施例中,集群數據條目的步驟還包括:使用情緒相似度值、文本相似度值和句法相似度值計算兩個數據條目的語義相似度得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;京東美國科技公司,未經北京京東尚科信息技術有限公司;京東美國科技公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911031161.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示裝置
- 下一篇:柔性熱電發電器及其制造方法
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





