[發明專利]一種移動應用的本體庫的構建方法及系統有效
| 申請號: | 201210585905.0 | 申請日: | 2012-12-28 |
| 公開(公告)號: | CN103020293B | 公開(公告)日: | 2019-02-05 |
| 發明(設計)人: | 龐文博;楊鍇 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 移動 應用 本體 構建 方法 系統 | ||
本發明提供了一種移動應用的本體庫的構建方法,包括:將數據庫中移動應用的標題和簡介文本分別在預先生成的概念標簽集合和屬性標簽集合中進行匹配,為匹配到的概念標簽和屬性標簽分配權重值;依據權重值由高到低排序后的概念標簽,從預先生成的概念標簽樹中獲得概念標簽路徑;依據概念標簽路徑中的概念標簽查詢預先生成的概念標簽與屬性標簽的關聯關系,獲得屬性標簽;利用獲得的概念標簽路徑及關聯的屬性標簽標注所述移動應用;本發明還提供一種移動應用的本體庫的構建系統。根據本發明提供的技術方案,能夠自動高效的為移動應用標注概念標簽和屬性標簽。
【技術領域】
本發明涉及互聯網應用領域,尤其涉及一種移動應用的本體庫的構建方法及系統。
【背景技術】
隨著移動網絡和智能終端的迅猛發展,與移動應用(APP,Application)有關的需求也日益旺盛,例如,移動應用的檢索、移動應用的推薦等。為了滿足檢索需求和推薦需求,目前在數據庫中都存儲有移動應用的類別信息和簡介,用于移動應用的檢索和推薦,移動應用的類別信息是由運維人員進行人工標注的,因此,移動應用的信息標注完全依賴于人工,數量快速增長的移動應用,如果仍然使用人工標注信息的方式,將給研發人員帶來巨大工作量,耗費較多的人力物力,而且不能對新增移動應用進行及時標注,效率較低;此外,目前移動應用的類別信息的粒度比較粗略,不能有效地描述出移動應用之間的功能差異,也不能描述出移動應用的屬性特征。因此,為了能夠滿足移動應用的各種需求,構建出有效描述移動應用功能和屬性的知識體系是亟待解決的問題。
【發明內容】
本發明提供了一種移動應用的本體庫的構建方法及系統,能夠自動高效的為移動應用標注概念標簽和屬性標簽。
本發明的具體技術方案如下:
根據本發明一優選實施例,一種移動應用的本體庫的構建方法,包括:
將數據庫中移動應用的標題和簡介文本分別在預先生成的概念標簽集合和 屬性標簽集合中進行匹配,為匹配到的概念標簽和屬性標簽分配權重值;
依據權重值由高到低排序后的概念標簽,從預先生成的概念標簽樹中獲得概念標簽路徑;依據概念標簽路徑中的概念標簽查詢預先生成的概念標簽與屬性標簽的關聯關系,獲得屬性標簽;
利用獲得的概念標簽路徑及關聯的屬性標簽標注所述移動應用。
上述方法中,概念標簽集合和屬性標簽集合的生成方法為:
依據預設的移動應用概念的文本模式和移動應用屬性的文本模式,從移動應用的簡介文本中抽取出概念標簽和屬性標簽;
將用戶檢索的query與依據移動應用的簡介文本生成的概念標簽合并得到概念標簽集合,利用依據移動應用的簡介文本生成的屬性標簽生成屬性標簽集合。
上述方法中,所述概念標簽樹依據概念標簽集合中概念標簽之間的從屬關系生成,并包括一個以上概念標簽路徑,所述概念標簽路徑包括一個以上概念標簽。
上述方法中,所述將數據庫中移動應用的標題和簡介文本分別在預先生成的概念標簽集合和屬性標簽集合中進行匹配具體包括:
對數據庫中移動應用的標題和簡介文本進行切詞,生成一個以上分詞,依據預設的同義詞表,找到生成的分詞的同義詞,依據生成的分詞和找到的同義詞分別在概念標簽集合和屬性標簽集合中進行字符串匹配;
依據預設的移動應用概念的文本模式對移動應用的標題和簡介文本分別進行模式匹配。
上述方法中,利用如下公式獲得概念標簽和屬性標簽的權重值:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210585905.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種線路板壓合填膠的方法
- 下一篇:一種搜索項建議方法和裝置





