[發(fā)明專利]一種移動應用的本體庫的構建方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210585905.0 | 申請日: | 2012-12-28 |
| 公開(公告)號: | CN103020293B | 公開(公告)日: | 2019-02-05 |
| 發(fā)明(設計)人: | 龐文博;楊鍇 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953 |
| 代理公司: | 北京鴻德海業(yè)知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 移動 應用 本體 構建 方法 系統(tǒng) | ||
1.一種移動應用的本體庫的構建方法,其特征在于,該方法包括:
將數據庫中移動應用的標題和簡介文本分別在預先生成的概念標簽集合和屬性標簽集合中進行匹配,為匹配到的概念標簽和屬性標簽分配權重值;
依據權重值由高到低排序后的概念標簽,從預先生成的概念標簽樹中獲得概念標簽路徑;依據概念標簽路徑中的概念標簽查詢預先生成的概念標簽與屬性標簽的關聯(lián)關系,獲得屬性標簽;
利用獲得的概念標簽路徑及關聯(lián)的屬性標簽標注所述移動應用。
2.根據權利要求1所述的方法,其特征在于,概念標簽集合和屬性標簽集合的生成方法為:
依據預設的移動應用概念的文本模式和移動應用屬性的文本模式,從移動應用的簡介文本中抽取出概念標簽和屬性標簽;
將用戶檢索的query與依據移動應用的簡介文本生成的概念標簽合并得到概念標簽集合,利用依據移動應用的簡介文本生成的屬性標簽生成屬性標簽集合。
3.根據權利要求1所述的方法,其特征在于,
所述概念標簽樹依據概念標簽集合中概念標簽之間的從屬關系生成,并包括一個以上概念標簽路徑,所述概念標簽路徑包括一個以上概念標簽。
4.根據權利要求1所述的方法,其特征在于,所述將數據庫中移動應用的標題和簡介文本分別在預先生成的概念標簽集合和屬性標簽集合中進行匹配具體包括:
對數據庫中移動應用的標題和簡介文本進行切詞,生成一個以上分詞,依據預設的同義詞表,找到生成的分詞的同義詞,依據生成的分詞和找到的同義詞分別在概念標簽集合和屬性標簽集合中進行字符串匹配;
依據預設的移動應用概念的文本模式對移動應用的標題和簡介文本分別進行模式匹配。
5.根據權利要求1所 述的方法,其特征在于,利用如下公式獲得概念標簽和屬性標簽的權重值:
其中,Score(app,tag)為移動應用app中標簽tag的權重值,∑(WordScoretag+PatternScoretag)為在移動應用app中標簽tag各次成功匹配的權重值的和,為在移動應用app中標簽tag的子標簽childtag各次成功匹配的權重值的和,為移動應用app中標簽tag的各子標簽childtag的權重值的和。
6.根據權利要求5所述的方法,其特征在于,利用如下公式獲得移動應用app中標簽tag的字符串匹配的權重值WordScoretag:
其中,BaseScoretitle為在標題中匹配成功的標簽的基準權重值,ReverseSiteword為在標題中匹配成功的標簽在標題的切詞結果中依據由后向前的順序的所處位置,BaseScorecontent為在簡介文本中匹配成功的標簽的基準權重值,Siteclause為在標題中匹配成功的標簽在簡介文本的切詞結果中依據由前向后的順序的所處短句的位置。
7.根據權利要求5所述的方法,其特征在于,利用如下公式獲得移動應用app中標簽tag的模式匹配的權重值PatternScoretag:
其中,StrictPatternScoretag等于10,LoosePatternScoretag等于8。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210585905.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種線路板壓合填膠的方法
- 下一篇:一種搜索項建議方法和裝置





