[發(fā)明專利]超鏈接標(biāo)記方法和裝置、文本分類方法和裝置有效
| 申請?zhí)枺?/td> | 201810091591.6 | 申請日: | 2018-01-30 |
| 公開(公告)號: | CN110096695B | 公開(公告)日: | 2023-01-03 |
| 發(fā)明(設(shè)計(jì))人: | 王星雅;萬偉 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/134 | 分類號: | G06F40/134;G06F40/117;G06F40/284 |
| 代理公司: | 華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 超鏈接 標(biāo)記 方法 裝置 文本 分類 | ||
1.一種超鏈接標(biāo)記方法,包括:
獲取待標(biāo)記的文本,并獲取對所述文本本身進(jìn)行分類的第一概率分布;
確定所述文本的上下文,并獲取對所述上下文進(jìn)行分類的第二概率分布;
將所述第一概率分布和第二概率分布進(jìn)行第一融合,得到第三概率分布;
確定所述文本的來源方標(biāo)識,并獲取對所述來源方標(biāo)識對應(yīng)的歷史文本進(jìn)行分類的第四概率分布;
根據(jù)所述第三概率分布和所述第四概率分布,確定所述文本所屬的類別;所述類別用于確定與所述類別相匹配的分詞方式,并按照所述分詞方式對所述文本分詞,得到詞序列;
獲取鏈接地址,所述鏈接地址指向根據(jù)所述詞序列檢索得到的檢索結(jié)果;
將所述鏈接地址標(biāo)記為所述文本的超鏈接。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取鏈接地址包括:
獲取與所述詞序列中各個(gè)詞相應(yīng)的鏈接地址;每個(gè)所述鏈接地址指向根據(jù)相應(yīng)的詞檢索得到的檢索結(jié)果;
所述將所述鏈接地址標(biāo)記為所述文本的超鏈接,包括:
將每個(gè)所述鏈接地址分別標(biāo)記為所述文本中相應(yīng)詞的超鏈接。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取與所述詞序列中各個(gè)詞相應(yīng)的鏈接地址,包括:
獲取從所述詞序列中篩選的指定詞,以及與各個(gè)所述指定詞相應(yīng)的鏈接地址;所述指定詞是根據(jù)用戶數(shù)據(jù)或所述文本的相關(guān)信息篩選得到的。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法應(yīng)用于移動終端,所述方法還包括:
將所述類別發(fā)送至服務(wù)器,所述類別用于指示所述服務(wù)器確定與所述類別相匹配的分詞方式,指示所述服務(wù)器按照所述分詞方式對所述文本分詞,得到詞序列,并指示所述服務(wù)器根據(jù)所述詞序列進(jìn)行檢索,得到檢索結(jié)果;
所述獲取鏈接地址包括:
接收所述服務(wù)器反饋的指向所述檢索結(jié)果的鏈接地址。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取待標(biāo)記的文本包括:
展示交互界面,所述交互界面中展示有內(nèi)容;
檢測對所述交互界面中所展示內(nèi)容的文本選擇操作;
將檢測到的文本選擇操作所選中的文本作為待標(biāo)記的文本。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第三概率分布和所述第四概率分布,確定所述文本所屬的類別,包括:
將所述第三概率分布和所述第四概率進(jìn)行第二融合,得到第五概率分布;
在所述第五概率分布中確定最大的概率;
將所述最大的概率對應(yīng)的預(yù)設(shè)類別作為所述文本所屬的類別。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取對所述來源方標(biāo)識對應(yīng)的歷史文本進(jìn)行分類的第四概率分布,包括:
獲取所述來源方標(biāo)識對應(yīng)的歷史文本集合,以及所述歷史文本集合中歷史文本的產(chǎn)生時(shí)間;
按照所述歷史文本集合中歷史文本的產(chǎn)生時(shí)間所屬的時(shí)間段,將所述歷史文本集合劃分為不同的歷史文本子集;
對各所述歷史文本子集按照相應(yīng)的抽樣比例抽取歷史文本;
確定對抽取的歷史文本進(jìn)行分類的第四概率分布。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法,其特征在于,還包括:
檢測對標(biāo)記有所述超鏈接的所述文本的觸發(fā)操作;
當(dāng)檢測到所述觸發(fā)操作時(shí),根據(jù)所述觸發(fā)操作所對應(yīng)的鏈接地址訪問目標(biāo)頁面;在所述目標(biāo)頁面中展示相應(yīng)的檢索結(jié)果;
檢測對展示的檢索結(jié)果的選中操作;
訪問所述選中操作所選中的檢索結(jié)果所鏈接的頁面。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述檢索結(jié)果按照相應(yīng)的質(zhì)量權(quán)值排序,所述方法還包括:
將所述選中操作選中所述檢索結(jié)果的選中操作記錄進(jìn)行上報(bào),上報(bào)的選中操作記錄用于調(diào)整選中的檢索結(jié)果相應(yīng)的質(zhì)量權(quán)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810091591.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:基于自然語言處理的信息生成方法和裝置
- 下一篇:一種中文長文本情感分析方法





