日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本處理方法、裝置、計算機設備及存儲介質在審

專利信息
申請號: 202110352912.5 申請日: 2021-03-31
公開(公告)號: CN113704462A 公開(公告)日: 2021-11-26
發明(設計)人: 石磊 申請(專利權)人: 騰訊科技(深圳)有限公司
主分類號: G06F16/35 分類號: G06F16/35;G06F40/194;G06F40/205;G06F40/242;G06F40/289
代理公司: 廣州三環專利商標代理有限公司 44202 代理人: 熊永強;杜維
地址: 518057 廣東省深圳*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 處理 方法 裝置 計算機 設備 存儲 介質
【權利要求書】:

1.一種文本處理方法,其特征在于,所述方法包括:

獲取參考文本,并確定所述參考文本的詞性序列以及特征向量;

根據所述參考文本的詞性序列從文本數據庫中確定出N個待召回文本,所述N個待召回文本中的各個待召回文本對應的詞性序列與所述參考文本的詞性序列相匹配,其中,N為正整數;

確定所述N個待召回文本中的各個待召回文本的特征向量;

將得到的N個特征向量進行聚類處理,根據聚類處理結果從所述N個特征向量中確定參考特征向量集合;

根據所述參考特征向量集合以及所述參考文本的特征向量,從所述N個待召回文本中確定目標召回文本。

2.根據權利要求1所述的方法,其特征在于,所述將得到的N個特征向量進行聚類處理,根據聚類處理結果從所述N個特征向量中確定參考特征向量集合,包括:

將得到的N個特征向量進行聚類處理,得到至少一個聚類類別;

從所述至少一個聚類類別中確定目標聚類類別,根據各個目標聚類類別所包括的特征向量確定參考特征向量集合。

3.根據權利要求2所述的方法,其特征在于,所述從所述至少一個聚類類別中確定目標聚類類別,包括:

確定所述至少一個聚類類別中的各個聚類類別所包括的特征向量的數目;

按照所包括的特征向量的數目從高到低的順序對所述至少一個聚類類別進行排序,得到第一排序結果;

根據所述第一排序結果,將所述至少一個聚類類別中排在前M位的聚類類別確定為目標聚類類別,其中,M為正整數。

4.根據權利要求1-3中任一項所述的方法,其特征在于,所述根據所述參考特征向量集合以及所述參考文本的特征向量,從所述N個待召回文本中確定目標召回文本,包括:

將所述參考特征向量集合中的各個參考特征向量分別與所述參考文本的特征向量進行對比,確定各個參考特征向量與所述參考文本的特征向量之間的匹配值;

從所述參考特征向量集合中,確定與所述參考文本的特征向量之間的匹配值大于或等于設定閾值的目標特征向量;

將所述目標特征向量所對應的待召回文本確定為目標召回文本。

5.根據權利要求4所述的方法,其特征在于,所述目標特征向量為多個,所述方法還包括:

根據各個目標召回文本所對應的目標特征向量與所述參考文本的特征向量之間的匹配值,按照匹配值從大到小的順序,對所述各個目標召回文本進行排序,得到第二排序結果;

將所述第二排序結果以及所述各個目標召回文本發送給客戶端,以使得所述客戶端根據所述第二排序結果確定所述各個目標召回文本的顯示順序,并按照所述顯示順序顯示所述各個目標召回文本。

6.根據權利要求1所述的方法,其特征在于,所述確定所述N個待召回文本中的各個待召回文本的特征向量,包括:

針對所述N個待召回文本中的任一個待召回文本,對所述待召回文本進行分詞處理,得到分詞集合;

根據詞向量詞典確定所述分詞集合中各個分詞的特征向量;

將所述各個分詞的特征向量進行融合,根據融合結果確定所述待召回文本的特征向量。

7.根據權利要求1所述的方法,其特征在于,所述根據所述參考文本的詞性序列從文本數據庫中確定出N個待召回文本,包括:

確定所述參考文本的主題信息,從文本數據庫中確定出主題信息與所述參考文本的主題信息相匹配的一個或多個待選擇文本;

根據所述參考文本的詞性序列從所述一個或多個待選擇文本中確定出N個待召回文本。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110352912.5/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久夜色精品久久噜噜亚| 91香蕉一区二区三区在线观看| 日韩久久精品一区二区三区| 狠狠操很很干| 午夜老司机电影| 九一国产精品| 国产黄一区二区毛片免下载| 国产精品一二三区免费| 欧美亚洲精品suv一区| 国产亚洲久久| 一区二区精品久久| 中文字幕一区二区三区乱码视频| 狠狠插影院| 91亚洲精品国偷拍自产| 日韩欧美高清一区| 一区二区国产盗摄色噜噜| 狠狠色噜噜狠狠狠狠2021免费| 少妇在线看www| 国内少妇偷人精品视频免费| 日本精品99| 国产综合亚洲精品| 国产在线一区二区视频| 国产1区在线观看| 日韩av一区二区在线播放| 国产午夜一区二区三区| 91麻豆产精品久久久| 欧美日韩中文不卡| 精品999久久久| 97视频一区| 88888888国产一区二区| 色妞www精品视频| 久久夜色精品亚洲噜噜国产mv| 亚洲va国产| 亚洲精品国产setv| 亚洲精品卡一| 国产精品一区二区在线观看| 午夜a电影| 日本二区在线播放| 日韩欧美高清一区二区| 国产aⅴ一区二区| 丰满岳乱妇bd在线观看k8| 日韩精品一区二区三区免费观看| 日韩精品一区二区三区四区在线观看 | 色婷婷久久一区二区三区麻豆| 精品国产一二区| 日本午夜无人区毛片私人影院| 中文丰满岳乱妇在线观看| 91看片免费| 欧美午夜羞羞羞免费视频app| 久久一区二| 久久久999精品视频| 好吊妞国产欧美日韩软件大全| 久久久久亚洲最大xxxx| 亚洲精品人| 国产精品乱战久久久| 一区二区国产盗摄色噜噜| 欧美片一区二区| 日本精品视频一区二区三区| 国产女性无套免费看网站| 国产精品自拍不卡| 亚洲精品欧美精品日韩精品| 欧美一区二区三区久久久精品| 午夜精品一区二区三区aa毛片| 综合久久国产九一剧情麻豆| a级片一区| 亚洲自拍偷拍中文字幕| 久久婷婷国产麻豆91天堂徐州| 国产一区在线精品| 中文字幕在线乱码不卡二区区| 2023国产精品久久久精品双| 亚洲欧美日本一区二区三区| 在线国产二区| 国产精品一区二| 日本一级中文字幕久久久久久| 456亚洲精品| 99精品区| 国产色99| 日韩欧美中文字幕一区| 亚洲一级中文字幕| 久久精品国语| 久久噜噜少妇网站| 日本xxxx护士高潮hd|