[發(fā)明專利]標(biāo)簽同義詞的擴(kuò)充方法、擴(kuò)充裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010553900.4 | 申請(qǐng)日: | 2020-06-17 |
| 公開(公告)號(hào): | CN111708900B | 公開(公告)日: | 2023-08-25 |
| 發(fā)明(設(shè)計(jì))人: | 石慧江;于政;王道廣;袁燦 | 申請(qǐng)(專利權(quán))人: | 北京明略軟件系統(tǒng)有限公司 |
| 主分類號(hào): | G06F16/36 | 分類號(hào): | G06F16/36;G06F40/247 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 裴素英 |
| 地址: | 100000 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)簽 同義詞 擴(kuò)充 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種標(biāo)簽同義詞的擴(kuò)充方法,其特征在于,所述擴(kuò)充方法包括:
獲取一段目標(biāo)文本以及針對(duì)所述目標(biāo)文本的預(yù)設(shè)標(biāo)簽;
從所述目標(biāo)文本中,確定出多種字符串長(zhǎng)度,以及在每種字符串長(zhǎng)度下的多個(gè)文本標(biāo)簽,確定每個(gè)所述文本標(biāo)簽與所述預(yù)設(shè)標(biāo)簽之間的相似度;其中,通過(guò)以下步驟確定每種字符串長(zhǎng)度下的多個(gè)文本標(biāo)簽:確定所述目標(biāo)文本的至少一個(gè)起始點(diǎn);以每個(gè)字符串長(zhǎng)度為滑動(dòng)步長(zhǎng),分別從每個(gè)起始點(diǎn)開始對(duì)所述目標(biāo)文本進(jìn)行滑動(dòng)取值,得到在每個(gè)字符串長(zhǎng)度下的多個(gè)文本標(biāo)簽;目標(biāo)文本的起始點(diǎn)的數(shù)量與目標(biāo)文本的字符總數(shù)相同,起始點(diǎn)為任意一個(gè)字符前的位置;每改變一次起始點(diǎn),對(duì)目標(biāo)文本重新進(jìn)行一次滑動(dòng)取值;
從確定出的多個(gè)文本標(biāo)簽中確定相似度最大的文本標(biāo)簽為預(yù)設(shè)標(biāo)簽同義詞。
2.根據(jù)權(quán)利要求1所述的擴(kuò)充方法,其特征在于,通過(guò)以下步驟確定出多種字符串長(zhǎng)度:
獲取所述目標(biāo)文本的字符串總長(zhǎng)度值;
確定所述目標(biāo)文本的字符串長(zhǎng)度區(qū)間陣列,其中,將一個(gè)字符長(zhǎng)度值作為所述字符串長(zhǎng)度區(qū)間陣列的起點(diǎn),所述字符串總長(zhǎng)度值作為所述字符串長(zhǎng)度區(qū)間陣列的終點(diǎn);
以單個(gè)字符長(zhǎng)度值為劃分步長(zhǎng),在所述字符串長(zhǎng)度區(qū)間陣列內(nèi)對(duì)字符串長(zhǎng)度進(jìn)行劃分取值,確定多種字符串長(zhǎng)度。
3.根據(jù)權(quán)利要求1所述的擴(kuò)充方法,其特征在于,通過(guò)以下步驟確定出多種字符串長(zhǎng)度:
獲取所述預(yù)設(shè)標(biāo)簽的長(zhǎng)度值和預(yù)設(shè)變量值;
在所述預(yù)設(shè)標(biāo)簽的長(zhǎng)度值的基礎(chǔ)上,增加和減少所述預(yù)設(shè)變量值,得到字符串長(zhǎng)度值區(qū)間陣列的最大值和最小值;
以單個(gè)字符長(zhǎng)度值為劃分步長(zhǎng),在所述字符串長(zhǎng)度值區(qū)間陣列內(nèi)對(duì)字符串長(zhǎng)度進(jìn)行劃分取值,確定多種字符串長(zhǎng)度。
4.根據(jù)權(quán)利要求1所述的擴(kuò)充方法,其特征在于,通過(guò)以下步驟確定每個(gè)所述文本標(biāo)簽與所述預(yù)設(shè)標(biāo)簽之間的相似度:
計(jì)算每個(gè)所述文本標(biāo)簽與所述預(yù)設(shè)標(biāo)簽之間的語(yǔ)義相似度;
從所有所述語(yǔ)義相似度中確定出相似度最大的語(yǔ)義相似度。
5.一種標(biāo)簽同義詞的擴(kuò)充裝置,其特征在于,所述擴(kuò)充裝置包括:
獲取模塊,用于獲取一段目標(biāo)文本以及針對(duì)所述目標(biāo)文本的預(yù)設(shè)標(biāo)簽;
確定模塊,用于從所述目標(biāo)文本中,確定出多種字符串長(zhǎng)度,以及在每種字符串長(zhǎng)度下的多個(gè)文本標(biāo)簽,確定每個(gè)所述文本標(biāo)簽與所述預(yù)設(shè)標(biāo)簽之間的相似度;其中,確定模塊用于通過(guò)以下步驟確定每種字符串長(zhǎng)度下的多個(gè)文本標(biāo)簽:確定所述目標(biāo)文本的至少一個(gè)起始點(diǎn);以每個(gè)字符串長(zhǎng)度為滑動(dòng)步長(zhǎng),分別從每個(gè)起始點(diǎn)開始對(duì)所述目標(biāo)文本進(jìn)行滑動(dòng)取值,得到在每個(gè)字符串長(zhǎng)度下的多個(gè)文本標(biāo)簽;目標(biāo)文本的起始點(diǎn)的數(shù)量與目標(biāo)文本的字符總數(shù)相同,起始點(diǎn)為任意一個(gè)字符前的位置;每改變一次起始點(diǎn),對(duì)目標(biāo)文本重新進(jìn)行一次滑動(dòng)取值;
同義詞確定模塊,用于從確定出的多個(gè)文本標(biāo)簽中確定相似度最大的文本標(biāo)簽為預(yù)設(shè)標(biāo)簽同義詞。
6.根據(jù)權(quán)利要求5所述的擴(kuò)充裝置,其特征在于,所述確定模塊用于通過(guò)以下步驟確定出多種字符串長(zhǎng)度:
獲取所述目標(biāo)文本的字符串總長(zhǎng)度值;
確定所述目標(biāo)文本的字符串長(zhǎng)度區(qū)間陣列,其中,將一個(gè)字符長(zhǎng)度值作為所述字符串長(zhǎng)度區(qū)間陣列的起點(diǎn),所述字符串總長(zhǎng)度值作為所述字符串長(zhǎng)度區(qū)間陣列的終點(diǎn);
以單個(gè)字符長(zhǎng)度值為劃分步長(zhǎng),在所述字符串長(zhǎng)度區(qū)間陣列內(nèi)對(duì)字符串長(zhǎng)度進(jìn)行劃分取值,確定多種字符串長(zhǎng)度。
7.一種電子設(shè)備,其特征在于,包括:處理器、存儲(chǔ)器和總線,所述存儲(chǔ)器存儲(chǔ)有所述處理器可執(zhí)行的機(jī)器可讀指令,當(dāng)電子設(shè)備運(yùn)行時(shí),所述處理器與所述存儲(chǔ)器之間通過(guò)所述總線通信,所述機(jī)器可讀指令被所述處理器執(zhí)行時(shí)執(zhí)行如權(quán)利要求1至4中任一所述的標(biāo)簽同義詞的擴(kuò)充方法的步驟。
8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器運(yùn)行時(shí)執(zhí)行如權(quán)利要求1至4中任一所述的標(biāo)簽同義詞的擴(kuò)充方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司,未經(jīng)北京明略軟件系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010553900.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲(chǔ)方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 用于匹配實(shí)體的系統(tǒng)和方法及其中使用的同義詞群組織器
- 同義詞模板的挖掘方法和裝置以及同義詞挖掘方法和裝置
- 一種同義詞語(yǔ)義映射關(guān)系確定方法及裝置
- 文本挖掘系統(tǒng)、文本挖掘方法和程序
- 用于生成同義詞的方法和裝置
- 同義詞的挖掘方法及裝置、計(jì)算機(jī)可讀介質(zhì)、電子設(shè)備
- 搜索信息的同義詞擴(kuò)展方法及裝置
- 同義詞生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于醫(yī)學(xué)同義詞在線編輯檢索系統(tǒng)
- 信息處理方法、裝置、設(shè)備、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





