[發明專利]標簽同義詞的擴充方法、擴充裝置、電子設備及存儲介質有效
| 申請號: | 202010553900.4 | 申請日: | 2020-06-17 |
| 公開(公告)號: | CN111708900B | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 石慧江;于政;王道廣;袁燦 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/247 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 裴素英 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 同義詞 擴充 方法 裝置 電子設備 存儲 介質 | ||
本申請提供了一種標簽同義詞的擴充方法、擴充裝置、電子設備及存儲介質,其中,所述擴充方法包括:首先獲取一段目標文本以及針對所述目標文本的預設標簽;然后從所述目標文本中,確定出多種字符串長度,以及在每種字符串長度下的多個文本標簽,確定每個所述文本標簽與所述預設標簽之間的相似度;最后從確定出的多個文本標簽中確定相似度最大的文本標簽為預設標簽同義詞。本方案在知曉一段目標文本和預設標簽的情況下,通過本申請提供的標簽同義詞的擴充方法,從目標文本中攫取其中一段文本作為預設標簽的同義詞,可以有效快速的從文本中提取出現有標簽的標簽同義詞,提高了工作效率,降低了時間成本。
技術領域
本申請涉及打標簽技術領域,尤其是涉及一種標簽同義詞的擴充方法、擴充裝置、電子設備及存儲介質。
背景技術
在打標簽時,打標簽的人并不完全知道所有的標簽,他們只知道相對通俗的描述信息,進而需要通過類似的描述信息搜索出相應的標簽,這類描述信息就是標簽同義詞。
以汽車維修案為例:通常在汽車維修時會打上兩種標簽,一種是故障現象,另一種是維修結果;其中故障現象是在創建案例時打的標簽,維修結果是在結案時由維修工程師打上的標簽;標簽相對是固定的,如故障現象標簽“加速無力”,其同義描述可以是“啟動慢”、“加油門不走”等等;維修結果標簽“更換發動機”,其同義描述可以是“發動機變更”、“換掉發動機”等等;進而挖掘出更多的與已打標簽對應的同義詞可以幫助打標簽的人快速的搜索出相應的標簽。
現有技術中,常采用人工窮舉標簽同義詞的方法,即由專業領域的專家對某個標簽進行解釋和概括,雖然專家整理得到的同義詞庫通常具有較高的數據質量,但顯而易見的是該方法成本極高,首先為保證詞庫質量,領域專家需要在該領域內有較長的工作年限,對該領域有深入了解;其次為保證詞庫廣度,往往需要多位專家共同整理詞庫。
發明內容
有鑒于此,本申請的目的在于提供一種標簽同義詞的擴充方法、擴充裝置、電子設備及存儲介質,可以有效快速的從文本中提取出現有標簽的標簽同義詞,提高工作效率,降低時間成本。
第一方面,本申請提供了一種標簽同義詞的擴充方法,所述擴充方法包括:
獲取一段目標文本以及針對所述目標文本的預設標簽;
從所述目標文本中,確定出多種字符串長度,以及在每種字符串長度下的多個文本標簽,確定每個所述文本標簽與所述預設標簽之間的相似度;
從確定出的多個文本標簽中確定相似度最大的文本標簽為預設標簽同義詞。
優選地,通過以下步驟確定出多種字符串長度:
獲取所述目標文本的字符串總長度值;
確定所述目標文本的字符串長度區間陣列,其中,將一個字符長度值作為所述字符串長度區間陣列的起點,所述字符串總長度值作為所述字符串長度區間陣列的終點;
以單個字符長度值為劃分步長,在所述字符串長度區間陣列內對字符串長度進行劃分取值,確定多種字符串長度。
優選地,通過以下步驟確定出多種字符串長度:
獲取所述預設標簽的長度值和預設變量值;
在所述預設標簽的長度值的基礎上,增加和減少所述預設變量值,得到字符串長度值區間陣列的最大值和最小值;
以單個字符長度值為劃分步長,在所述字符串長度值區間陣列內對字符串長度進行劃分取值,確定多種字符串長度。
優選地,通過以下步驟確定每種字符串長度下的多個文本標簽:
確定所述目標文本的至少一個起始點;
以每個字符串長度為滑動步長,分別從每個起始點開始對所述目標文本進行滑動取值,得到在每個字符串長度下的多個文本標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010553900.4/2.html,轉載請聲明來源鉆瓜專利網。





