[發明專利]一種數據標注方法和裝置、計算機可讀存儲介質在審
| 申請號: | 201910678287.6 | 申請日: | 2019-07-25 |
| 公開(公告)號: | CN110471597A | 公開(公告)日: | 2019-11-19 |
| 發明(設計)人: | 徐安華;馬瑞璇;路德龍 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F3/0484 | 分類號: | G06F3/0484;G06F3/0481 |
| 代理公司: | 11262 北京安信方達知識產權代理有限公司 | 代理人: | 陶麗;栗若木<國際申請>=<國際公布>= |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標注 鼠標操作 鼠標 標簽標注 分層顯示 標簽 預定義 計算機可讀存儲介質 方法和裝置 接收用戶 數據標注 展示效果 監聽 申請 檢測 | ||
本申請公開了一種數據標注方法和裝置、計算機可讀存儲介質,所述方法包括:監聽并接收用戶的鼠標操作;檢測接收的鼠標操作是否為預定義的標簽標注操作且當前鼠標選中的數據是否為已標注數據;如果接收的鼠標操作為預定義的標簽標注操作且當前鼠標選中的數據為已標注數據,則對當前鼠標選中的數據進行重疊標注,并按照標注順序在該數據的一側分層顯示標注的標簽。本申請通過按照標注順序在已標注數據的一側分層顯示重疊標注的標簽,實現了數據的重疊標注,且具有較好的標簽展示效果。
技術領域
本申請涉及但不限于自然語言處理(Natural Language Processing,NLP) 技術領域,尤其涉及一種數據標注方法和裝置、計算機可讀存儲介質。
背景技術
隨著大數據以及人工智能(Artificial Intelligence,AI)的研究和發展,越來越多的企業采用NLP相關的技術來處理企業級數據問題。數據是NLP 的關鍵,數據的種類除了包含已經存入數據庫的結構化數據外,還有很大一部分是非結構化的數據,例如:文本類數據。當前,很多大公司可以提供實體識別、關系識別等各類服務模型,以避開數據標注過程來獲取文本類數據的價值。這些服務模型大多是由互聯網數據訓練得到的,互聯網數據的顯著特點是文字內容豐富且文字來源廣泛,但是,由于互聯網數據的用詞習慣和寫作風格與企業級文本數據存在較大差異,對于企業應用來說,想要獲取互聯網數據的價值,就必須建立適用于各自領域的NLP模型。
而建立NLP模型,就不能避開一條必經之路:數據標注。在經過大量的數據標注之后,標注好的數據會有很多用途。數據標注簡單來說,就是給數據打標簽。對于NLP來說,對數據中的實體、關系進行數據標注是很常見的,例如,如圖1所示,在一段文本中,出現的字符串“3月25日”可以標注為日期(Date),字符串“高娜娜”可以標注為姓名(Name)等等。
在數據標注過程中,對于同一字符串有時可能會有許多不同的標簽,例如,對于字符串“高娜娜”來說,“高娜娜”作為一個整體是一個姓名,但是,如果將“高娜娜”拆分成:“高”、“娜娜”,此時,“高”可以標注為姓,“娜娜”可以標注為名。因此,對于同一字符串“高娜娜”來說,“高”作為“高娜娜”的一部分,既可以標注為姓名,又可以標注為姓;“娜娜”作為“高娜娜”的一部分,既可以標注為姓名,又可以標注為名。因此,在這種情況下,研究如何實現數據的重疊標注很有必要并且具有一定的實際意義。
發明內容
為了解決上述技術問題,本申請提供了一種數據標注方法和裝置、計算機可讀存儲介質,能夠實現對同一數據的重疊標注。
為了解決上述技術問題,本申請實施例的技術方案是這樣實現的:
本發明實施例提供了一種數據標注方法,包括:
監聽并接收用戶的鼠標操作;
檢測接收的鼠標操作是否為預定義的標簽標注操作且當前鼠標選中的數據是否為已標注數據;
如果接收的鼠標操作為預定義的標簽標注操作且當前鼠標選中的數據為已標注數據,則對當前鼠標選中的數據進行重疊標注,并按照標注順序在該數據的一側分層顯示標注的標簽。
在一種示例性實施例中,所述按照標注順序在該數據的一側分層顯示標注的標簽,包括:
檢測當前標注的標簽為對所述當前鼠標選中的數據的第幾重標簽;
如果當前標注的標簽為對所述當前鼠標選中的數據的第n重標簽,則將當前標注的標簽顯示于所述當前鼠標選中的數據的垂直方向上方的第n層位置或垂直方向下方的第n層位置,其中,n為大于1的自然數。
在一種示例性實施例中,在顯示所述標簽時,不同的所述標簽使用不同的高亮背景顏色進行顯示,且所述標簽的長度與所述標簽標注的數據的長度相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910678287.6/2.html,轉載請聲明來源鉆瓜專利網。





