[發(fā)明專利]一種基于深度學習的地理信息的自動標注方法及裝置有效
| 申請?zhí)枺?/td> | 201811434810.2 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109614455B | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設計)人: | 凌廣明;徐武平;穆曉峰;徐愛萍 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 地理信息 自動 標注 方法 裝置 | ||
本發(fā)明提供了一種基于深度學習的地理信息的自動標注方法及裝置,采用了主動學習策略。主動學習是一種根據特定的選擇規(guī)則,從大量信息數據中挑選出最能夠使訓練模型收斂,即信息量最大最有價值的未標記數據集合作為待查詢樣例集的方法。通過本發(fā)明的方法可以實現快速而準確的匹配,用于篩選出質量好可靠性強的優(yōu)質數據集作為備用數據集進行后續(xù)的標注工作。實現了提高標注的效率以及準確性的技術效果。
技術領域
本發(fā)明涉及人工智能技術領域,具體涉及一種基于深度學習的地理信息的自動標注方法及裝置。
背景技術
隨著國民經濟的日益提高,尤其是電子商務行業(yè)的蓬勃發(fā)展,無論是出于社會安全考慮,還是出于商家優(yōu)化管理、降低成本和提升效益考慮,對用戶的地理位置信息進行精準而快捷的分析越來越受到重視。
然而,由于用戶數據的急速增長,而且地理信息往往發(fā)生著日新月異的變化,尤其是收集數據的渠道受到歷史原因和工作場景等因素的限制而呈現出多樣性和隨意性的態(tài)勢,造成了用戶信息存在諸多問題,主要表現在“地理信息缺乏規(guī)范性”和“錯別字較為普遍”兩個方面,這給精準高效的分析帶來了一定的挑戰(zhàn)。
在對用戶地理信息的分析方法時,通常需要對已有的地理信息進行標注,作為分析的標準。在對地理信息進行識別分析時,需要足夠的高質量的標注數據才能達到理想的效果,然而高質量的標注數據需要大量的人力成本,必定受到限制,目前,通常采用的是人工標注的方式,效率較低,且無法保證準確性。
由上可知,現有技術的方法存在效率低和準確性不高技術問題。
發(fā)明內容
有鑒于此,本發(fā)明提供了一種基于深度學習的地理信息的自動標注方法及裝置,用以解決或者至少部分解決現有技術的方法存在效率低和準確性不高技術問題。
本發(fā)明第一方面提供了一種基于深度學習的地理信息的自動標注方法,包括:
步驟S1:獲取原始數據集UserInfSet和專業(yè)數據集PlotSet;
步驟S2:對原始數據集UserInfSet和專業(yè)數據集PlotSet進行預處理;
步驟S3:將預處理后的專業(yè)數據集PlotSet與原始數據集UserInfSet進行匹配,從原始數據集UserInfSet中篩選出目標數據集;
步驟S4:基于預設規(guī)則對目標數據集進行排序;
步驟S5:為排序后的目標數據集設置標注參數;
步驟S6:基于設置的標注參數,合成語料庫,將其作為標注結果。
在一種實施方式中,所述專業(yè)數據采用哈希表PlotsHashTable進行存儲,步驟S3具體包括:
步驟S3.1:從原始數據集UserInfSet中讀取一條原始數據UserInf;
步驟S3.2:將原始數據UserInf與哈希表PlotsHashTable中的專業(yè)數據進行匹配,獲取原始數據UserInf中包含的小區(qū)個數PlotCount以及匹配信息MatchInf,其中,匹配信息中包括匹配的起止位置;
步驟S3.3:如果PlotCount為0,則舍棄該原始數據,轉至步驟S3.1,如果PlotCount為1,則轉至步驟S3.4,如果PlotCount大于1,則根據起止位置獲得空間位置關系,再根據空間位置關系進行合并,并判斷合并后的小區(qū)個數是否等于1,如果等于則轉至步驟S3.4,否則轉至步驟S3.1;
步驟S3.4:將篩選出的原始數據UserInf與匹配信息MatchInf記錄于目標數據集中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811434810.2/2.html,轉載請聲明來源鉆瓜專利網。





