[發(fā)明專利]一種基于深度學(xué)習(xí)的地理信息的自動(dòng)標(biāo)注方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201811434810.2 | 申請(qǐng)日: | 2018-11-28 |
| 公開(公告)號(hào): | CN109614455B | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 凌廣明;徐武平;穆曉峰;徐愛萍 | 申請(qǐng)(專利權(quán))人: | 武漢大學(xué) |
| 主分類號(hào): | G06F16/29 | 分類號(hào): | G06F16/29 |
| 代理公司: | 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430072 湖*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 地理信息 自動(dòng) 標(biāo)注 方法 裝置 | ||
1.一種基于深度學(xué)習(xí)的地理信息的自動(dòng)標(biāo)注方法,其特征在于,包括:
步驟S1:獲取原始數(shù)據(jù)集UserInfSet和專業(yè)數(shù)據(jù)集PlotSet;
步驟S2:對(duì)原始數(shù)據(jù)集UserInfSet和專業(yè)數(shù)據(jù)集PlotSet進(jìn)行預(yù)處理;
步驟S3:將預(yù)處理后的專業(yè)數(shù)據(jù)集PlotSet與原始數(shù)據(jù)集UserInfSet進(jìn)行匹配,從原始數(shù)據(jù)集UserInfSet中篩選出目標(biāo)數(shù)據(jù)集;
步驟S4:基于預(yù)設(shè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行排序;
步驟S5:為排序后的目標(biāo)數(shù)據(jù)集設(shè)置標(biāo)注參數(shù);
步驟S6:基于設(shè)置的標(biāo)注參數(shù),合成語(yǔ)料庫(kù),將其作為標(biāo)注結(jié)果;
其中,所述專業(yè)數(shù)據(jù)采用哈希表PlotsHashTable進(jìn)行存儲(chǔ),步驟S3具體包括:
步驟S3.1:從原始數(shù)據(jù)集UserInfSet中讀取一條原始數(shù)據(jù)UserInf;
步驟S3.2:將原始數(shù)據(jù)UserInf與哈希表PlotsHashTable中的專業(yè)數(shù)據(jù)進(jìn)行匹配,獲取原始數(shù)據(jù)UserInf中包含的小區(qū)個(gè)數(shù)PlotCount以及匹配信息MatchInf,其中,專業(yè)數(shù)據(jù)集PlotSet中的專業(yè)數(shù)據(jù)包含小區(qū)信息,匹配信息中包括匹配的起止位置;
步驟S3.3:如果PlotCount為0,則舍棄該原始數(shù)據(jù),轉(zhuǎn)至步驟S3.1,如果PlotCount為1,則轉(zhuǎn)至步驟S3.4,如果PlotCount大于1,則根據(jù)起止位置獲得空間位置關(guān)系,其中,空間位置是起止位置的形象化描述,再根據(jù)空間位置關(guān)系進(jìn)行合并,并判斷合并后的小區(qū)個(gè)數(shù)是否等于1,如果等于則轉(zhuǎn)至步驟S3.4,否則轉(zhuǎn)至步驟S3.1;
步驟S3.4:將篩選出的原始數(shù)據(jù)UserInf與匹配信息MatchInf記錄于目標(biāo)數(shù)據(jù)集中;
步驟S3.5:判斷原始數(shù)據(jù)集UserInfSet中的數(shù)據(jù)是否讀取完畢,如果讀取完畢,則將步驟S3.4得到的結(jié)果作為目標(biāo)數(shù)據(jù)集,否則,轉(zhuǎn)至步驟S3.1,繼續(xù)處理下一條數(shù)據(jù);
在步驟S3.3中,根據(jù)空間位置關(guān)系進(jìn)行合并,具體為:
采用幾何空間中的臨近原則進(jìn)行合并,幾何空間關(guān)系包括相容、相交、相鄰、相離,在幾何空間描述位于同一條線段上的兩條子線段的位置關(guān)系,其中,將中間相差兩個(gè)字但不包含特定字的情況作為相鄰。
2.如權(quán)利要求1所述的方法,其特征在于,在步驟S4之后,所述方法還包括:
對(duì)排序后的目標(biāo)數(shù)據(jù)集根據(jù)預(yù)設(shè)標(biāo)識(shí)進(jìn)行分割,得到N個(gè)Excel文件,其中,N為大于1的整數(shù);
通過(guò)人工調(diào)整的方式,對(duì)N個(gè)Excel文件進(jìn)行調(diào)整,獲得優(yōu)質(zhì)的標(biāo)注數(shù)據(jù)。
3.如權(quán)利要求2所述的方法,其特征在于,在通過(guò)人工調(diào)整的方式,對(duì)N個(gè)Excel文件進(jìn)行調(diào)整,獲得優(yōu)質(zhì)的標(biāo)注數(shù)據(jù)之后,所述方法還包括:
對(duì)獲得的優(yōu)質(zhì)的標(biāo)注數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估。
4.如權(quán)利要求1所述的方法,其特征在于,步驟S5體包括:
通過(guò)設(shè)置標(biāo)注參數(shù),獲得預(yù)設(shè)標(biāo)注標(biāo)準(zhǔn)BIO。
5.如權(quán)利要求1所述的方法,其特征在于,在步驟S6之后,所述方法還包括:
對(duì)合成的語(yǔ)料庫(kù)進(jìn)行擴(kuò)展。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811434810.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





