[發明專利]一種基于深度學習的地理信息的識別方法及裝置有效
| 申請號: | 201811448679.5 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109614457B | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 凌廣明;穆曉峰;徐愛萍;徐武平 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06N3/04 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430072*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 地理信息 識別 方法 裝置 | ||
1.一種基于深度學習的地理信息的識別方法,其特征在于,包括:
步驟S1:獲取包含地理信息的原始數據;
步驟S2:對原始數據進行預處理,預處理包括數據的篩選、清洗;
步驟S3:對預處理后數據進行標注,形成語料庫;
步驟S4:將語料庫輸入深度學習模型,對深度學習模型進行訓練,其中,深度學習模型為BiLSTM+CRF+AGG,包括特征嵌入層、雙向LSTM層、BiLSTM輸出層、CRF層、擬輸出層、聚合層和最終輸出層,AGG為增加的聚合層;
步驟S5:將待處理的包含地理信息的數據輸入訓練后的深度學習模型,并通過聚合層對同一類型的相鄰實體進行聚合,進而獲得識別結果,識別結果中包括地理位置信息和小區信息;
其中,步驟S5中,采用組件技術將訓練后的深度學習模型進行封裝,應用于開發環境中,組件技術采用共享內存和共享文件兩種機制;組件技術包括構建一級組件,一級組件的接口包括:啟動服務、停止服務、單條數據預測、服務狀態判斷、批量數據預測、批量預測是否完成;
組件技術還包括構建二級組件,二級組件的接口包括:啟動服務、停止服務、單條數據預測、服務狀態判斷、批量數據預測、批量預測是否完成、是否激活、解析、返回預測結果和設定超時。
2.如權利要求1所述的方法,其特征在于,步驟S3具體包括:
采用自動標注與人工調整相結合的方式對預處理后的數據進行標注,形成預料庫。
3.如權利要求1所述的方法,其特征在于,在步驟S5之后,所述方法還包括:
對識別結果中的地理信息進行定位分區。
4.一種基于深度學習的地理信息的識別裝置,其特征在于,包括:
獲取模塊,用于獲取包含地理信息的原始數據;
預處理模塊,用于對原始數據進行預處理,預處理包括數據的篩選、清洗;
標注模塊,用于對預處理后數據進行標注,形成語料庫;
訓練模塊,用于將語料庫輸入深度學習模型,對深度學習模型進行訓練,其中,深度學習模型為BiLSTM+CRF+AGG,包括特征嵌入層、雙向LSTM層、BiLSTM輸出層、CRF層、擬輸出層、聚合層和最終輸出層,AGG為增加的聚合層;
識別模塊,用于將待處理的包含地理信息的數據輸入訓練后的深度學習模型,并通過聚合層對同一類型的相鄰實體進行聚合,進而獲得識別結果,識別結果中包括地理位置信息和小區信息;
其中,識別模塊中,采用組件技術將訓練后的深度學習模型進行封裝,應用于開發環境中,組件技術采用共享內存和共享文件兩種機制;組件技術包括構建一級組件,一級組件的接口包括:啟動服務、停止服務、單條數據預測、服務狀態判斷、批量數據預測、批量預測是否完成;
組件技術還包括構建二級組件,二級組件的接口包括:啟動服務、停止服務、單條數據預測、服務狀態判斷、批量數據預測、批量預測是否完成、是否激活、解析、返回預測結果和設定超時。
5.如權利要求4所述的裝置,其特征在于,標注模塊具體用于:
采用自動標注與人工調整相結合的方式對預處理后的數據進行標注,形成預料庫。
6.如權利要求4所述的裝置,其特征在于,還包括定位分區模塊,用于:
對識別結果中的地理信息進行定位分區。
7.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被執行時實現如權利要求1至3中任一項權利要求所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811448679.5/1.html,轉載請聲明來源鉆瓜專利網。





