[發明專利]一種自然語言地址描述的自動識別方法在審
| 申請號: | 201810247442.4 | 申請日: | 2018-03-23 |
| 公開(公告)號: | CN108563631A | 公開(公告)日: | 2018-09-21 |
| 發明(設計)人: | 李俊;顏平;徐忠建;朱必亮;馮建亮 | 申請(專利權)人: | 江蘇速度信息科技股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 陸中丹 |
| 地址: | 210000 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 匹配識別 自然語言 輸出結果 自動識別 分詞 自然語言處理 狀態機模型 詞性標注 方法識別 句法結構 模式識別 社會大眾 語言模式 加載 句法 語句 句子 引擎 詞語 檢索 出行 節約 語言 | ||
1.一種自然語言地址描述的自動識別方法,其特征在于,包括以下步驟:
(1)開始檢索識別,加載自然語言處理引擎,獲取自然語言地址描述的句子或詞語,句法或詞的語言模式提取;然后對提取的語言模進行匹配識別,看是否有模式可以匹配識別該地址描述;
(2)如有能匹配識別該地址描述的模式,則進行模式識別,并輸出結果;
(3)如果沒有能匹配識別該地址描述的模式則通過建立切詞分圖來識別;建立切圖分詞,根據有限狀態機模型,識別句法結構,進行地址描述的識別,并輸出結果。
2.根據權利要求1所述的自然語言地址描述的自動識別方法,其特征在于,所述步驟(3)中通過建立切詞分圖來識別的步驟具體包括如下步驟:
1)建立切詞分圖:把候選詞中的每個字串當作節點,把每個字串前后次序當作弧段,建立切詞分圖;
2)搜索最優路徑:從地址描述切詞分圖中搜索最優路徑,選取總弧段最小的路徑就是地址語句最佳的切分模式;即根據指定的模型從微觀序列中快速有效地選擇最優的狀態序列,從而進行地址描述的識別,并輸出結果。
3.根據權利要求2所述的自然語言地址描述的自動識別方法,其特征在于,所述步驟1)中弧段的大小根據弧段大小公式來計算切詞分圖中的弧段的大小,其中Wa、bW表示弧段連接的左右字符串,a表示左字串最右側的字,b表示右字串最左側的字,MI’表示切分詞圖中的互信息,E′L表示切分詞圖中的左熵,E′R表示切分詞圖中的右熵。
4.根據權利要求2所述的自然語言地址描述的自動識別方法,其特征在于,所述步驟(1)中的語言模式的提取是從自然語言地址描述的語法中提取一部分,或者可以是幾種成分部分的交融,作為模式;其中首先分析自然語言的語法、語義規則,并從中提取出不同的語言模式。
5.根據權利要求2所述的自然語言地址描述的自動識別方法,其特征在于,所述步驟1)建立切詞分圖中采用將地名當作專有名詞或者通用名詞,其余詞語歸納為指示詞和限定詞兩類。
6.根據權利要求2所述的自然語言地址描述的自動識別方法,其特征在于,所述步驟2)搜索最優路徑中是基于有限狀態機的句法結構來識別,每個有限狀態機都有一個開始狀態、一個終止狀態以及若干個中間狀態;每條弧段可以表示一個狀態轉移到下一個狀態的條件;利用有限狀態機識別地址描述語句的句法結構是一個詞類匹配的遍歷過程。
7.一種自然語言地址描述的自動識別系統,其特征在于,包括控制模塊、數據收發模塊、數據管理模塊和數據分析模塊,所述數據收發模塊、數據管理模塊和數據分析模塊均與所述控制模塊形成雙向傳輸連接;所述數據收發模塊負責接收采集地址描述數據,以及發出系統自動識別后的地址描述;所述數據管理模塊用于提供匹配的模式查詢、修改、增加以及常用指示詞和限定詞查詢、修改、增加;所述數據分析模塊用于提取語言模式并根據匹配的模式和切詞分圖來識別地址描述語句。
8.根據權利要求1所述的自然語言地址描述的自動識別系統,其特征在于,所述數據分析模塊包括提取模塊、分析匹配模塊和確定模塊;所述提取模塊用于自然語言地址描述的句子或詞語的語言模式提取;所述分析匹配模塊用于根據匹配的模式或切詞分圖來識別自然地址描述;所述確定模塊用于確定匹配結果;所述數據管理模塊包括搜索模塊、停止語言識別模塊和矯正模塊,所述搜索模塊用于啟動自然語言處理引擎,提供搜索欄;所述停止語言識別模塊用于暫停識別;所述矯正模塊用于矯正自然語言地址描述。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇速度信息科技股份有限公司,未經江蘇速度信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810247442.4/1.html,轉載請聲明來源鉆瓜專利網。





