[發明專利]基于計算機可識別自然語言描述的語義匹配方法及系統有效
| 申請號: | 201711460123.3 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108170679B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 楊學紅 | 申請(專利權)人: | 中國聯合網絡通信集團有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/247 |
| 代理公司: | 北京天昊聯合知識產權代理有限公司 11112 | 代理人: | 彭瑞欣;羅瑞芝 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 計算機 識別 自然語言 描述 語義 匹配 方法 系統 | ||
1.一種基于計算機可識別自然語言描述的語義匹配方法,其特征在于,包括步驟:
步驟S1):以目標語言的語法規則限定的邏輯和步驟作為參考,將自然語言需求描述約束為具備邏輯的步驟的結構;
步驟S2):對約束后的自然語言需求描述中固定的句式,獲得包括自然語言需求描述中的詞根的候選詞語集合;
步驟S3):對目標語言中的消息名/操作名進行分詞,獲得包括消息名/操作名中的詞根的備用詞語集合;
步驟S4):計算候選詞語集合和備用詞語集合的匹配度,以將滿足匹配度的目標語言代替所述自然語言需求描述中相應的語句,所述目標語言為選擇編程的計算機語言;
步驟S4)包括步驟:
步驟S41):遍歷備用詞語集合的詞語,篩選與候選詞語集合存在交集的詞語;
步驟S42):對滿足交集的詞語,計算匹配度。
2.根據權利要求1所述的基于計算機可識別自然語言描述的語義匹配方法,其特征在于,步驟S2)包括:
步驟S21):根據設定的限定詞,獲取自然語言描述的需求語句,將需求語句分詞后形成初級詞語集合;
步驟S22):移除初級詞語集合中的停用詞,形成適用詞語集合;
步驟S23):對適用詞語集合中的各詞語進行同義詞擴展;
步驟S24):對擴展詞語集合進行詞根還原,獲得包括自然語言需求描述中的詞根的候選詞語集合。
3.根據權利要求2所述的基于計算機可識別自然語言描述的語義匹配方法,其特征在于,
步驟S21)中,對于需求語句轉為目標語言設定的限定詞以前綴作為標識;
步驟S22)中,將助詞、介詞、連詞類作為停用詞預存作為停用詞詞庫;
步驟S23)中,根據同義詞詞庫對適用詞語集合中的各詞語進行同義詞擴展;
步驟S24)中,詞根還原算法為Porter算法或者Lucene算法。
4.根據權利要求1所述的基于計算機可識別自然語言描述的語義匹配方法,其特征在于,步驟S4)中,候選詞語集合和備用詞語集合的匹配度的公式為:
其中,count為查找到的語義相近的詞語個數,|wordsetA|為需求描述語句中分詞個數,|wordsetB|為消息名/操作名中的分詞個數。
5.一種基于計算機可識別自然語言描述的語義匹配系統,其特征在于,包括約束模塊、候選詞語集合構成模塊、備用詞語集合構成模塊和匹配模塊,其中:
所述約束模塊,用于以目標語言的語法規則限定的邏輯和步驟作為參考,將自然語言需求描述約束為具備邏輯的步驟的結構;
所述候選詞語集合構成模塊,用于對約束后的自然語言需求描述中固定的句式,獲得包括自然語言需求描述中的詞根的候選詞語集合;
所述備用詞語集合構成模塊,用于對目標語言中的消息名/操作名進行分詞,獲得包括消息名/操作名中的詞根的備用詞語集合;
所述匹配模塊,用于計算候選詞語集合和備用詞語集合的匹配度,以將滿足匹配度的目標語言代替所述自然語言需求描述中相應的語句,所述目標語言為選擇編程的計算機語言;
所述匹配模塊包括求交單元、匹配單元,其中:
所述求交單元,用于遍歷備用詞語集合的詞語,篩選與候選詞語集合存在交集的詞語;
所述匹配單元,對滿足交集的詞語,計算匹配度。
6.根據權利要求5所述的基于計算機可識別自然語言描述的語義匹配系統,其特征在于,所述候選詞語集合構成模塊包括初級詞語集合單元、適用詞語集合單元、同義詞擴展單元和詞根還原單元,其中:
所述初級詞語集合單元,用于根據設定的限定詞,獲取自然語言描述的需求語句,將需求語句分詞后形成初級詞語集合;
所述適用詞語集合單元,用于移除初級詞語集合中的停用詞,形成適用詞語集合;
所述同義詞擴展單元,用于對適用詞語集合中的各詞語進行同義詞擴展;
所述詞根還原單元,用于對擴展詞語集合進行詞根還原,獲得包括自然語言需求描述中的詞根的候選詞語集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國聯合網絡通信集團有限公司,未經中國聯合網絡通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711460123.3/1.html,轉載請聲明來源鉆瓜專利網。





