[發(fā)明專利]基于計(jì)算機(jī)可識別自然語言描述的語義匹配方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201711460123.3 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108170679B | 公開(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 楊學(xué)紅 | 申請(專利權(quán))人: | 中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/247 |
| 代理公司: | 北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 11112 | 代理人: | 彭瑞欣;羅瑞芝 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 計(jì)算機(jī) 識別 自然語言 描述 語義 匹配 方法 系統(tǒng) | ||
本發(fā)明屬于編程技術(shù)領(lǐng)域,具體涉及基于計(jì)算機(jī)可識別自然語言描述的語義匹配方法及其相應(yīng)的語義匹配系統(tǒng)。該基于計(jì)算機(jī)可識別自然語言描述的語義匹配方法包括步驟:步驟S1):以目標(biāo)語言的語法規(guī)則限定的邏輯和步驟作為參考,將自然語言需求描述約束為具備邏輯的步驟的結(jié)構(gòu);步驟S2):對約束后的自然語言需求描述中固定的句式,獲得包括自然語言需求描述中的詞根的候選詞語集合;步驟S3):對目標(biāo)語言中的消息名/操作名進(jìn)行分詞,獲得包括消息名/操作名中的詞根的備用詞語集合;步驟S4):計(jì)算候選詞語集合和備用詞語集合的匹配度。該語義匹配方法及語義匹配系統(tǒng),能協(xié)調(diào)用戶和開發(fā)人員對于自然語言應(yīng)用上的分歧,實(shí)現(xiàn)機(jī)器語言的自動編程。
技術(shù)領(lǐng)域
本發(fā)明屬于編程技術(shù)領(lǐng)域,具體涉及一種基于計(jì)算機(jī)可識別自然語言描述的語義匹配方法及其相應(yīng)的基于計(jì)算機(jī)可識別自然語言描述的語義匹配系統(tǒng)。
背景技術(shù)
自然語言仍然是目前軟件需求文檔的描述語言。從自然語言描述的功能需求到流程的自動生成不僅能幫助用戶和開發(fā)人員能夠快速地在需求上達(dá)成共識,還能加快流程的開發(fā)。
但是,由于用戶和開發(fā)人員的關(guān)注點(diǎn)不同,他們對需求的描述也往往不一樣。用戶和開發(fā)人員在用自然語言描述功能需求的過程中,用戶關(guān)心的是軟件所能提供的功能以及所能達(dá)到的性能水平等,開發(fā)人員則可能從技術(shù)的角度去刻畫軟件的需求;而且,他們并不知道開發(fā)語言所使用的具體的消息和操作的命名規(guī)則,他們對需求的描述所用到的實(shí)詞并不一定和開發(fā)語言中的消息名和操作名中使用的詞語完全一樣。另外,在大多數(shù)情況下,用戶并不熟悉那些專業(yè)的術(shù)語和技術(shù)問題。
但目前的軟件需求文檔大部分還是用自然語言撰寫,這其中有兩方面原因:一是因?yàn)橛脩艉烷_發(fā)人員大多沒有形式化描述需求的能力;二是因?yàn)樽匀徽Z言詞匯豐富,表達(dá)能力強(qiáng)大。但是,自然語言也不可避免的存在缺點(diǎn),包括模糊性、二義性和不一致性。
為了彌補(bǔ)自然語言的不足,需要一種能將自然語言表達(dá)的流程需求描述進(jìn)行約束和形式化的方法,使得計(jì)算機(jī)能夠理解需求。如何協(xié)調(diào)用戶和開發(fā)人員對于自然語言應(yīng)用上的分歧,成為目前亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)中上述不足,提供一種基于計(jì)算機(jī)可識別自然語言描述的語義匹配方法及其相應(yīng)的基于計(jì)算機(jī)可識別自然語言描述的語義匹配系統(tǒng),能有效消除用戶和開發(fā)人員對于自然語言應(yīng)用上的分歧,實(shí)現(xiàn)機(jī)器語言的自動編程。
解決本發(fā)明技術(shù)問題所采用的技術(shù)方案是該基于計(jì)算機(jī)可識別自然語言描述的語義匹配方法,包括步驟:
步驟S1):以目標(biāo)語言的語法規(guī)則限定的邏輯和步驟作為參考,將自然語言需求描述約束為具備邏輯的步驟的結(jié)構(gòu);
步驟S2):對約束后的自然語言需求描述中固定的句式,獲得包括自然語言需求描述中的詞根的候選詞語集合;
步驟S3):對目標(biāo)語言中的消息名/操作名進(jìn)行分詞,獲得包括消息名/操作名中的詞根的備用詞語集合;
步驟S4):計(jì)算候選詞語集合和備用詞語集合的匹配度。
優(yōu)選的是,步驟S2)包括:
步驟S21):根據(jù)設(shè)定的限定詞,獲取自然語言描述的需求語句,將需求語句分詞后形成初級詞語集合;
步驟S22):移除初級詞語集合中的停用詞,形成適用詞語集合;
步驟S23):對適用詞語集合中的各詞語進(jìn)行同義詞擴(kuò)展;
步驟S24):對擴(kuò)展詞語集合進(jìn)行詞根還原,獲得包括自然語言需求描述中的詞根的候選詞語集合。
優(yōu)選的是,步驟S21)中,對于需求語句轉(zhuǎn)為目標(biāo)語言設(shè)定的限定詞以前綴作為標(biāo)識;
步驟S22)中,將助詞、介詞、連詞類作為停用詞預(yù)存作為停用詞詞庫;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,未經(jīng)中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711460123.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 雙桌面遠(yuǎn)程控制系統(tǒng)及方法
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)與方法
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)與方法
- 一種基于網(wǎng)絡(luò)的計(jì)算機(jī)信息檢索系統(tǒng)與方法
- 雙計(jì)算機(jī)系統(tǒng)
- 制導(dǎo)雷達(dá)計(jì)算機(jī)系統(tǒng)
- 一種服務(wù)部署方法及裝置
- 一種計(jì)算機(jī)集成系統(tǒng)及故障自動切換方法
- 一種計(jì)算機(jī)信息安全監(jiān)控系統(tǒng)
- 混合型量子計(jì)算機(jī)架構(gòu)及其執(zhí)行計(jì)算任務(wù)的方法





