[發明專利]一種基于自然語義分析的用例提取方法有效
| 申請號: | 201710223135.8 | 申請日: | 2017-04-07 |
| 公開(公告)號: | CN107038229B | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 康雁;柳青;王珺;張顏淞;林英;劉宇;岳遠澤;丁玉鋒 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/30;G06F16/36 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 650091 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然 語義 分析 提取 方法 | ||
本發明屬于數據處理技術領域,公開了一種基于自然語義分析的用例提取方法,用例提取方法包括:通過大量相關專業需求文檔,訓練屬于自己領域的詞庫;對詞庫精度進行優化,排除干擾分詞結果的錯誤詞匯;運用相關領域的語料庫進行分詞,并標識出用例以及參與者;在分詞的基礎上提取句子主干,并建立基于語義分析的語義樹;針對提取的句子主干通過模型匹配進行用例的識別以及提取。本發明新詞發現算法利用三個特性很好的對所需要的新詞進行了提取,在機器學習過程中,進行了大量的參數調控等,同時也進行了大量的樣本學習,歸納出5類漢語語法模型,從而實現用例提取及參與者的匹配,最終準確度確定在95%以上。
技術領域
本發明屬于數據處理技術領域,尤其涉及一種基于自然語義分析的用例提取方法。
背景技術
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統,特別是其中的軟件系統。因而它是計算機科學的一部分。
21世紀以來,由于國際互聯網的普及,自然語言的計算機處理成為從互聯網上獲取知識的重要手段。生活在信息網絡時代的現代人,幾乎都要與互聯網打交道,都要或多或少地使用自然語言處理的研究成果來幫助他們獲取或挖掘在廣闊無邊的互聯網上的各種知識和信息。
因此,世界各國都非常重視自然語言處理的研究,投入了大量的人力、物力和財力。當前國外自然語言處理研究,基于句法—語義規則的理性主義方法受到質疑,隨著語料庫建設和語料庫語言學的崛起,大規模真實文本的處理成為自然語言處理的主要戰略目標。
在過去的40多年中,從事自然語言處理系統開發的絕大多數學者,基本上都采用基于規則的理性主義方法,這種方法的哲學基礎是邏輯實證主義,他們認為,智能的基本單位是符號,認知過程就是在符號的表征下進行符號運算,因此,思維就是符號運算。著名語言學家J.A.Fodor在“Representa tions”一書(1980)中說:“只要認為心理過程是計算過程(因此是由表征式定義的形式操作),那么,除了將心靈看作別的之外,還自然會把它看作一種計算機。也就是說,假設的計算過程包含哪些符號操作,心靈也就進行哪些符號操作。因此,可以大致上認為,心理操作跟圖靈機的操作十分類似。”Fodor的這種說法代表了自然語言處理中的基于規則(符號操作)的理性主義觀點。
在這樣的新形勢下,自然語言處理這個學科的交叉性和邊緣性顯得更加突出了。自然語言處理的研究者如果只是局限于自己原有的某一個專業的狹窄領域而不從其他相關的學科吸取營養來豐富自己的知識,在自然語言處理的研究中必將一籌莫展,處處碰壁。面對這樣的形勢我們應該怎樣做?是抱殘守缺,繼續把自己蜷縮在某一個專業的狹窄領域之內孤芳自賞,還是與時俱進,迎頭趕上,努力學習新的知識,以適應學科交叉性和邊緣性的要求?這是我國自然語言處理工作者必須考慮的問題。在工業革命時代,人類需要探索物質世界的奧秘,由于物質世界是由原子和各種基本粒子構成的,因此,研究原子和各種基本粒子的物理學成為非常重要的學科。在信息網絡時代,由于信息網絡主要是由語言構成的,因此,我們可以預見,在不久的將來,研究語言結構的自然語言處理必定也會成為像物理學一樣非常重要的學科。物理學研究物質世界中各種物理運動的規律,而自然語言處理則研究信息網絡世界中語言載體的規律。自然語言處理的重要性完全可以與物理學媲美,它們將成為未來科學世界中舉足輕重的雙璧。這是我在直覺上的一種估計,我相信這樣的估計將會成為活生的現實
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710223135.8/2.html,轉載請聲明來源鉆瓜專利網。





