[發明專利]語言實體關系分析方法和一種機器翻譯裝置和方法有效
| 申請號: | 201310649137.5 | 申請日: | 2013-12-06 |
| 公開(公告)號: | CN103631770A | 公開(公告)日: | 2014-03-12 |
| 發明(設計)人: | 劉建勇;董亦農;尹德春 | 申請(專利權)人: | 劉建勇;董亦農;尹德春 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100070 北京市豐臺區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語言 實體 關系 分析 方法 一種 機器翻譯 裝置 | ||
1.一種語言實體關系分析方法,其特征在于包括以下步驟:
(1):??對輸入的語句進行篇章、段落、大句分割,進行步驟(2);然后,在段落、大句范圍內,進行缺省指代等知識計算;
(2):?對大句分割成小句,進行步驟(3);
(3):?小句中的內嵌處理調用步驟(2);內嵌處理完,進行步驟(4);
(4):?對小句進行分詞,如果有歧義,那么形成有限數目的子句,并對每個子句計算分詞歧義權值,對每個子句進行預處理(數字,數量短語,特殊組合短語,時間短語,超長子句處理),對每個子句進行步驟(5);在此層次進行相應的權值計算,選出最優小句;
(5):?對子句讀取語義知識庫信息,對動詞、可作模擬動詞處理的形容詞和數量短語、介詞、可帶子句的連詞等建立分析啟動結構;進行步驟(6);
(6):?對子句語串進行單句,并聯句,形容詞句,數量短語句,連動句,單實體句等分析;對于那些具有句子模式的句子,都能將其分解成為單句、多個單句,進行步驟(7);對于單實體句,進行步驟(10);?在此層次進行相應的權值計算,選出最優分析結果;
(7):?單句多動詞處理,對子句中的多個動詞,計算優先權值,進行步驟(8);多個動詞處理完,在此層次進行相應的權值計算,選出最優核心動詞;
(8):?動詞多義處理,對于動詞的多種意義,分別進行步驟(9);動詞多義處理完后,在此層次進行相應的權值計算,選出最優動詞單義;
(9):?動詞多種關系模式處理,每個動詞除有自己的基本句子關系模式外,還有變形句子關系模式,變形句子關系模式可以由程序按照基本句子關系模式自動生成;按照每個模式的語言實體情況,對每個語言實體部分,進行步驟(10),每個模式處理完,計算出這個模式的權值,這包括這個模式的多個語言實體的關聯和這個模式的上下文方面的權值,以及一些特殊模式自身的權值計算;多種可能的模式處理完后,選出最優動詞關系模式;
(10):?語言實體處理分別有:純語言實體分析,空語言實體分析(可以有副詞串),句子語言實體分析;如果是句子語言實體分析,填充上下文,調用步驟(6);如果是空語言實體分析,那么進行步驟(11),步驟(12)后,進行全副詞串分析,并計算權值;如果是純語言實體分析,調用步驟(11),步驟(12),步驟(13),步驟(17),步驟(18),進行本語言實體的權值計算;
(11):?命名實體組合,進行特殊名詞組合串、人名識別、地點識別、機構識別、特殊副詞串識別、特殊形容詞串識別、復雜組合結構等識別;得到多個組合串,對每個組合串進行步驟(12)處理;
(12):?介詞組合結構處理:對多個介詞,從右向左進行遞歸組合處理,介詞類似動詞模式,可以帶語言實體,可以帶句子,并且分別都可以帶后邊界;如果是帶語言實體?,那么調用步驟(13);如果是句子調用步驟(6);介詞的模式檢驗在動詞模式上下文下進行時,需要填充“需要進行的額外語言實體計算”的上下文;
?(13):?多語言實體分析,對語串片段按照特殊關聯詞(如漢語“的,和,或,..”等,英語“that從句”等)進行劃分,得到單個語言實體、多個語言實體、形容詞修飾串、句子修飾串;對于單個實體、多個語言實體進行步驟(14)處理,對于形容詞修飾串進行步驟(15);對句子修飾串進行步驟(16)處理;
(14):?語言實體分割,對此時語串按照上下文進行多語言實體分割,并對每個語言實體計算權值(根據語言實體內形容詞、副詞、核心部分等來設計權值,并且當形容詞部分含有一般動詞、特殊動詞、特殊動詞搭配、非形容詞詞類時,進行相應的權值計算),并且計算這個多語言實體組合的權值;如果有并聯關系,那么建立語言實體并聯描述結構,并計算相應的權值;
(15):?形容詞修飾串的分析
?????????對形容詞修飾串,配合上下文進行分割檢驗,并建立形容詞修飾描述結構,如果有并聯,建立形容詞修飾串并聯描述結構,并計算權值;此處權值計算需要根據形容詞串包含詞類情況,特別是當形容詞修飾串含有一般動詞、特殊動詞、特殊動詞搭配、非形容詞詞類時;根據形容詞修飾串跟所修飾的語言實體,計算相應的權值;當需要計算形容詞修飾串并聯情況時,(比如:“我和我的父親”,“我父親和小明的父親”),需要進行相應的權值計算;
(16):?句子修飾串的分析
對句子修飾串,配合上下文進行檢驗,調用步驟(6);并建立句子修飾描述結構,如果有并聯,建立句子修飾并聯描述結構,并計算權值;?根據句子修飾串跟所修飾的語言實體,計算相應的權值;當需要計算句子修飾串并聯情況時,需要進行相應的權值計算;
(17):?多語言實體和它們的修飾部分的整理
???????對分析后的多語言實體,形容詞修飾串,句子修飾串,以及相應的并聯描述結構,進行整理,對每個語言實體,建立起一個單個語言實體描述結構,此結構包括此語言實體本身以及修飾這個語言實體的形容詞修飾部分和句子修飾部分以及并聯描述;并且在這個層次,對語言實體進行權值計算;并且選擇最優的多語言實體組合;此處的語言實體,根據形容詞修飾串、句子修飾串以及并聯結構,進行權值計算;多個語言實體并排時,也計算相應的權值;
(18):?將此語言實體分析結果進行填充,并進行問句和特殊句子中的問詞點和特殊檢驗點的定位;并且,上傳上下文語言實體分析結果;
(19):?句子模式轉換以及歸一化處理
?????????按照句子類型以及所包含的單句類型進行模式轉換和歸一化;
(20):?最優語義樹的輸出
???????????對最優的句子類型,進行最優語義樹輸出;對于機器翻譯系統,直接使用系統內存中的最優語義樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉建勇;董亦農;尹德春,未經劉建勇;董亦農;尹德春許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310649137.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種步進加熱爐爐底磚座結構
- 下一篇:弧形攪拌葉混合機





