[發(fā)明專利]一種基于計算機的自然語言句法結(jié)構(gòu)解析的方法和裝置有效
| 申請?zhí)枺?/td> | 201410419634.0 | 申請日: | 2014-08-22 |
| 公開(公告)號: | CN104156353B | 公開(公告)日: | 2017-10-31 |
| 發(fā)明(設(shè)計)人: | 秦一男 | 申請(專利權(quán))人: | 秦一男 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京成創(chuàng)同維知識產(chǎn)權(quán)代理有限公司11449 | 代理人: | 劉鋒,張靖琳 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 計算機 自然語言 句法 結(jié)構(gòu) 解析 方法 裝置 | ||
1.一種基于計算機的自然語言句法結(jié)構(gòu)解析的方法,包括:
S1、讀取待解析的經(jīng)預(yù)處理的語句數(shù)據(jù)結(jié)構(gòu),所述經(jīng)預(yù)處理的語句數(shù)據(jù)結(jié)構(gòu)中僅包括語句的并列關(guān)聯(lián)詞單元、從屬關(guān)聯(lián)詞單元、謂語動詞單元、名詞代詞單元,且各詞單元按照在所述經(jīng)預(yù)處理的語句中的順序進(jìn)行編號,并標(biāo)注類型;
S2、對每一謂語動詞單元,生成對應(yīng)的引導(dǎo)語元素、主語元素、謂語元素和賓語元素;
所述引導(dǎo)語元素的可能取值為編號小于對應(yīng)的謂語動詞單元編號的并列關(guān)聯(lián)詞單元或從屬關(guān)聯(lián)詞單元之一,或由一個編號小于對應(yīng)的謂語動詞單元編號的并列關(guān)聯(lián)詞單元和一個與其相鄰且編號小于對應(yīng)的謂語動詞單元編號且編號大于該并列關(guān)聯(lián)詞單元編號的從屬關(guān)聯(lián)詞單元構(gòu)成的關(guān)聯(lián)詞組合向量之一,或空單元;
所述主語元素的可能取值為編號小于對應(yīng)的謂語動詞單元編號的名詞代詞單元之一,或最大詞單元的編號小于對應(yīng)的謂語動詞單元編號的全體并列名詞代詞組合向量族中所包含的并列名詞代詞組合向量之一,或在前出現(xiàn)的謂語元素對應(yīng)的句法向量之一,或空單元;
所述謂語元素為對應(yīng)的所述謂語動詞單元;
所述賓語元素的可能取值編號大于對應(yīng)的謂語動詞單元編號且小于相鄰的在后出現(xiàn)的謂語動詞單元編號的名詞代詞單元之一,或最小詞單元的編號大于對應(yīng)的謂語動詞單元編號且小于相鄰的在后出現(xiàn)的謂語動詞單元編號的全體并列名詞代詞組合向量族中所包含的并列名詞代詞組合向量之一,或在后出現(xiàn)的謂語元素對應(yīng)的句法向量之一,或空單元;
S3、根據(jù)所述引導(dǎo)語元素、主語元素、謂語元素和賓語元素的可能取值,獲取每一謂語動詞單元對應(yīng)的句法向量的所有可能取值,所述句法向量包括引導(dǎo)語元素、主語元素、謂語元素和賓語元素;
S4、根據(jù)所有句法向量的所有可能取值,生成至少一個句法結(jié)構(gòu)可能矩陣解,所述句法結(jié)構(gòu)可能矩陣解由按照謂語動詞單元編號順序排列的句法向量組成;
S5、驗證根據(jù)句法結(jié)構(gòu)可能矩陣解得到的語句是否與所述經(jīng)預(yù)處理的語句完全相同,如果完全相同,則將該句法結(jié)構(gòu)可能矩陣解中的各句法向量作為句法結(jié)構(gòu)解析結(jié)果之一;
其中,S5包括按順序依次執(zhí)行以下操作,排除不符合條件的句法結(jié)構(gòu)可能解:
S5.1、如果存在不在該句法結(jié)構(gòu)可能矩陣解中出現(xiàn)的順序值,則排除該句法結(jié)構(gòu)可能矩陣解;
S5.2、如果在不同的句法向量中出現(xiàn)相同的順序值或出現(xiàn)相同的句法向量,則排除該句法結(jié)構(gòu)可能矩陣解;
S5.3、在每一個可能矩陣解中,將與其他句法向量之間存在相互代入關(guān)系的句法向量全都進(jìn)行等量代換,如果在等量代換之后出現(xiàn)兩個句法向量的交叉矛盾,則排除該句法結(jié)構(gòu)可能矩陣解;
S5.4、在每一個可能矩陣解中,將與其他句法向量之間存在相互代入關(guān)系的句法向量全都進(jìn)行等量代換,如果在等量代換之后出現(xiàn)兩個位置逆反的順序值,則排除該句法結(jié)構(gòu)可能矩陣解;
S5.5、在任意一個可能矩陣解中,如果存在與其他句法向量之間沒有相互代入關(guān)系的句法向量,則執(zhí)行插空操作以獲得所有該可能矩陣解所對應(yīng)的可能句法解析結(jié)構(gòu),并驗證根據(jù)所述可能句法解析結(jié)構(gòu)得到的語句是否與所述經(jīng)預(yù)處理的語句完全相同,其進(jìn)一步包括:
S5.5.1、先對該可能矩陣解中相互之間存在代入關(guān)系的句法向量進(jìn)行等量代換,從而將該可能矩陣解轉(zhuǎn)化為一組相互之間不存在代入關(guān)系的句法向量將可能矩陣解中的句法向量稱為第一類句法向量,將轉(zhuǎn)化得到的句法向量稱為第二類句法向量;
S5.5.2、任取一個第二類句法向量按照預(yù)定的方向逐一標(biāo)注中的每一個句法元素的順序值;標(biāo)注句法元素的順序值之后,任取中的第i個句法元素,僅在該句法元素的第一側(cè)構(gòu)造唯一的空位;造空之后,任取一個句法向量以外的第二類句法向量以整體插空的方式將句法向量插入所構(gòu)造的空位,進(jìn)而生成一個新的句法向量,將這個新句法向量記為并將整體插空而得到的句法向量,統(tǒng)稱為第三類句法向量;
S5.5.3、對第三類句法向量按照預(yù)定的方向?qū)南蛄恐械牡谝粋?cè)第一個句法元素開始到向量中包含的向量的第二側(cè)第一個句法元素為止的每一個句法元素,全都標(biāo)注順序值;位于向量中包含的向量第一側(cè)的元素,不標(biāo)注順序值;將向量的第二側(cè)的第一個句法元素記為將按照前述方式對向量標(biāo)注的句法向量部分,記為甩尾句法向量標(biāo)注順序值之后,任取一個前述的甩尾向量中的第j個句法元素,僅在該元素第一側(cè)構(gòu)造唯一的空位;造空之后,任取一個未使用過的第二類句法向量以整體插空的方式將句法向量插入所構(gòu)造的空位,進(jìn)而生成一個新的句法向量,則將新生成的句法向量記為或者
第三類句法向量按照預(yù)定方向,對句法向量中的每一個句法元素全都標(biāo)注順序值;標(biāo)注句法元素的順序值之后,任取一個中的第t個句法元素,在該句法元素的第一側(cè)構(gòu)造唯一的空位;造空之后,任取一個未使用過得第二類句法向量以整體插空的方式將該向量插入前面構(gòu)造的空位,進(jìn)而生成一個新向量,則該新向量記為
S5.5.4、重復(fù)執(zhí)行S5.5.3,每當(dāng)上一次造空和插空步驟結(jié)束的時候,對經(jīng)過上一次造空和插空步驟而得到的第三類句法向量進(jìn)行下一次的造空和插空操作,直至將所有第二類句法向量全部插空完畢,最后得到一個單行的第三類句法向量,將所述最后得到的第三類句法向量稱為最終單行向量;
S5.5.5、如果一個可能句法解析結(jié)構(gòu)對應(yīng)的所有所述最終單行向量中均存在兩個位置逆反的順序值,則排除該可能句法解析結(jié)構(gòu);
S5.5.6、重復(fù)執(zhí)行S5.5.2至S5.5.5直至所有可能句法解析結(jié)構(gòu)被遍歷。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于秦一男,未經(jīng)秦一男許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410419634.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





