[發明專利]一種自然語言句子的語義角色標注方法無效
| 申請號: | 200810243605.8 | 申請日: | 2008-12-10 |
| 公開(公告)號: | CN101446942A | 公開(公告)日: | 2009-06-03 |
| 發明(設計)人: | 王紅玲;朱巧明;錢培德;孔芳;李培峰;周國棟;錢龍華 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 | 代理人: | 陶海鋒 |
| 地址: | 215123江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 句子 語義 角色 標注 方法 | ||
1.一種自然語言句子的語義角色標注方法,其特征在于:采用聯合學習模型,同時實現中文句法分析和語義角色標注,包括如下步驟:
(1)生成語義角色標注模型:
生成訓練文件:從標注語料庫中,根據下表中的特征抽取特征,生成所需的訓練文件;
?
模型生成:利用訓練文件對最大熵分類器模型進行訓練,得到語義角色標注模型文件;
(2)生成聯合學習模型:
提取訓練語料:從樹庫中,提取出句法分析訓練語料,句法分析的訓練事件中包含語義特征;
生成訓練文件:在句法分析模型常用特征基礎上,添加語義特征,生成訓練文件;
所述句法分析模型常用特征由下表表示:
?
所述語義特征由下表表示:
?
語義特征的獲取采用步驟(1)的語義角色標注模型實現;
模型生成:利用訓練文件對最大熵分類器模型進行訓練,得到聯合學習模型文件;
(3)詞性標記:調用詞性標記模塊,對給定句子進行詞性標注,保留前N種最優的詞性標記系列結果;
(4)基本短語識別:調用基本短語識別模塊,分別對步驟(3)輸出的N種詞性標記結果,進行基本短語識別,最后保留前N種最優的基本短語識別結果;
(5)句法分析:調用聯合學習模型,以步驟(4)輸出的N種基本短語識別結果作為輸入,輸出最優的句法分析結果和語義角色標注結果;
其中,N為10~20的整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810243605.8/1.html,轉載請聲明來源鉆瓜專利網。





