[發明專利]現代漢語復句關系詞自動識別方法及系統無效
| 申請號: | 201310263696.2 | 申請日: | 2013-06-27 |
| 公開(公告)號: | CN103412855A | 公開(公告)日: | 2013-11-27 |
| 發明(設計)人: | 胡泉;胡金柱;楊進才;李源;舒江波;謝芳;肖明;鄧沌華 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 嚴彥 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 現代漢語 復句 系詞 自動識別 方法 系統 | ||
技術領域
本發明涉及中文信息自動處理技術領域,尤其是涉及現代漢語復句關系詞的自動識別的研究與應用。?
背景技術
現在人們一般把中文信息處理的進程分為三大階段:字處理階段、詞處理階段和句與篇章處理階段。?
目前,我國在字、詞處理方面已經取得突破性進展,中文信息處理正在艱難地向著句與篇章處理階段邁進。“句處理”主要分為單句處理和復句的處理,目前研究較多的是單句的處理,如哈工大的語言技術平臺(LTP)、北大的句法樹庫、中科院的概念層次網絡(HNC)等。而復句處理的研究目前還非常少。?
復句是復雜的句子,是漢語語法的重要實體單位,它表達的語義信息豐富而復雜,而且復句還是連接單句與篇章的橋梁,因而在信息處理領域具有很多值得研究的內容。?
復句的邏輯語義主要由復句關系詞(又稱關聯詞或關系標記)來體現。從語法范疇來看,由于關系詞聯結的是組成復句的分句,它主要體現的是一種搭配上的邏輯意義,所以人們把關系詞的研究也納入到“句處理”的研究范疇。?
關系詞是復句在語表形式上的標記,是復句中標示關系的一個重要構件,它在很大程度上影響著分句的語義,也影響著層次關系的識別。因此,對于關系詞的研究雖然表面上看起來是一種“詞處理”,但實質上它是通過“詞”的研究來促進“句”的研究。人們對于復句的理解,往往通過“抓住標記”來實現。同樣,計算機理解復句的語義,也需要“抓住標記”。?
關系詞在現代漢語復句領域起著重要的作用,是漢語語法、語義研究中的重要課題。從計算機處理自然語言的角度,關系詞的自動識別是一個難題,原因表現在:一方面關系詞構成形態靈活,可以是副詞、連詞、助詞、超詞形式;另一方面詞的角色多變,一個詞有時充當關系詞,有時又不充當關系詞;而且關系詞的語法語義類別多樣,歧義現象復雜,概括起來主要有3大類:同形異類、同形異構和同形異義。?
所謂“同形異類”是指相同的關系詞,卻具有多種邏輯語義類別,典型的有“也”、“愈”等。比如,“也”既可以跟“即使”搭配,充當假設關系詞;也可以跟“雖然”搭配,充當讓步關系詞;還可以跟“也”搭配,充當并列關系詞;跟“不僅僅”搭配,充當遞進關系詞。?
所謂“同形異構”是指關系詞形成的句式相同,但是分句間的結構不同。這是從關系詞搭配的角度來考察的。比如,句式“不是不A,就是B”有兩種結構,一種是“不是”與“就是”搭配,分句形成選擇關系,如“不是不理睬,就是哼一聲”;另一種是“不是”與“就是”不搭配,分句間沒有直接的邏輯關系,如“她不是不知道累,她就是愿意多干一會兒”。?
所謂“同形異義”是指同一個標記,在不同的語境下表現出不同的意義,有時充當關系詞,有時不充當關系詞。比如“結果”,有時充當關系詞,如“日軍本想利用大水消滅我軍,結果未占到半點便宜。”有時不充當關系詞,如“后來他告訴我,這是他爸爸‘活動’的結果。”這些給計算機自動識別關系詞帶來較大困難,計算機不但需要一定的技巧來處理超詞形式的關系詞,而且還需要克服分詞及詞性標注的不準確性帶來的誤差。?
所以,復句中的許多“準關系詞”不一定是真正的關系詞。?
所謂“搭配關系詞”是指能構成句法搭配的關系詞,如“因為.....所以.....”是一搭配關系詞。“關系詞搭配”是指關系詞之間的搭配行為。研究表明:絕大多數關系詞都具有搭配特性(占83%以上),有些關系詞還只能以搭配的形式存在,搭配已成為絕大多數關系詞表現自身邏輯語義關系的主要手段。由于關系詞搭配的特性,同一復句內的搭配關系詞可能出現多種搭配方案,例如“首先......然后......最后......”是一種搭配關系詞,其搭配關系及其相關的規則如表1所示。?
表1搭配關系詞“首先......然后......最后......”的搭配關系及其相關的規則?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310263696.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種云搜索平臺
- 下一篇:基于電力系統與通信系統聯合模擬的步長調節方法及裝置





