[發明專利]基于HNC語義分析的立場判定方法無效
| 申請號: | 200910089496.3 | 申請日: | 2009-07-22 |
| 公開(公告)號: | CN101963958A | 公開(公告)日: | 2011-02-02 |
| 發明(設計)人: | 孟東豫 | 申請(專利權)人: | 北京大正語言知識處理科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 北京萬科園知識產權代理有限責任公司 11230 | 代理人: | 張亞軍;李京楠 |
| 地址: | 100081 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 hnc 語義 分析 立場 判定 方法 | ||
技術領域
本發明屬于計算機智能應用領域,涉及計算機對人類語言進行分析的方法,具體地說,是將HNC自然語言理解技術與計算機相結合,對語言進行立場判定的方法。
背景技術
HNC是英文Hierarchical?Network?of?Concepts(概念層次網絡)的縮寫,HNC理論是概念層次網絡理論,是一個關于自然語言理解處理(Natural?Language?Understanding)的理論體系,該理論開創了語言信息處理和語言研究的新思路,自1994年問世以來,得到越來越多的專家學者的關注和認同。HNC理論是“以語義表達為基礎,面向整個自然語言理解的理論框架”,其語義表達具有概念化、層次化和網絡化的特征。專利號為98101921.8的中國專利“模擬大腦語言感知過程的自然語言語句分析方法”中,對漢語語言的句類結構做出了詳細的說明,將漢語的句類分成7個大類,57個小類,并提出將句子劃分成語義塊,進行分析,目前HNC句類分析系統已經相當成熟,在計算機上安裝上HNC句類分析軟件后,即可對輸入的語句進行分析,輸出語義塊,并可將語義塊按語言的自然邏輯進行排列。
HNC理論的目標是研制可在計算機上配置具有自然語言理解能力的“交互引擎”。讓計算機理解人類語言的需求是多方面的,其中一個重要的需求就是通過計算機對語言進行立場判斷。
在社會生產、日常生活和人際交往中,人們對各種事物、現象都有自己的觀點、看法,所有的觀點和看法可以歸結為兩大類,即肯定的表態和否定的表態。
肯定的表態可以是喜歡某一件事,贊成某一件事,接受某一件事。
否定的表態可以是討厭某一件事、反對某一件事,拒絕某一件事等。
有時候,人們對一件事的表態并無對錯之分,但卻有很重要的參考價值。因為它反映了某一群人或公眾對某一件事件總的看法,換句話說,它相當于民意測驗。傳統的民意測驗是挨家挨戶走訪進行的,其缺點是:成本高,需要足夠的資金投入,速度慢,樣本的數量往往不會太高,受地域空間時間限制,不能及時反應公眾對熱點問題的看法。
隨著信息時代的到來,計算機的廣泛應用,人們的通訊和交流方式發生了很大的變化,越來越多人每天都通過電子郵件、博客、發貼,網上論壇等方式在互聯網闡述自己的觀點,表明看法,由于多是采用匿名方式,發表者反而很自由,直言不諱,毫無顧慮,各執己見,立場鮮明,內容集中,速度快,跟貼者很多,為民意測驗的開展提供了便利條件,在互聯網傳播的觀點是以電子文本的形式進行的,如果能夠對電子文本中的語言內容進行立場判斷,則可提供很有價值的信息。
但是,目前還沒有一種類似可以借助HNC句類分析系統對電子文本內容進行立場判斷的方法。
發明內容
為解決上述問題,本發明的目的是提供一種基于HNC語義分析的立場判定方法,它能夠對各種電子文本中語句的內容進行立場判斷,以期說明和解釋問題的趨勢或傾向,提供很有價值的信息。
為實現上述目的,本發明采用以下技術方案:
一種基于HNC語義分析的立場判定方法,其特征是:該方法包括以下步驟:
步驟1:在計算機內設立感情色彩動詞數據庫:根據感情色彩動詞的褒貶語義為每個感情色彩動詞賦予一個屬性代碼,褒義的感情色彩動詞,其屬性代碼是1;貶義的感情色彩動詞,其屬性代碼是0;
步驟2:在計算機內設立關鍵詞數據庫,將要分析的句子中的關鍵詞輸入到關鍵詞數據庫中;
步驟3:在計算機內安裝HNC句類分析軟件,將含有關鍵詞的N個句子輸入到計算機的N個存儲單元中;
步驟4:設立指針變量i,指針變量i的初始值為1,將指針變量i指向上述的計算機存儲單元;
步驟5:把指針變量i指向的計算機存儲單元中的語句取出,輸入給HNC句類分析軟件進行切分詞,HNC句類分析軟件按感情色彩動詞的數量將句子劃分成語義塊,并輸出:
如果該句中只有一個感情色彩動詞,則將句子按單語義塊類型[A1+X1+G]輸出,
如果該句中有兩個感情色彩動詞,則將句子按雙語義塊類型{A2+X2+[A1+X1+G]}格式輸出,
如果該句中有三個感情色彩動詞,則將句子按三語義塊類型A3+X3+{A2+X2+[A1+X1+G]}輸出,
上述格式中,各標號的含義分別是:
A1、A2、A3分別代表第一、第二、第三陳述者,
X1、X2、X3分別代表第一、第二、第三感情色彩動詞,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大正語言知識處理科技有限公司,未經北京大正語言知識處理科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910089496.3/2.html,轉載請聲明來源鉆瓜專利網。





