日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于詞匯語義和句法依存的情感關鍵句識別方法有效

專利信息
申請號: 201410425148.X 申請日: 2014-08-27
公開(公告)號: CN104281645B 公開(公告)日: 2017-06-16
發明(設計)人: 馮沖;廖純;劉至潤;黃河燕 申請(專利權)人: 北京理工大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 暫無信息 代理人: 暫無信息
地址: 100081 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 詞匯 語義 句法 依存 情感 關鍵 識別 方法
【權利要求書】:

1.一種基于詞匯語義和句法依存的中文情感關鍵句識別方法,其特征在于,包括以下步驟:

步驟一、語料預處理:對待識別的語料集的每一個句子進行分詞、詞性標注得到帶有詞性標注的語料集合T;

步驟二、候選情感關鍵句生成:分別將T中的每一個句子與領域相關的情感詞典DEL和關鍵詞詞典KL進行匹配,選擇既含有情感詞又含有關鍵詞的句子作為候選情感關鍵句,記候選情感關鍵句的集合為A;

步驟三、SVM分類器分類:從情感詞特征、關鍵詞特征、依存模板特征和位置特征四個方面對集合A的每個句子提取特征向量,并將特征向量置于經過訓練的SVM分類器中進行分類,得到情感關鍵句集合Y和非情感關鍵句集合N;

步驟四、識別完成:輸出識別結果Y;

所述領域相關的情感詞典DEL構建方法包括以下步驟:

步驟一、采用知網(Hownet)提供的情感分析用詞語集中的正面情感詞語、負面情感詞語、正面評價詞語、負面評價詞語加上由臺灣大學整理和發布的簡體中文的NTUSD構成基礎情感詞典(Basic Emotion Lexicon);

步驟二、對語料集S中的所有句子進行分詞、詞性標注后得到語料集合T,按詞性篩選出名詞、動詞和形容詞作為候選詞;

步驟三、分別計算上文構建的Basic Emotion Lexicon中每個詞與這些候選詞之間的點間互信息,關于兩個詞語w1和w2之間的點間互信息PMI(w1,w2)的計算公式如下:

其中P(w1&w2)表示w1和w2在同一個句子中共同出現的概率,P(w1)和P(w2)分別表示兩個詞語單獨出現的概率;計算過程中過濾掉P(w1&w2),P(w1),P(w2)為零的情況;P(w1&w2)、P(w1)和P(w2)都可以通過對語料集合T的統計得到,其計算公式如下:

P(w1&w2)=numsen(w1&w2)/N

P(w1)=numsen(w1)/N

P(w2)=numsen(w2)/N

其中,numsen(w1&w2)表示集合中即出現w1又出現w2的句子數,numsen(w1)表示出現w1的句子數,numsen(w2)表示出現w2的句子數,N表示語料集合T的全部句子數;

步驟四、對于Basic Emotion Lexicon中的每個詞,選取至多前5個與之點間互信息最高的候選詞作為擴展詞,與其在語料集合T中的出現頻率一起加入Basic Emotion Lexicon,并對Basic Emotion Lexicon中的每個情感詞也分別計算其在語料集合T中的出現概率,生成最終的領域相關的情感詞典DEL;

所述關鍵詞詞典的構建方法包括以下步驟:

步驟一、對語料集S中的所有句子進行分詞、詞性標注后得到語料集合T,設置語料集合T的主題個數為n,某個主題用Zt表示,其中t為1到n之間的自然數,通過LDA模型求出文檔-主題分布P(Zt|d)和主題-詞分布P(w|Zt);計算隨機跳轉概率P(Zt|w),計算公式如下:

<mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>z</mi><mi>t</mi></msub><mo>|</mo><mi>w</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>P</mi><mrow><mo>(</mo><mi>w</mi><mo>,</mo><msub><mi>z</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>P</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mfrac><mrow><mi>P</mi><mrow><mo>(</mo><mi>w</mi><mo>|</mo><msub><mi>z</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><mi>P</mi><mrow><mo>(</mo><msub><mi>z</mi><mi>t</mi></msub><mo>|</mo><msub><mi>d</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>d</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><mi>P</mi><mrow><mo>(</mo><mi>w</mi><mo>,</mo><msub><mi>z</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow>

其中,m表示語料集合T中的文檔個數,w表示一個詞,di表示語料集合T的第i篇文章,i∈{1,2,3......,m},P(di)表示文章di在語料集合T中的出現概率;

步驟二、對語料集合T中的每一篇文章按詞性選擇名詞和形容詞作為候選關鍵詞,并以這些詞為節點,分別在每一個主題下構建圖模型:圖G=(V,E),節點集合V={v1,v2,v3......vk},連接從節點vi到節點vj的邊得到邊集(vi,vj)∈E,其中k表示候選關鍵詞的個數,i,j∈{1,2,3......,k},i≠j;

確定兩個節點之間是否存在邊以及邊的方向的方法如下:

在原文中設置一個大小為window的滑動窗口,分別按照順序從第一個詞性為名詞或形容詞的詞語指向窗口內與第一個詞不同的其他詞性為名詞或形容詞的詞語,由此得到邊集E,依次遍歷集合E中的每條邊,按以下方法對每條邊設置權重:

權重設置主要考慮四個因素:位置重要性的影響力、覆蓋重要性的影響力、頻度重要性的影響力和共現重要性的影響力;對于任意兩個結點vi和vj,結點vi對vj的影響力通過其有向邊e=<vi,vj>傳遞,邊的權重wij決定了vj最終所獲得vi部分的分值大小,令wij表示結點vi和vj的整體影響力權重,α,β,γ,δ分別表示這四類不同的影響力所占的比重,且α+β+γ+δ=1,則兩節點之間的權值wij可以根據下式計算:

wij=αwpos(vi,vj)+βwcov(vi,vj)+γwfreq(vi,vj)+δwco-occur(vi,vj)

a)wpos(vi,vj)表示節點vi的位置影響力傳遞到vj的權重,計算公式如下:

<mrow><msub><mi>w</mi><mrow><mi>p</mi><mi>o</mi><mi>s</mi></mrow></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mrow><msub><mi>v</mi><mi>t</mi></msub><mo>&Element;</mo><mi>O</mi><mi>u</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow>

其中,Out(vi)表示以vi為起點所指向的節點的集合,P(vj)表示節點vj的位置重要性得分,具體賦值方式如下:

其中,λ是一個比1大的數字,值為1.5;

b)wcov(vi,vj)表示節點vi的覆蓋影響力傳遞到vj的權重,計算公式如下:

<mrow><msub><mi>w</mi><mi>cov</mi></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><mi>O</mi><mi>u</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>|</mo></mrow></mfrac></mrow>

其中,|Out(vi)|表示節點vi的出度;

c)wfreq(vi,vj)表示節點vi的頻度影響力傳遞到vj的權重,計算公式如下:

<mrow><msub><mi>w</mi><mrow><mi>f</mi><mi>r</mi><mi>e</mi><mi>q</mi></mrow></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>f</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mrow><msub><mi>v</mi><mi>t</mi></msub><mo>&Element;</mo><mi>O</mi><mi>u</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></msub><mi>f</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow>

其中,Out(vi)表示以vi為起點所指向的節點的集合,f(vj)表示節點vj所代表的詞語在文章中出現的次數;

d)wco-occur(vi,vj)表示節點vi的共現影響力傳遞到vj的權重,計算公式如下:

<mrow><msub><mi>w</mi><mrow><mi>c</mi><mi>o</mi><mo>-</mo><mi>o</mi><mi>c</mi><mi>c</mi><mi>u</mi><mi>r</mi></mrow></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>C</mi><mi>o</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mrow><msub><mi>v</mi><mi>t</mi></msub><mo>&Element;</mo><mi>O</mi><mi>u</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></msub><mi>C</mi><mi>o</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow>

其中,Co(vi,vj)表示節點vi,vj所代表的詞語在一定窗口內共現的次數;

步驟三、圖模型建立完畢之后,利用textrank的思想對各節點進行打分排序,用以下公式迭代計算每一個節點在特定主題下的得分:

<mrow><msub><mi>R</mi><msub><mi>z</mi><mi>t</mi></msub></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>&lambda;</mi><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>:</mo><msub><mi>v</mi><mi>j</mi></msub><mo>&RightArrow;</mo><msub><mi>v</mi><mi>i</mi></msub></mrow></munder><mfrac><mrow><mi>w</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>j</mi></msub><mo>,</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>|</mo><mi>O</mi><mi>u</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>|</mo></mrow></mfrac><msub><mi>R</mi><msub><mi>z</mi><mi>t</mi></msub></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>&lambda;</mi><mo>)</mo></mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>z</mi><mi>t</mi></msub><mo>|</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow>

其中,w(vj,vi)即為步驟二中求得的節點vj,vi之間的權值wji;P(zt|vi)即為步驟一中求得的P(zt|w);λ為阻尼因子,值為0.75;j:vj→vi表示節點vj在以節點vi為終點的節點集合內遍歷;按以上公式迭代前設置所有節點得分初值為1;當連續兩次迭代,所有節點得分誤差都在0.0001范圍之內時,迭代終止,將此時的得分作為每一個節點在特定主題下的得分;

步驟四、求得每一個節點在特定主題下的得分之后,按照下述公式計算每一個節點在一篇文章下的最終得分R(vi):

<mrow><mi>R</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>R</mi><msub><mi>z</mi><mi>t</mi></msub></msub><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&times;</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>z</mi><mi>t</mi></msub><mo>|</mo><mi>d</mi><mo>)</mo></mrow></mrow>

選取最終得分排名靠前的節點,將節點所代表的候選關鍵詞與此節點的最終得分一塊加入關鍵詞詞典KL,依此方法生成對應于語料集合T中所有文章的最終的關鍵詞詞典KL。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410425148.X/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲高清国产精品| 国产精品综合一区二区| 在线观看国产91| 亚洲欧美国产中文字幕| 亚州精品国产| 亚洲精品国产精品国产| 亚洲一区二区福利视频| 国产精品白浆视频| 日本一区二区三区电影免费观看| 日韩国产精品久久| 国产一区午夜| 国产在线精品一区| 99欧美精品| 欧美一区二区三区四区夜夜大片 | 久久精品国产亚洲7777| 国产视频一区二区在线播放| 久久久午夜爽爽一区二区三区三州| 日本二区在线播放| 日韩三区三区一区区欧69国产 | 丰满岳乱妇在线观看中字| 精品国产鲁一鲁一区二区作者| 亚洲va国产| 欧美一区二区三区不卡视频| 最新国产精品久久精品| 欧美日韩国产精品一区二区| 国精产品一二四区在线看| 在线中文字幕一区| 国产一区在线视频观看| 99riav3国产精品视频| 欧美精品一级二级| 国偷自产中文字幕亚洲手机在线| 国产午夜精品av一区二区麻豆| 国产精品1区二区| 夜夜夜夜曰天天天天拍国产| 欧美极品少妇xx高潮| 娇妻被又大又粗又长又硬好爽 | 久久国产精品欧美| 亚洲欧美一区二区精品久久久| 久久九精品| 精品欧美一区二区在线观看| 中文字幕久久精品一区| 伊人久久婷婷色综合98网| 久久综合二区| 二区三区免费视频| 97久久超碰国产精品红杏| 午夜a电影| 色婷婷综合久久久久中文| 精品一区二区在线视频| 日本99精品| 精品久久久影院| 国产女人和拘做受在线视频| 亚洲欧美日韩综合在线| 国产精品19乱码一区二区三区| 日韩av在线高清| 午夜伦全在线观看| 久久久久久久亚洲视频| 日韩欧美国产高清91| 97人人澡人人添人人爽超碰| 欧美精品九九| 午夜一级免费电影| 国产乱一乱二乱三| 亚洲福利视频二区| 高清欧美xxxx| 欧美日韩精品在线一区二区| 国产精品视频一二区| 久久第一区| 国产一区2区3区| 91麻豆精品国产91久久久更新时间| 国产日韩欧美不卡| 亚洲国产日韩综合久久精品| 一级久久精品| 日韩中文字幕区一区有砖一区| 精品999久久久| 欧美一区亚洲一区| 狠狠色噜噜狠狠狠狠2018| 自拍偷在线精品自拍偷无码专区 | 国产亚洲精品久久久久秋霞| 国产理论片午午午伦夜理片2021 | 日韩精品免费一区| 欧美精品一区二区三区在线四季| 国产精品久久久久久久妇女| 国产精品一区二区av日韩在线 | 欧美综合在线一区| 亚洲精品日本久久一区二区三区| 美女张开腿黄网站免费| 午夜国产一区二区三区| 国产乱码精品一区二区三区介绍| 欧美一区二区久久久| 中文无码热在线视频| 久久激情影院| 日韩午夜一区| 视频一区欧美| 日韩无遮挡免费视频| 亚洲欧美中日精品高清一区二区| 少妇**毛片| 日韩精品一区在线观看| 午夜激情在线播放| 最新国产精品自拍| 日本一区二区在线观看视频| 亚洲欧美日韩国产综合精品二区| 性夜影院在线观看| 丰满岳乱妇bd在线观看k8| 亚洲一区二区三区加勒比| 91香蕉一区二区三区在线观看| 国产午夜精品一区二区三区在线观看| 日本高清一二区| 国产精品国产三级国产专播精品人 | 免费的午夜毛片| 日韩av在线影院| 欧美日韩亚洲另类| 欧美资源一区| 福利电影一区二区三区| 欧美激情视频一区二区三区| 97香蕉久久国产超碰青草软件| 亚洲国产另类久久久精品性| 国产床戏无遮挡免费观看网站| **毛片在线免费观看| 亚洲乱亚洲乱妇50p| 日本一区二区免费电影| av素人在线| 国产1区在线观看| 国产欧美精品一区二区三区小说| 久久精品视频一区二区| 久久人91精品久久久久久不卡| 91在线一区二区| 一区二区三区国产精品| 麻豆天堂网| 91超薄丝袜肉丝一区二区| 99日本精品| 久久午夜鲁丝片午夜精品| 国产高清一区在线观看| 91福利试看| 欧美高清xxxxx| 久久国产欧美一区二区三区免费| 国产精品一级片在线观看| 国产一区二区视频在线| 亚洲少妇一区二区三区| 精品一区二区三区视频?| 日韩精品中文字幕在线播放| 野花国产精品入口| 午夜无遮挡| 久久久久久亚洲精品| 免费a级毛片18以上观看精品| 色妞妞www精品视频| 99精品一区| 久久综合伊人77777麻豆| 电影91久久久| 国产1区2| 日本99精品| av午夜剧场| 欧美在线一级va免费观看| 最新国产精品自拍| 女女百合互慰av| 亚洲国产一区二区久久久777| 国产清纯白嫩初高生在线观看性色| 91av中文字幕| 日韩中文字幕在线一区| 久久乐国产精品| 99精品在免费线偷拍| 日韩欧美国产高清91| 少妇厨房与子伦免费观看| 欧美一区二区三区免费看| 日本一区二区电影在线观看| 国产综合亚洲精品| 四虎国产精品久久| 激情久久一区二区| freexxxxxxx| 99久久婷婷国产综合精品电影| 91久久一区二区| 国产乱了高清露脸对白| 午夜欧美影院| 久久99久久99精品蜜柚传媒| 在线播放国产一区| 在线国产91| 久久久久久久久亚洲精品一牛| 欧美髙清性xxxxhdvid| 国产色99| 久久久精品视频在线| 日本三级韩国三级国产三级| 中文字幕一区二区在线播放| 免费久久99精品国产婷婷六月| 免费观看又色又爽又刺激的视频| 黄色国产一区二区| 午夜社区在线观看| 欧美一区二区三区黄| 国产一区精品在线观看| 久久99国产精品久久99果冻传媒新版本| 2021天天干夜夜爽| 国产69精品久久久久777糖心| 亚洲欧洲精品一区二区三区不卡| 久久久久一区二区三区四区| 视频二区一区国产精品天天| 国产精品美女一区二区视频| 欧美精品一级二级| 99精品国产免费久久| 97精品国产aⅴ7777| 99精品国产99久久久久久97| 国产一区二区三区久久久| 国产区一区| 男女午夜爽爽| 欧美一区二区三区四区在线观看| 88国产精品视频一区二区三区| 91偷拍网站| 久久夜色精品国产亚洲| 一区二区三区免费高清视频| 日韩电影在线一区二区三区| 色综合久久精品| 偷拍久久精品视频| 国产精品人人爽人人做av片| 国产99久久九九精品| 91精品一二区| 国产vsv精品一区二区62| 国产一区二区三区久久久| 午夜毛片影院| 国产人伦精品一区二区三区| 丰满岳乱妇在线观看中字 | 午夜特片网| 93精品国产乱码久久久| aaaaa国产欧美一区二区| 亚洲区日韩| 午夜情所理论片| 国产伦精品一区二区三区免费迷| 91丝袜国产在线播放| 日韩精品999| 国产男女乱淫视频高清免费| 亚洲精品一区,精品二区| 丰满岳妇伦4在线观看| 91麻豆精品国产91久久久久| 一本大道久久a久久精品| 狠狠色噜噜狠狠狠狠2021免费| 免费午夜在线视频| 国产精品一区二区麻豆| 一级黄色片免费网站| 国产精品一区二区6| 精品国产乱码一区二区三区a| 海量av在线| 久久精品手机视频| 一区二区久久精品66国产精品| 色吊丝av中文字幕| 亚洲国产精品第一区二区| 国产69精品久久久久app下载| 国产精品久久久不卡| 国产女人和拘做受在线视频| 欧美高清性xxxxhd| 午夜叫声理论片人人影院| 91热精品|