[發明專利]一種對話文本情感摘要的生成方法在審
| 申請號: | 201310693047.6 | 申請日: | 2013-12-17 |
| 公開(公告)號: | CN103617158A | 公開(公告)日: | 2014-03-05 |
| 發明(設計)人: | 李壽山;林莉媛;王中卿;周國棟 | 申請(專利權)人: | 蘇州大學張家港工業技術研究院 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/21 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 唐靈;常亮 |
| 地址: | 215600 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 對話 文本 情感 摘要 生成 方法 | ||
1.一種對話文本情感摘要的生成方法,該對話文本為英文對話文本,其特征在于,包括:
1)將英文對話文本進行分句處理;
2)將步驟1)中獲得的句子進行分詞處理,獲取單詞特征;
3)抽取步驟2)中具有情感詞的句子,標記成情感特征,并根據單詞特征和情感特征構建句子的特征向量;
4)采用余弦算法計算向量間的相似度;
5)根據所得相似度計算句子間的轉移概率;
6)采用PageRank算法獲取句子的權值;
7)根據所述句子的權值進行排序,抽取句子,獲得摘要。
2.根據權利要求1所述的生成方法,其特征在于:所述步驟1)中是按所述英文對話文本中的結束標志進行分句,所述結束標志為句話、感嘆號、問號或省略號中的一種。
3.根據權利要求1所述的生成方法,其特征在于:所述步驟2)中分詞處理是據英文句子的空格,將一個句子分成各個單詞。
4.根據權利要求1所述的生成方法,其特征在于:所述步驟3)具體包括步驟:
3.1)提供一情感詞詞典;
3.2)根據步驟2)獲得的單詞特征,將句子中可能成為情感詞的單詞與所述情感詞詞典進行匹配查找,以檢測句子中的情感詞,當檢測到情感詞,在該句子后增加“OPINION”特征作為情感特征;
3.3)將所獲得的單詞特征和情感特征結合構建句子的特征向量。
5.根據權利要求1所述的生成方法,其特征在于:所述步驟4)中余弦算法計算向量間的相似度具體為:
根據公式進行計算,其中,所述f(i→j)表示兩個向量間的相似度,ui和uj表示兩個句子的特征向量。
6.根據權利要求1所述的生成方法,其特征在于:所述步驟5)具體為:
根據公式進行計算,其中,p(i→j)表示句子i到句子j的轉移概率,f(i→j)和f(i→k)為兩個句子特征向量間的相似度。
7.根據權利要求1所述的生成方法,其特征在于:所述步驟6)具體為:
根據公式進行計算,其中,所述S(uj)表示句子j的權值,所述μ=0.85為懲罰因子,p(j→i)為上述句子間的轉移概率。
8.根據權利要求1所述的生成方法,其特征在于:所述步驟7)具體包括:
7.1)按照所述句子的權值大小,分別選擇出符合預設數量,且權值較大句子;
7.2)由選擇的所述的句子組成對話文本的情感摘要。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學張家港工業技術研究院,未經蘇州大學張家港工業技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310693047.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于Hadoop的微博熱點話題提取方法
- 下一篇:治療失眠的中藥





