[發(fā)明專利]一種情感詞典構(gòu)建方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210138364.7 | 申請日: | 2012-05-07 |
| 公開(公告)號: | CN102663139A | 公開(公告)日: | 2012-09-12 |
| 發(fā)明(設(shè)計)人: | 李壽山;林莉媛;周國棟 | 申請(專利權(quán))人: | 蘇州大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/28 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 情感 詞典 構(gòu)建 方法 系統(tǒng) | ||
1.一種情感詞典構(gòu)建方法,其特征在于,包括:
獲取包含正面詞和負面詞的基礎(chǔ)種子詞詞集;
獲取所述基礎(chǔ)種子詞的同義詞,并將所述同義詞加入到所述基礎(chǔ)種子詞的詞集中,以形成擴展后種子詞詞集;
對評價語料進行分詞處理,以獲取多個詞語,并確定獲取的詞語的詞性;
計算獲取到的詞語與所述擴展后種子詞詞集中的各個種子詞的點互信息量PMI;
根據(jù)所述詞語與各個種子詞的點互信息量PMI,及與所述詞語的詞性對應(yīng)的參數(shù)值,獲取所述詞語的情感傾向值SO;
根據(jù)所述情感傾向值SO,選擇預設(shè)數(shù)量的詞語,并根據(jù)情感極性,將所選詞語構(gòu)建成包含正面情感詞子詞典和負面情感詞子詞典的情感詞典。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取種子詞的同義詞,以獲得擴展后種子詞詞集具體包括:
獲取同義詞詞林;
將所述各個種子詞與所述同義詞詞林中的詞語進行匹配查找,以獲取所述種子詞的同義詞;
將所述同義詞加入基礎(chǔ)種子詞的詞集中,以獲取擴展后種子詞詞集。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,計算獲取到的詞語與所述擴展后種子詞詞集中的各個種子詞的點互信息量PMI的方法具體為:
根據(jù)公式進行計算,其中,所述w1和w2分別表示種子詞和所述獲取到的詞語,所述p(w1&w2)表示兩個詞w1和w2共同出現(xiàn)的概率,p(w1)和p(w2)分別代表兩詞各自出現(xiàn)的概率。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取所述詞語的情感傾向值SO的方法具體為:
根據(jù)公式
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述詞性包括:形容詞、副詞和其他詞性的詞,其中所述形容詞所對應(yīng)的參數(shù)值p為0.6,所述副詞所對應(yīng)的參數(shù)值p為0.3,其他詞性的詞的參數(shù)值p為0.1。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學,未經(jīng)蘇州大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210138364.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種潛水電機調(diào)壓底座組件
- 下一篇:耐壓地封裝的電機
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預測模型構(gòu)建方法





