[發明專利]情感實體詞的篩選方法和裝置有效
| 申請號: | 201910491200.4 | 申請日: | 2019-06-06 |
| 公開(公告)號: | CN110399481B | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 楊志明 | 申請(專利權)人: | 深思考人工智能機器人科技(北京)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/9535;G06F40/289 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 100084 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感 實體詞 篩選 方法 裝置 | ||
本發明公開了一種情感實體詞的篩選方法和裝置,包括:遍歷候選文本的每個句子,選出每個句子中權重指標最大的情感實體詞為候選情感實體詞;情感實體詞為一個句子中的情感對象詞與情感詞的組合;在所有候選情感實體詞中,統計不同詞的出現頻次,依據出現頻次對不同詞進行非遞減排序,取排序中前預設個數的候選情感實體詞為備用情感實體詞。基于本發明的方法,自動生成候選文本的備用情感實體詞,無需人工參與,既提高了處理效率,又能避免人工處理帶來的失誤。
技術領域
本發明涉及計算機領域,特別涉及一種情感實體詞的篩選方法和裝置。
背景技術
隨著互聯網和社交媒體的發展,目前網絡上已經有海量的文本信息,包括維基百科詞條、學術文章、新聞報道、以及各種售后服務評論,而這些文本信息中蘊含了大量有價值的信息。現有的文本分類技術可以粗略的提取其中特定的信息。
情感計算作為一種文本分類技術,通過對售后評論進行情感分析可以得知消費者對于該產品或者服務的滿意度。目前,情感計算最常見的是利用情感詞典中的關鍵詞對所給的句子分類或者打分。
基于情感詞典的情感計算中最重要的步驟是情感詞典的構建,而情感詞典的構建通過人工構建實現,包括構建情感實體詞及其情感分類。人工構建不僅費事費力,且容易出錯。
發明內容
有鑒于此,本發明提供一種情感實體詞的篩選方法和裝置,解決現有情感詞典中感情實體詞的人工構建問題。
本發明提供一種情感實體詞的篩選方法,該方法包括
遍歷候選文本的每個句子,選出每個句子中權重指標最大的情感實體詞為候選情感實體詞;情感實體詞為一個句子中的情感對象詞與情感詞的組合;
在所有候選情感實體詞中,統計不同詞的出現頻次,依據出現頻次對不同詞進行非遞減排序,取排序中前預設個數的候選情感實體詞為備用情感實體詞。
本發明還提供一種非瞬時計算機可讀存儲介質,非瞬時計算機可讀存儲介質存儲指令,其指令在由處理器執行時使得處理器執行上述的情感實體詞的篩選方法中的步驟。
本發明還提供一種情感實體詞的篩選裝置,包括處理器和上述的非瞬時計算機可讀存儲介質。
本發明方法,以句子為單位,基于頻次和權重指標篩選候選文本的“備用情感實體詞”,可以確保得到的“備用情感實體詞”為熱門的重要情感實體詞。
且本發明方法,可以自動運行,無需人工參與,既提高了處理效率,又能避免人工處理帶來的失誤。
附圖說明
圖1為本發明情感實體詞的篩選方法的流程圖;
圖2為本發明情感實體詞及其權重指標的實現流程圖;
圖3為本發明情感實體詞的篩選裝置的結構圖。
具體實施方式
為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本發明進行詳細描述。
如圖1所示,本發明提供一種情感實體詞的篩選方法,包括
S10:遍歷候選文本的每個句子,選出每個句子中權重指標最大的情感實體詞為候選情感實體詞;情感實體詞為一個句子中的情感對象詞與情感詞的組合;
S20:在所有候選情感實體詞中,統計不同詞的出現頻次,依據出現頻次對不同詞進行非遞減排序,取排序中前預設個數的候選情感實體詞為備用情感實體詞。
以句子:“最滿意的一點是不僅外觀霸氣內飾配置也毫不遜色”為例,可以按圖2方法生成該句的候選情感實體詞及其權重指標。
S31:對句子進行分詞和詞性分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深思考人工智能機器人科技(北京)有限公司,未經深思考人工智能機器人科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910491200.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網頁的訓練方法及系統
- 下一篇:文本分類方法、模型和裝置





