[發(fā)明專利]基于規(guī)劃?目標(biāo)圖的新聞事件信息抽取方法在審
| 申請(qǐng)?zhí)枺?/td> | 201611213321.5 | 申請(qǐng)日: | 2016-12-23 |
| 公開(公告)號(hào): | CN106874345A | 公開(公告)日: | 2017-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 趙美靜;倪晚成;劉禹 | 申請(qǐng)(專利權(quán))人: | 中國科學(xué)院自動(dòng)化研究所 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)11482 | 代理人: | 李飛,吳曉芬 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 規(guī)劃 目標(biāo) 新聞 事件 信息 抽取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)應(yīng)用中的輿情分析和文本處理技術(shù)領(lǐng)域,具體來說涉及一種基于規(guī)劃-目標(biāo)圖的新聞事件信息抽取方法。
背景技術(shù)
隨著web技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)普及率逐漸上升,信息公開化程度逐步提高,網(wǎng)絡(luò)已經(jīng)成為新聞事件報(bào)道和傳播的重要平臺(tái)。互聯(lián)網(wǎng)上新聞網(wǎng)頁的數(shù)量急劇增長,新聞量和冗余信息的增加,給閱讀和信息分析帶來了新的挑戰(zhàn)。快速、精準(zhǔn)地從新聞報(bào)道中自動(dòng)抽取新聞事件信息,尤其是新聞事件的關(guān)鍵信息,一方面,能夠輔助分析和管理新聞事件,降低人工成本,提高分析效率;另一方面,能夠?yàn)榫W(wǎng)絡(luò)輿情的監(jiān)控和預(yù)警、熱點(diǎn)事件的檢索和追蹤、智能問答系統(tǒng)及大數(shù)據(jù)決策支持等上層應(yīng)用提供支持,具有廣泛的應(yīng)用前景。
新聞事件是指發(fā)生在某時(shí)某地的一件特別的事情,它可以由許多信息組成,其中較為關(guān)鍵的信息包括:事件發(fā)生的時(shí)間、事件發(fā)生的地點(diǎn)、事件的參與者、事件的關(guān)鍵詞和事件的某些關(guān)鍵數(shù)字等。這些信息不僅有助于新聞閱讀者快速把握新聞事件的主體內(nèi)容信息,而且可以為海量新聞數(shù)據(jù)的自動(dòng)分析和處理提供必要的基礎(chǔ)內(nèi)容。由于新聞文本在形式上具有詞匯、句式規(guī)范、篇章結(jié)構(gòu)統(tǒng)一、語言風(fēng)格穩(wěn)定等特點(diǎn),使得自動(dòng)抽取新聞事件的關(guān)鍵信息成為可能。然而,目前最常見的新聞抽取系統(tǒng)所解決的問題主要是從新聞網(wǎng)頁中抽取正文中的個(gè)別句子作為新聞?wù)蛘邔?duì)新聞?wù)倪M(jìn)行簡單的分類處理,關(guān)于理解新聞事件內(nèi)容,特別是自動(dòng)地、可解釋地進(jìn)行事件信息抽取等方面的工作仍然空缺。
有鑒于此,特提出本發(fā)明。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問題,即為了解決如何自動(dòng)、快速、充分地挖掘新聞事件信息的技術(shù)問題而提供一種基于規(guī)劃-目標(biāo)圖的新聞事件信息抽取方法。
為了實(shí)現(xiàn)上述目的,提供了以下技術(shù)方案:
一種基于規(guī)劃-目標(biāo)圖的新聞事件信息抽取方法,該方法包括:
抽取新聞文本的新聞實(shí)體信息和關(guān)鍵詞信息;
基于新聞實(shí)體信息和關(guān)鍵詞信息,建立新聞事件信息抽取規(guī)劃-目標(biāo)圖;
設(shè)置新聞事件信息抽取規(guī)劃-目標(biāo)圖的狀態(tài);
根據(jù)新聞事件信息抽取規(guī)劃-目標(biāo)圖的狀態(tài),建立新聞事件信息抽取規(guī)劃-目標(biāo)圖的判定規(guī)則;
執(zhí)行新聞事件信息抽取規(guī)劃-目標(biāo)圖的判定規(guī)則,抽取新聞事件信息。
進(jìn)一步地,抽取新聞文本的新聞實(shí)體信息和關(guān)鍵詞信息具體包括:
將新聞文本分為:標(biāo)題、摘要和正文;
針對(duì)標(biāo)題、摘要和正文,分別進(jìn)行分詞、詞性標(biāo)注和命名實(shí)體識(shí)別處理,抽取出時(shí)間實(shí)體、地點(diǎn)實(shí)體、人物實(shí)體、機(jī)構(gòu)實(shí)體,并提取出正文的關(guān)鍵詞。
進(jìn)一步地,當(dāng)時(shí)間實(shí)體和地點(diǎn)實(shí)體為多個(gè)時(shí),將多個(gè)時(shí)間實(shí)體中的一個(gè)作為時(shí)間實(shí)體抽取值,將多個(gè)地點(diǎn)實(shí)體中的一個(gè)多為地點(diǎn)實(shí)體抽取值。
進(jìn)一步地,基于新聞實(shí)體信息和關(guān)鍵詞信息,建立新聞事件信息抽取規(guī)劃-目標(biāo)圖,具體包括:
基于新聞實(shí)體信息和關(guān)鍵詞信息,建立層級(jí)節(jié)點(diǎn)關(guān)系圖;其中,層級(jí)節(jié)點(diǎn)關(guān)系圖由規(guī)劃節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)交替組成;
設(shè)置同一目標(biāo)節(jié)點(diǎn)的多個(gè)規(guī)劃節(jié)點(diǎn)之間的優(yōu)先級(jí)。
進(jìn)一步地,設(shè)置新聞事件信息抽取規(guī)劃-目標(biāo)圖的狀態(tài)具體包括:
設(shè)置規(guī)劃節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)的邏輯屬性;
確定同一目標(biāo)節(jié)點(diǎn)的多個(gè)規(guī)劃節(jié)點(diǎn)之間的優(yōu)先級(jí)。
進(jìn)一步地,執(zhí)行新聞事件信息抽取規(guī)劃-目標(biāo)圖的判定規(guī)則,抽取新聞事件信息,具體包括:
當(dāng)頂層節(jié)點(diǎn)的邏輯屬性為真時(shí),根據(jù)目標(biāo)節(jié)點(diǎn)的規(guī)劃節(jié)點(diǎn)的優(yōu)先級(jí),抽取新聞事件信息。
進(jìn)一步地,新聞事件信息包括新聞文本的時(shí)間、地點(diǎn)、參與者和事件關(guān)鍵詞信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動(dòng)化研究所,未經(jīng)中國科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611213321.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種雨水收集裝置
- 下一篇:半導(dǎo)體制水器及制水系統(tǒng)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 動(dòng)態(tài)優(yōu)化交通規(guī)劃方法和系統(tǒng)
- 路徑預(yù)約規(guī)劃結(jié)果同步系統(tǒng)及方法
- 一種波長路由規(guī)劃方法和裝置
- 硬件規(guī)劃的方法和裝置
- 能量供求規(guī)劃裝置及能量供求規(guī)劃方法
- 一種基于企業(yè)效益與用戶體驗(yàn)的微電網(wǎng)規(guī)劃方法
- 城市規(guī)劃方法、裝置及電子設(shè)備
- 場館座位信息的規(guī)劃方法及裝置、系統(tǒng)
- 路徑規(guī)劃系統(tǒng)及路徑規(guī)劃方法
- 基于深度學(xué)習(xí)的路線規(guī)劃方法及系統(tǒng)
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





