[發(fā)明專利]新聞要素的提取方法、裝置、計算機設備和存儲介質在審
| 申請?zhí)枺?/td> | 202010560759.0 | 申請日: | 2020-06-18 |
| 公開(公告)號: | CN111753197A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設計)人: | 文敏;陳運文;侯聰;桂洪冠;白良俊;紀達麒;羅巧梅 | 申請(專利權)人: | 達而觀信息科技(上海)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9538;G06F16/335;G06F16/338 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201203 上海市浦東新區(qū)中國(上海)自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 新聞 要素 提取 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種新聞要素的提取方法,其特征在于,包括:
獲取至少一個目標類型的新聞文本,并將各新聞文本分別輸入至預先訓練的要素提取模型中,所述要素提取模型使用多個目標類型的新聞訓練樣本訓練得到;
獲取所述要素提取模型輸出的,與各所述新聞文本分別對應的至少一個要素的要素信息值;
響應于用戶輸入的展示要素,獲取與所述展示要素匹配的展示界面;
根據各所述新聞文本中與所述展示要素對應的要素信息值,將與各所述新聞文本分別對應的至少一個要素的要素信息值填充于所述展示界面中進行展示。
2.根據權利要求1所述的方法,其特征在于,所述要素包括以下至少一項:時間、地點、人物、主語、觸發(fā)詞以及賓語。
3.根據權利要求2所述的方法,其特征在于,在獲取所述要素提取模型輸出的,與各所述新聞文本分別對應的至少一個要素的要素信息值之后,還包括:
如果所述要素為時間,則將時間信息值轉換為標準時間信息值;
當所述展示要素為時間時,獲取與所述展示要素匹配的展示界面,包括:
獲取時間軸;
根據各所述新聞文本中與所述展示要素對應的要素信息值,將與各所述新聞文本分別對應的至少一個要素的要素信息值填充于所述展示界面中進行展示,包括:
將各所述新聞文本的標準時間信息值在所述時間軸上按照時間發(fā)生順序進行排序,并根據排序結果在所述時間軸上標注與各所述新聞文本分別對應的至少一個要素的要素信息值;
將所述時間軸展示到可視化人機交互界面。
4.根據權利要求2所述的方法,其特征在于,在獲取所述要素提取模型輸出的,與各所述新聞文本分別對應的至少一個要素的要素信息值之后,還包括:
如果所述要素為地點,則將地點信息值與地圖中的地點名稱進行匹配,并將所述地圖中匹配度最高的地點名稱作為地點信息值。
當所述展示要素為地點時,獲取與所述展示要素匹配的展示界面,包括:
獲取地圖;
根據各所述新聞文本中與所述展示要素對應的要素信息值,將與各所述新聞文本分別對應的至少一個要素的要素信息值填充于所述展示界面中進行展示,包括:
在所述地圖中對所述地點信息值對應的地點進行標注,并根據標注結果在所述地圖上標注與各所述新聞文本分別對應的至少一個要素的要素信息值;
將所述地圖展示到可視化人機交互界面。
5.根據權利要求1所述的方法,其特征在于,在獲取所述要素提取模型輸出的,與各所述新聞文本分別對應的至少一個要素的要素信息值之后,還包括:
如果目標新聞文本中的目標要素對應至少兩個要素信息值,則對所述至少兩個要素信息值進行多結果消除處理。
6.根據權利要求5所述的方法,其特征在于,對所述至少兩個要素信息值進行多結果消除處理,包括:
獲取目標新聞文本中的觸發(fā)詞,對所述至少兩個要素信息值,保留與所述觸發(fā)詞距離最近的要素信息值,并將其他要素信息值刪除。
7.根據權利要求1所述的方法,其特征在于,獲取至少一個目標類型的新聞文本之后,還包括:
將各新聞文本轉換為標準格式。
8.一種新聞要素的提取裝置,其特征在于,包括:
新聞文本獲取模塊,用于獲取至少一個目標類型的新聞文本,并將各新聞文本分別輸入至預先訓練的要素提取模型中,所述要素提取模型使用多個目標類型的新聞訓練樣本訓練得到;
要素信息值獲取模塊,用于獲取所述要素提取模型輸出的,與各所述新聞文本分別對應的至少一個要素的要素信息值;
展示界面獲取模塊,用于響應于用戶輸入的展示要素,獲取與所述展示要素匹配的展示界面;
要素信息值展示模塊,用于根據各所述新聞文本中與所述展示要素對應的要素信息值,將與各所述新聞文本分別對應的至少一個要素的要素信息值填充于所述展示界面中進行展示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于達而觀信息科技(上海)有限公司,未經達而觀信息科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010560759.0/1.html,轉載請聲明來源鉆瓜專利網。





