日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本中的人物挖掘方法、裝置、電子設備及存儲介質有效

專利信息
申請號: 202011162912.0 申請日: 2020-10-27
公開(公告)號: CN112270173B 公開(公告)日: 2021-10-26
發明(設計)人: 白潔;王毅;潘政林 申請(專利權)人: 北京百度網訊科技有限公司
主分類號: G06F40/216 分類號: G06F40/216;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京鴻德海業知識產權代理有限公司 11412 代理人: 田宏賓
地址: 100085 北京市*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 中的 人物 挖掘 方法 裝置 電子設備 存儲 介質
【權利要求書】:

1.一種文本中的人物挖掘方法,其中,所述方法包括:

采用預先訓練的人名識別模型,預測指定文本中的候選人物集合;

對所述指定文本進行新詞發現,獲取新詞列表;

基于預先訓練的信息抽取模型預測各句子的潛在說話人以及預測概率;從所述新詞列表中獲取屬于潛在說話人的數個新詞;將所述數個新詞基于所述預測概率以及在所述指定文本中的頻率權重系數進行排序,獲取前N個所述新詞和所述候選人物集合中的所述候選人名作為所述指定文本中的人物信息,所述N為正整數。

2.根據權利要求1所述的方法,其中,采用預先訓練的人名識別模型,預測指定文本中的候選人物集合,包括:

采用所述人名識別模型,基于所述指定文本中的各句子,進行人名提取,獲取到數個備選人名;

從所述數個備選人名中篩選詞頻大于預設詞頻閾值的數個候選人名,構成所述候選人物集合。

3.根據權利要求2所述的方法,其中,采用所述人名識別模型,基于所述指定文本中的各句子,進行人名提取,獲取到數個備選人名之前,所述方法還包括:

檢測各所述句子長度是否大于預設長度閾值;

若是,對所述句子進行斷句處理,拆分為至少兩個分句,使得各所述分句的長度不大于所述預設長度閾值。

4.根據權利要求1所述的方法,其中,對所述指定文本進行新詞發現,獲取新詞列表,包括:

統計所述指定文本中各文本片段的出現頻率;

獲取所述指定文本中各所述文本片段的自由度;

獲取所述指定文本中各所述文本片段的凝合度:

基于各所述文本片段的自由度、各所述文本片段的凝合度和各所述文本片段的出現頻率中的至少一個,提取滿足預設條件的多個文本片段,作為多個新詞,構成所述新詞列表。

5.根據權利要求4所述的方法,其中,統計所述指定文本中各文本片段的出現頻率之前,所述方法還包括:

基于預設的詞庫,從所述指定文本中獲取不屬于所述詞庫中的詞語的各所述文本片段。

6.根據權利要求4所述的方法,其中,獲取所述指定文本中各文本片段的自由度,包括:

獲取所述指定文本中各所述文本片段的左鄰字集合和右鄰字集合;

計算對應的所述文本片段分別與所述左鄰字集合和所述右鄰字集合中各字構成的片段的信息熵;

取所述文本片段分別與所述左鄰字集合和所述右鄰字集合中各字構成的片段的信息熵的最小值,作為對應的所述文本片段的自由度。

7.根據權利要求4所述的方法,其中,獲取所述指定文本中各所述文本片段的凝合度,包括:

對于各所述文本片段,獲取對應的所述文本片段包括的至少一組拆分片段;

統計對應的所述文本片段中各組所述拆分片段的出現頻率;

基于對應的所述文本片段的出現頻率以及各組所述拆分片段的出現頻率,計算所述文本片段的凝合度。

8.根據權利要求1-7任一所述的方法,其中,在所述基于預先訓練的信息抽取模型預測各句子的潛在說話人以及預測概率之前,還包括:

檢測所述候選人物集合中的候選人名和所述新詞列表中的新詞是否有共同片段;若有,采用對應的所述新詞更新所述候選人物集合中對應的所述候選人名;將更新后的所述候選人物集合中的候選人名作為所述指定文本中的人物信息;

否則,繼續執行所述基于預先訓練的信息抽取模型預測各句子的潛在說話人以及預測概率。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011162912.0/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产91丝袜在线熟| 精品国产乱码久久久久久影片| 国内精品久久久久影院日本| 午夜免费一级片| 欧美在线播放一区| 91麻豆精品国产91久久久更新资源速度超快 | 国产精品不卡一区二区三区| 日本一区二区三区免费视频| 国产免费区| 亚洲精品丝袜| 国产精品伦一区二区三区在线观看| 国产一区二区电影| 欧美一区二区三区免费电影| 狠狠躁天天躁又黄又爽| 最新国产一区二区| 天干天干天啪啪夜爽爽99| 亚州精品中文| 日韩欧美一区二区久久婷婷| 狠狠色噜噜狠狠狠狠米奇7777| 久久夜靖品2区| 狠狠色噜噜狠狠狠狠2021免费| 欧美日韩久久一区| 久久一区二区精品| 精品国产91久久久久久久| 少妇厨房与子伦免费观看| 69久久夜色精品国产69–| 午夜av资源| 欧美一区二区综合| 亚洲在线久久| 91麻豆精品国产91久久久更新时间| 999久久久国产| 欧美一区二区三区高清视频| 国产v亚洲v日韩v欧美v片| 鲁丝一区二区三区免费观看| 狠狠色噜噜狠狠狠狠2021免费| 制服.丝袜.亚洲.另类.中文| 国产精品黑色丝袜的老师| 国产精品不卡在线| 一区二区久久久久| 欧美一区二区三区在线免费观看| 色综合久久久久久久粉嫩| 色噜噜狠狠色综合中文字幕| 久久久精品二区| 狠狠色噜噜综合社区| 国产精品尤物麻豆一区二区三区| 91avpro| 日韩亚洲精品在线观看| 精品亚洲午夜久久久久91| 午夜av资源| 国模一区二区三区白浆| 国产91精品一区二区麻豆亚洲| 久久国产免费视频| 日韩av在线网址| 国产一区精品在线观看| 国产欧美日韩中文字幕| 99日韩精品视频| 中文字幕一区二区三区免费视频| 中文字幕区一区二| 欧美日韩九区| 夜夜夜夜夜猛噜噜噜噜噜gg| 美日韩一区| 狠狠色噜噜狠狠狠狠69| 国产欧美一区二区三区精品观看| 国产一区二区三区小说| 久久久久久久久亚洲精品| 国产精品丝袜综合区另类 | 亚洲欧美日本一区二区三区 | 国产精品久久久久久久久久久杏吧 | 久久不卡精品| 精品三级一区二区| 91麻豆精品国产91久久| 欧美视屏一区二区| 国产日韩欧美第一页| 97国产婷婷综合在线视频,| 丰满岳乱妇在线观看中字| 一区二区三区中文字幕| 亚洲国产精品第一区二区| 国产精品电影一区| 中文字幕日韩有码| 国产在线拍揄自揄拍| 午夜亚洲影院| 国产精品18久久久久白浆|