日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于事故災(zāi)害新聞的信息結(jié)構(gòu)化方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 202011116412.3 申請(qǐng)日: 2020-10-19
公開(公告)號(hào): CN112269949B 公開(公告)日: 2023-09-22
發(fā)明(設(shè)計(jì))人: 俞一奇;邱彥林;陳尚武 申請(qǐng)(專利權(quán))人: 杭州敘簡(jiǎn)科技股份有限公司
主分類號(hào): G06F16/9537 分類號(hào): G06F16/9537;G06F16/951;G06F16/335;G06F16/31;G06F40/151;G06F40/289;G06F18/214;G06N3/08;G06N3/0442
代理公司: 杭州易中元兆專利代理有限公司 33341 代理人: 葉衛(wèi)強(qiáng)
地址: 310023 浙江省杭州市五常*** 國省代碼: 浙江;33
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 事故 災(zāi)害 新聞 信息 結(jié)構(gòu) 方法
【權(quán)利要求書】:

1.一種基于事故災(zāi)害新聞的信息結(jié)構(gòu)化方法,其特征在于:包括以下步驟:S1:利用網(wǎng)絡(luò)爬蟲,對(duì)事先設(shè)定好的各大門戶網(wǎng)站爬取新聞數(shù)據(jù)作為初始語料庫;

S2:利用深度學(xué)習(xí)方法構(gòu)建事故災(zāi)害抽取模型,并用S1獲取的新聞數(shù)據(jù)樣本訓(xùn)練模型;

S3:將抽取模型部署到分析系統(tǒng)中,對(duì)實(shí)時(shí)獲取的每一條新聞抽取其事故類型和事故要素,并采用匹配、查找的算法將事故要素轉(zhuǎn)化成標(biāo)準(zhǔn)格式后存入到數(shù)據(jù)庫中;

所述S2包括以下步驟:S21:標(biāo)注樣本:通過BIO標(biāo)注方式,對(duì)采集到的新聞數(shù)據(jù)標(biāo)注其中的事故類型和事故要素,事故類型包括?;?、礦山、交通、建筑施工、火災(zāi)、工商貿(mào),事故要素包括發(fā)生時(shí)間、發(fā)生地點(diǎn)、受傷人數(shù)、死亡人數(shù)、經(jīng)濟(jì)損失;

S22:劃分?jǐn)?shù)據(jù)集:將標(biāo)注完的新聞數(shù)據(jù)隨機(jī)劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,其中測(cè)試數(shù)據(jù)集占20%;

S23:構(gòu)建模型:采用ALBERT、Bi-LSTM和CRF組合的方式實(shí)現(xiàn);ALBERT的輸入為新聞句子的字符,這些字符包括中文字符、英文單詞、數(shù)字和標(biāo)點(diǎn)符號(hào),內(nèi)容長度不超過512,記為n;

輸出為每一個(gè)字符經(jīng)計(jì)算得到的向量,向量維度大小為128,因此最終輸出為n×128(x1,x2,…,xn);將每一個(gè)字符對(duì)應(yīng)的向量xi,依次作為Bi-LSTM的輸入,經(jīng)過循環(huán)計(jì)算,得到每一個(gè)LSTM單元的輸出向量yi,yi的維度大小為23,yi的含義為23種標(biāo)簽對(duì)應(yīng)的概率值,Bi-LSTM的最終輸出為n×23(y1,y2,…,yn);將每一個(gè)單元輸出的概率值通過CRF層得到最終結(jié)果路徑;

S24:將訓(xùn)練數(shù)據(jù)集作為模型的輸入,根據(jù)損失函數(shù)計(jì)算loss值,反向傳播訓(xùn)練模型,訓(xùn)練過程中,使用測(cè)試數(shù)據(jù)集對(duì)模型進(jìn)行測(cè)試,將模型預(yù)測(cè)的結(jié)果與人工標(biāo)注的結(jié)果進(jìn)行比較,計(jì)算準(zhǔn)確率,若準(zhǔn)確率超過95%或迭代次數(shù)大于預(yù)設(shè)最大次數(shù),則完成了整個(gè)訓(xùn)練過程,若準(zhǔn)確率沒有達(dá)到要求,則返回繼續(xù)迭代訓(xùn)練;

所述S3包括以下步驟:

S31:通過網(wǎng)絡(luò)爬蟲爬取預(yù)先設(shè)定的新聞源網(wǎng)站,利用HTML標(biāo)簽提取新聞的正文,并且過濾掉圖片、外部鏈無關(guān)的內(nèi)容;

S32:對(duì)提取到的新聞?wù)膬?nèi)容進(jìn)行預(yù)處理,包括:去除內(nèi)容中的字符亂碼;當(dāng)新聞內(nèi)容包含大量圖片且新聞內(nèi)容字?jǐn)?shù)少于50字符時(shí),則舍棄該條新聞,返回步驟S31;

S33:取新聞內(nèi)容的前3句話作為摘要,輸入到事故災(zāi)害抽取模型中,輸出預(yù)測(cè)概率最大的標(biāo)簽路徑;

S34:解析標(biāo)簽路徑,判斷其中是否含有事故類型標(biāo)簽,若有則同時(shí)將提取到的事故要素和事故類型一起保存;若沒有,說明該條新聞不是事故災(zāi)害新聞,則舍棄該條新聞并返回步驟S31;

S35:對(duì)抽取到的時(shí)間要素進(jìn)行格式轉(zhuǎn)換,將新聞涉及到的“月”、“日”、“時(shí)”、“點(diǎn)”、“分”;或者“今天”、“昨天”、“上午”、“下午”、“凌晨”;又或者是前兩種的組合,通過使用正則表達(dá)式,將事故發(fā)生時(shí)間轉(zhuǎn)換為YYYY-MM-dd的格式;

S36:對(duì)抽取到的地點(diǎn)要素進(jìn)行格式轉(zhuǎn)換;首先根據(jù)中國地名庫建立各省市區(qū)的詳細(xì)地名表并采用樹型結(jié)構(gòu)存儲(chǔ);對(duì)抽取到的地點(diǎn)要素進(jìn)行結(jié)巴分詞,并根據(jù)結(jié)巴的詞性標(biāo)注功能過濾出地點(diǎn)名詞,再與已建立的地名表進(jìn)行查找匹配,將事故發(fā)生地點(diǎn)轉(zhuǎn)化為“××省××市××區(qū)”的格式;

S37:將抽取到的受傷人數(shù)、死亡人數(shù)、經(jīng)濟(jì)損失轉(zhuǎn)成阿拉伯?dāng)?shù)字格式;若提取到的數(shù)字為中文格式,則使用正則表達(dá)式進(jìn)行匹配,并轉(zhuǎn)成阿拉伯?dāng)?shù)字格式;

S38:將標(biāo)準(zhǔn)化后的發(fā)生時(shí)間、發(fā)生地點(diǎn)、受傷人數(shù)、死亡人數(shù)、經(jīng)濟(jì)損失和事故類型存入數(shù)據(jù)庫,然后返回S31循環(huán)。

2.根據(jù)權(quán)利要求1所述的一種基于事故災(zāi)害新聞的信息結(jié)構(gòu)化方法,其特征在于:所述CRF層能加入一些約束來保證最終預(yù)測(cè)結(jié)果是有效的,這些約束能在訓(xùn)練數(shù)據(jù)時(shí)被CRF層自動(dòng)學(xué)習(xí)得到,CRF通過計(jì)算所有路徑的得分進(jìn)行訓(xùn)練和預(yù)測(cè),設(shè)每種路徑的分?jǐn)?shù)為Pi,共有N條路徑,則路徑的總分是:

其中,表示第i個(gè)LSTM單元輸出的對(duì)應(yīng)標(biāo)簽的概率值;表示第i個(gè)標(biāo)簽到第i+1個(gè)標(biāo)簽的跳轉(zhuǎn)概率,此跳轉(zhuǎn)概率屬于CRF層的參數(shù),在訓(xùn)練時(shí)會(huì)自動(dòng)學(xué)習(xí);

訓(xùn)練時(shí),損失函數(shù)定義如下,其中PRealPath代表真實(shí)路徑得分

實(shí)際預(yù)測(cè)時(shí),取得分最高的路徑作為最終結(jié)果,即Ppredict=max(P1+P2+…+PN)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州敘簡(jiǎn)科技股份有限公司,未經(jīng)杭州敘簡(jiǎn)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011116412.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 久热精品视频在线| 国产一区二区日韩| 高清国产一区二区三区| 欧美日韩一区二区三区69堂| 国产精品久久久久久久久久嫩草| 91看片app| 国产精品一卡二卡在线观看| 国内少妇自拍视频一区| 狠狠色噜噜综合社区| 国产精品欧美久久久久一区二区| 欧美性猛交xxxxxⅹxx88| 年轻bbwwbbww高潮| 欧美一级免费在线视频| 97久久精品人人做人人爽| 国内精品久久久久影院日本| 欧美精品日韩一区| 国产欧美日韩精品一区二区三区 | 国产不卡网站| 欧美日韩精品在线一区二区| 国产精品日韩精品欧美精品| 欧美日韩国产区| 久久精品一区二区三区电影| 91免费看国产| 一区二区三区国产精品视频| 国产69精品久久99的直播节目| 亚洲三区二区一区| 中文在线√天堂| 高清国产一区二区| 国产亚洲精品久久久久久网站 | 日韩欧美一区二区在线视频| 最新国产一区二区| 日本少妇一区二区三区| 久99精品| 国产aⅴ一区二区| 亚洲欧美日韩综合在线| 夜夜躁日日躁狠狠躁| 国产精品九九九九九九| 欧美精品日韩精品| 99精品欧美一区二区三区美图| 色噜噜狠狠色综合影视| 国产综合久久精品| 欧美激情精品久久久久久免费| 亚洲欧美制服丝腿| 欧美一级片一区| 久久免费视频一区| 亚洲精品色婷婷| 窝窝午夜理伦免费影院| 美女脱免费看直播| 精品国产一区二区三区忘忧草| 欧美日韩国产精品一区二区| 日韩夜精品精品免费观看| 国产欧美一区二区精品婷| 偷拍区另类欧美激情日韩91| 国产午夜精品一区二区理论影院| 国产精品久久久久久久新郎| 国产乱xxxxx国语对白| 欧美性受xxxx狂喷水| 国产日韩欧美色图| 91精品婷婷国产综合久久竹菊| 日韩av在线中文| 91精品国产综合久久国产大片 | 免费观看黄色毛片| 日韩av在线资源| 亚洲视频精品一区| 精品一区二区三区影院| free性欧美hd另类丰满| 三级视频一区| 99久久精品免费看国产交换| 午夜天堂电影| 国产区91| 91精品丝袜国产高跟在线| 欧美在线视频三区| 在线精品视频一区| 中文字幕在线一区二区三区| 亚洲精品www久久久| 狠狠综合久久av一区二区老牛| 一区二区三区中文字幕| 国产中文字幕91| 国产三级国产精品国产专区50| 日本伦精品一区二区三区免费| 999国产精品999久久久久久| 国产精品久久久久久久久久不蜜月| 亚洲无人区码一码二码三码 | 国产精品日韩三级| 黄毛片在线观看| 日本边做饭边被躁bd在线看| 亚洲一二三四区| 日本三级韩国三级国产三级| 亚洲欧美日韩在线看| 96国产精品视频| av中文字幕一区二区| 狠狠色噜噜狠狠狠狠2021天天| 日韩av中文字幕一区二区| 99久国产| 黄毛片在线观看| 欧美性猛交xxxxxⅹxx88| 欧美日本一二三区| 99精品国产99久久久久久97| 一区二区三区四区视频在线| 一色桃子av大全在线播放| 欧美在线播放一区| 久久99亚洲精品久久99| 国产呻吟久久久久久久92| bbbbb女女女女女bbbbb国产| 国产91免费观看| 最新国产精品自拍| 欧美67sexhd| 国产欧美精品va在线观看| 搡少妇在线视频中文字幕| 玖玖爱国产精品| 国产精品伦一区二区三区级视频频 | 国产一区二区在线免费| 欧美日韩一区视频| 久久人做人爽一区二区三区小说| 91精品久久久久久久久久| 欧美性受xxxx狂喷水| 欧美高清xxxxx| 在线观看欧美日韩国产| 国产黄色一区二区三区| 一区二区三区欧美视频| 国产在线一二区| 久久一区二| 国产一区不卡视频| 日本激情视频一区二区三区| 国产91九色在线播放| 国产麻豆一区二区三区在线观看| 亚洲国产日韩综合久久精品| 国产午夜亚洲精品| 久久久久国产精品免费免费搜索| 国产日韩欧美精品一区二区| 欧美高清极品videossex| 91视频一区二区三区| 午夜一区二区视频| 国产精品午夜一区二区| 国产一区日韩欧美| 国产69精品久久久久男男系列| 久久两性视频| 亚洲欧美日韩三区| 夜夜躁狠狠躁日日躁2024| 91丝袜国产在线观看| 日韩国产精品久久久久久亚洲| 国产jizz18女人高潮| 蜜臀久久精品久久久用户群体| 欧美在线视频精品| 野花国产精品入口| 欧美一区二区激情三区| 欧美大片一区二区三区| 日韩精品中文字幕一区二区| 久久第一区| 亚洲精品456| 午夜爽爽爽男女免费观看| 欧美777精品久久久久网| 国产精品高潮呻吟88av| 精品国产鲁一鲁一区二区三区| 久久精品com| 真实的国产乱xxxx在线91| 国产91一区| 亚日韩精品| 欧美在线视频二区| 亚洲精品国产91| 日本三级韩国三级国产三级| 夜夜嗨av色一区二区不卡| 欧美日韩一区二区三区四区五区六区| 国产二区视频在线播放| 色噜噜狠狠色综合久| 日韩在线一区视频| 亚洲精品主播| 日韩夜精品精品免费观看| 国产精品日韩视频| 欧美日韩国产精品一区二区| 国产一区二区在线观| 国产精品99一区二区三区| 国产亚洲精品久久久久秋霞| 午夜av片| 欧美一区二区色| 欧美在线一级va免费观看| 手机看片国产一区| 999偷拍精品视频| 999久久久国产| 国产欧美亚洲精品第一区软件| 在线观看欧美一区二区三区| 日韩av在线导航| 国产农村妇女精品一区二区| 日韩精品久久一区二区三区| 国产伦精品一区二| 亚洲福利视频一区二区| 欧美精品八区| 久久九精品| 亚洲精品主播| 日本高清二区| 午夜影皖精品av在线播放| 国产一区二区二| 日本二区在线播放| 亚洲欧洲日韩| 国产乱xxxxx国语对白| 91看黄网站| 国产综合久久精品| 日本一区二区三区四区高清视频| 国产精品一区二区人人爽| 欧美日韩国产色综合视频| 国产aⅴ一区二区| 国产91免费在线| 日韩av电影手机在线观看| 国产乱码一区二区| 在线视频国产一区二区| 91麻豆精品国产91久久| 国产精品自拍在线| 欧美日韩国产一二三| 久久精品国产99| 日韩一级精品视频在线观看 | 国产精品亚洲一区| 奇米色欧美一区二区三区| 亚洲乱码一区二区| **毛片免费| 久久亚洲精品国产一区最新章节| 国产一区不卡视频| 久久天堂国产香蕉三区| 色就是色欧美亚洲| 乱子伦农村| 26uuu亚洲国产精品| 国产欧美日韩一区二区三区四区| 中文字幕视频一区二区| 久久99国产精品久久99| 中文字幕日韩一区二区| 欧美三级午夜理伦三级中视频 | 99久久婷婷国产亚洲终合精品| 国产欧美一区二区精品久久久| 性视频一区二区三区| 美女被羞羞网站视频软件| 国产精品美女久久久免费| 久久精品麻豆| 国产精自产拍久久久久久蜜| 国产精品高潮呻吟三区四区 | 91精品国产综合久久国产大片| 99精品国产一区二区三区麻豆| 午夜精品一区二区三区三上悠亚 | 国产91精品一区二区麻豆亚洲| 国产一区二区视频播放| 91丝袜国产在线播放| 中文字幕一区二区三区四| 91精品国产综合久久国产大片| 91高清一区| 妖精视频一区二区三区| 91麻豆精品国产91久久久资源速度| 日韩中文字幕区一区有砖一区| 久久国产精品首页|