日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]中文機器閱讀系統有效

專利信息
申請號: 201310685182.6 申請日: 2013-12-13
公開(公告)號: CN103617290B 公開(公告)日: 2017-02-15
發明(設計)人: 秦謙;宋陽秋;常凱斯 申請(專利權)人: 江蘇名通信息科技有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 南京縱橫知識產權代理有限公司32224 代理人: 董建林
地址: 212000 江蘇省鎮江市*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 中文 機器 閱讀 系統
【說明書】:

技術領域

發明涉及中文閱讀技術領域,特別涉及一種中文閱讀系統。

背景技術

隨著大數據時代的到來,越來越多的數據以文本的形式被發布到網上。如何對網絡數據進行理解成為了更加緊迫和急需解決的問題。其中一個方式就是把非結構化的文本數據組織成機器能夠識別并使用的結構化數據(如詞與詞之間的關系),為未來進行一系列的推理、識別打下基礎。結構化的數據可以用于做語義消歧,根據詞之間的關系可以推斷詞的含義。另外現有技術對文本共現頻率的統計,僅限于使用窗口進行滑動,進而統計兩個詞共同出現的頻率;或者使用語言模型統計連續出現的詞的頻率。而隨著計算能力的提高,共現可以進行歸類,語言模型也可以不局限于連續出現的詞的統計。

在文本處理領域,英文的機器閱讀已經得到了相當大的發展。例如Never?Ending?Language?Learning(NELL)系統,通過英文文本的概念和實體之間的關系,對互聯網數據進行特征提取和學習,從而得到更多的概念和實體。又比如Textrunner(Reverb)系統,通過使用一系列正則表達式和簡單的機器學習方法,來實現開放式的語言抽取。

目前已有一些中文的知識庫(如zhishi.me),通過對中文百科數據進行實體和關系的抽取所構建的,對百科數據的抽取可以通過標題、超鏈接的文本等信息進行提取,然后通過鏈接和Infobox中的屬性關系來構建關系鏈接。但是,,語言本身是多樣的,關鍵詞并不應局限于實體(如人名、地名等),關系也不應局限在百科中已有的關系(如屬性),還應該包含更多種(同一種關系,可以有不同的說法;同一個關系,可以有不同的關系對象)情況。

發明內容

本發明克服了現有技術的不足,提供一種能夠在中文文本中進行閱讀的中文機器閱讀系統。

為解決上述技術問題,本發明采用的技術方案為:

中文機器閱讀系統,包括數據抓取模塊、數據處理模塊、數據抽取模塊、知識庫、數據整合模塊和使用接口,數據抓取模塊、數據處理模塊、數據抽取模塊和知識庫依次連接,數據整合模塊和使用接口與知識庫連接。

數據抓取模塊用于抓取互聯網上文本的非結構化數據。數據抓取模塊使用URL種子,通過graph?propagation的方式傳播抓取網頁,對于抓取下來的網頁,分析HTML的結構化數據,抽取非結構化的文本信息,使用Hadoop框架,利用多臺數據大量URL數據進行抓取非結構化文本信息,使用Lucene和Neo4J兩種存儲框架,Lucene對非結構化網頁進行處理和檢索,Neo4J存儲URL的圖結構。

數據處理模塊把數據進行標準化處理,具體包括以下步驟:1)中文分詞:使用分詞器對中文進行分詞處理,經過分詞的文章和句子存儲到Lucene數據庫;2)詞性標注:對于中文分詞的結果進行詞性標注,并將詞性標注的結構存儲到Lucene數據庫;3)標準化處理:特征抽取中文單詞,特征為根據中文單詞曾經出現的頻率加權,并進行全局上的歸一化。

知識庫用于存儲的知識集群。

使用接口提供調用數據的接口。

數據抽取模塊通過機器學習和模塊匹配的方法,得到計算機能夠處理的知識。數據抽取模塊包括wiki內容抽取模塊、模板抽取模塊、實體抽取模塊、關系抽取模塊和模板匹配模塊。數據抽取模塊中數據的流向具體包括:數據通過wiki內容抽取模塊提取為實體列表和三元組,實體列表和三元組通過實體抽取模塊、關系抽取模塊抽取為實體和關系后,在模板抽取模塊初始化模板,并通過模板匹配模塊匹配模板,經過匹配后的關系,流向關系抽取模塊,判斷是否被列為知識庫中的內容。

wiki內容抽取模塊提取wiki的內容進行抽取;先提取wiki的標題、超鏈接中的實體,然后對infobox中的屬性關系進行提取,得到實體列表和由實體、關系、鍵值組成的三元組兩種形式的知識。

模板抽取模塊根據wiki中得到的內容初始化模板,對三元組信息歸納總結,使用頻率最高的限定數量的關系作為初始化模板。

實體抽取模塊、關系抽取模塊對已有的實體和關系進行學習;首先,使用詞典和匹配技術,找到相應的實體和關系,其中關系可以是實體的屬性也可以是某種聯系;其次,使用序列標簽技術,例如,條件隨機場CRF、最大熵方法,對已有的實體和關系所在的例句進行訓練,標注新的數據。

模板匹配模塊根據模板抽取模塊獲得的模板,使用正則表達式進行匹配,得到備選的新知識,使用特征提取的方法把相應的關系表示成機器可以擴展識別的特征,對特征使用支持向量機方法和樸素貝葉斯方法等機器學習的方法,判斷一條知識是否被列為知識庫中的內容。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇名通信息科技有限公司,未經江蘇名通信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310685182.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩精品999| bbbbb女女女女女bbbbb国产 | 午夜精品影视| 一本大道久久a久久精品| 激情久久综合网| 国产日韩欧美三级| 91中文字幕一区| 日韩电影在线一区二区三区| 日本福利一区二区| 91片在线观看| 国产足控福利视频一区| 亚洲欧美国产精品久久| 麻豆国产一区二区| 色天天综合久久久久综合片| 91高清一区| 亚洲欧美色一区二区三区| 精品无码久久久久国产| 狠狠躁天天躁又黄又爽| 亚洲va国产2019| 国产一区中文字幕在线观看| 欧洲在线一区二区| 九九久久国产精品| 久久久国产精品一区| 999亚洲国产精| 国产精品日韩一区二区| 亚洲精品少妇一区二区 | 亚洲1区在线观看| 国产精品综合在线观看| 少妇高潮一区二区三区99小说| 国产男女乱淫视频高清免费| 日本精品一区二区三区在线观看视频| 欧美一区二区三区久久久| 国产在线拍偷自揄拍视频| 国产一区在线视频观看| 亚洲精品www久久久久久广东| 亚洲乱亚洲乱妇50p| 日韩欧美一区二区久久婷婷| 国产免费区| 久久狠狠高潮亚洲精品| 亚洲欧美国产中文字幕| 亚洲国产精品91| 少妇又紧又色又爽又刺激视频网站| 国产一区二区91| 国产一区二区三区精品在线| 精品国产乱码久久久久久久久| 国产在线观看免费麻豆| 日韩国产欧美中文字幕| 国产亚洲精品久久久久秋霞| 久久99精品国产麻豆宅宅| 国内少妇自拍视频一区| 午夜黄色网址| 午夜看片在线| 欧美一级久久久| 亚洲精品少妇一区二区| 538国产精品一区二区在线| 韩国女主播一区二区| 91精品久久久久久久久久| 精品久久二区| 狠狠色噜噜狠狠狠狠视频| 日韩精品久久一区二区| 国产精品高潮呻| 中文字幕在线一二三区| 欧美日韩久久一区| 国产偷久久一区精品69| 国产精品视频二区三区| 日本99精品| 久久免费精品国产| 综合久久一区| www.午夜av| 欧美日韩激情一区二区| 亚洲国产精品精品| 狠狠色丁香久久婷婷综合_中| 国产一区二区精华| 欧美久久精品一级c片| 免费看大黄毛片全集免费| 999久久久国产精品| 海量av在线| ass韩国白嫩pics| 亚洲乱在线| 日韩无遮挡免费视频| 国产亚洲精品久久久456| 亚洲欧美国产日韩综合| 夜夜躁日日躁狠狠久久av| 日韩a一级欧美一级在线播放| 欧美精品一区二区性色| 久久国产精品精品国产| 国产一区精品在线观看| 一区二区免费在线观看| 国产色一区二区| 日韩av在线网址| 国产亚洲精品久久19p| 国产精品久久久久免费a∨大胸| 国产精品视频十区| 久久久精品免费看| 欧美乱妇高清无乱码| 99视频国产在线| 久久久国产精品一区| 欧美日韩久久精品| 99国产精品9| 国产精品一区二区久久乐夜夜嗨 | 欧美精品免费一区二区| 国产无套精品久久久久久| 国产又黄又硬又湿又黄| 亚洲精品国产setv| 久久精品综合| 国产视频一区二区在线| 九九视频69精品视频秋欲浓| 亚洲一区2区三区| 丰满少妇高潮惨叫久久久| 国产精品影音先锋| 国产一区二区三区小说| 精品国产九九| 国产色婷婷精品综合在线手机播放| 亚洲乱小说| **毛片在线免费观看| 国产一区二区三区在线电影| 久久精品国产色蜜蜜麻豆| 中文字幕在线播放一区| 国产偷国产偷亚洲清高| 91制服诱惑| 国产一级片大全| 一区二区三区欧美精品| 91精品美女| 男女视频一区二区三区| 国产一级在线免费观看| 国产欧美一区二区三区不卡高清| 99精品一级欧美片免费播放| 在线亚洲精品| 激情久久综合| 美女张开腿黄网站免费| 香蕉视频一区二区三区| 欧美日韩精品中文字幕| 国产精品久久久区三区天天噜| 丰满岳妇伦4在线观看| 午夜一区二区视频| 国产日韩一区二区在线| 国产二区不卡| 精品午夜电影| 欧美精品免费一区二区| 精品无人国产偷自产在线| 欧美精品在线不卡| 一区二区欧美视频| 国产目拍亚洲精品区一区| 特级免费黄色片| 久久福利免费视频| 国产极品一区二区三区| 在线国产精品一区二区| 午夜无人区免费网站| 亚洲国产偷| 精品国产一区二区三区免费| 亚洲精品久久在线| 三上悠亚亚洲精品一区二区| 国产乱码精品一区二区三区介绍| 精品国产精品亚洲一本大道| 夜夜躁日日躁狠狠久久av| 国产69精品久久99不卡免费版| 国产一区二区三区久久久| 羞羞视频网站免费| 久久夜色精品国产亚洲| 日韩精品一区中文字幕| 躁躁躁日日躁网站| 国产精品1区2区| 激情久久久| 综合色婷婷一区二区亚洲欧美国产 | 偷拍精品一区二区三区| 午夜精品999| 国产99网站| 国产精品久久久久久久综合| 激情久久精品| 91久久国产露脸精品国产| 中文字幕在线视频一区二区| 91久久香蕉国产日韩欧美9色| 精品久久小视频| 福利片91| 91国偷自产中文字幕婷婷| 一区二区欧美在线| 欧美中文字幕一区二区| 国产影院一区二区| 国产高清一区在线观看| 日韩精品免费一区二区中文字幕 | 欧美精品一区二区久久久| 91看片免费| 中文字幕一区二区三区免费视频| 91一区二区三区在线| 久久综合伊人77777麻豆| 欧美精品免费一区二区 | 欧洲精品一区二区三区久久| 蜜臀久久99精品久久久久久网站| 真实的国产乱xxxx在线91| 欧美一区视频观看| 国产黄一区二区毛片免下载| 91性高湖久久久久久久久_久久99| 青苹果av| 国产中文字幕一区二区三区| 93精品国产乱码久久久| 躁躁躁日日躁网站| 91精品系列| 国产品久精国精产拍| 亚洲欧洲一区二区| 欧美hdxxxx| 久久精品欧美一区二区| 国产aⅴ精品久久久久久| 欧洲激情一区二区| 精品国产免费久久| 狠狠插影院| 国产精品伦一区二区三区级视频频| 日韩精品在线一区二区三区| 日韩av不卡一区二区| 国产乱了高清露脸对白| 精品国产乱码久久久久久久| 国产精品一区二区av麻豆| 精品国产一区二| 国产精品日韩一区二区三区| 久久九九国产精品| 国产91高清| 国产精品免费不卡| 国产日韩欧美精品| 欧洲在线一区| 日韩中文字幕在线一区| 丰满少妇高潮惨叫久久久一| 国产区二区| 亚洲欧美一区二区精品久久久| 日本精品一区在线| 国产精品一区二区在线观看| 欧美一级久久久| 国产午夜精品一区| 夜夜爽av福利精品导航| 电影午夜精品一区二区三区| 乱淫免费视频| 日韩精品久久一区二区三区| xxxx在线视频| 国产日韩欧美不卡| 日韩欧美中文字幕精品| 午夜影院你懂的| 午夜a电影| 欧美日韩一区二区三区不卡视频| 一区精品二区国产| 精品国产一二区| 岛国精品一区二区| 强制中出し~大桥未久4| 日韩av在线一区| 亚洲在线久久| 国产欧美一区二区三区在线| 日韩精品福利片午夜免费观看| 亚洲欧美日本一区二区三区 | 色婷婷久久一区二区三区麻豆|