日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種高精度漢語謂詞識別方法有效

專利信息
申請號: 201310080760.3 申請日: 2013-03-14
公開(公告)號: CN103150381A 公開(公告)日: 2013-06-12
發明(設計)人: 羅森林;白建敏;潘麗敏;韓磊;魏超 申請(專利權)人: 北京理工大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/28
代理公司: 暫無信息 代理人: 暫無信息
地址: 100081 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 高精度 漢語 謂詞 識別 方法
【權利要求書】:

1.高精度漢語謂詞識別方法,其特征在于:采用分步識別的方法,首先對待測句子進行詞法分析,得到可疑謂詞及其個數;接著利用可疑謂詞個數是否為1等判定條件進行初步謂詞識別;其次對不滿足初步識別判定條件的可疑謂詞,提取相關詞法和句法特征并利用C4.5算法訓練得到的決策樹判定模型對其進行謂詞識別;最終匯總兩步識別結果給出每個待測句子中的謂詞。本發明不僅能夠進一步提升謂詞識別準確率,還可以有效減少訓練和識別的時間開銷,并且對非動詞作謂詞的情況也能有效識別。包括如下步驟:

步驟1,對已進行詞法和句法標注的句子中的詞進行詞性分析,統計出每個句子中的可疑謂詞及其個數。由于在漢語中,具有某些詞性的詞,如介詞、助詞、代詞等,它們無法充當謂詞或者只在極少的情況下充當謂詞。因此,為了提高算法效率,并且不影響識別效果,首先對句子中的每個詞進行詞性分析,不可能作為謂詞的詞,則不對其進行特征提取及識別。僅對可能成為謂詞的詞(可疑謂詞)進行下一步處理。所述的句子在訓練過程中指的是訓練句子,在識別過程中指的是待測句子。

步驟2,在步驟1的基礎上,對標注語料進行特征提取和訓練最終得到決策樹判定模型,該步驟分為特征提取和C4.5算法訓練決策樹兩個步驟。所述的標注語料指的是具有謂詞標記的語料,具體過程如下:

步驟2.1,訓練階段的特征提取輸入的是經過詞法、句法標注的訓練句子以及步驟1得到的可疑謂詞及其個數,用人工形式總結歸納出相關的初始詞法、句法特征,再通過特征篩選實驗得到訓練句子的最終詞法、句法特征及謂詞標記。

所述的特征篩選實驗的目的是將無用的特征或作用較小的特征去除,最終選出最優的特征組合(或特征子集),特征子集選擇問題,就是找到原始特征集合的一個簡潔子集,使得機器學習算法在僅包含這個子集中特征的數據集合上運行后,產生一個盡可能高精確度的分類器。因此,特征子集選擇的關鍵是找到一個簡潔且優良的特征子集。具體步驟如下:

步驟2.1.1,去除單個特征,記錄識別結果,并按照識別效果從高到低排序。

步驟2.1.2,識別效果越好說明去除的特征對于特征組合的貢獻越小,所以按照步2.1.1的排序結果,根據識別效果從高到低依次去除特征,利用剩下特征進行測試。

步驟2.2,C4.5算法訓練決策樹過程是將步驟2.1得到的詞法、句法特征以及謂詞標記,輸入到C4.5算法進行訓練,最終得到謂詞決策樹判定模型。

步驟2.2.1,所述的C4.5算法是一種重要的機器學習算法,是ID3算法的一種改進算法,其優點是:產生的分類規則易于理解,準確率較高。缺點是:在構造樹的過程中,需要對數據集進行多次的順序掃描和排序,因而導致算法的低效。具體的算法流程如下:1.創建節點N,如果訓練集為空,在返回節點N標記為失敗,如果訓練集中的所有記錄都屬于同一個類別,則以該類別標記節點N;2.如果候選屬性為空,則返回N作為葉節點,標記為訓練集中最普通的類;3.對每一個候選屬性如果是聯系的就對該屬性進行離散化;4.選擇候選屬性中具有最高信息增益的屬性D,標記節點N為屬性D,對每一個屬性D的一致值d,由節點N長出一個條件為D=d的分支;5.設s是訓練集中D=d的訓練樣本的集合,如果s為空,則加上一個樹葉,標記為訓練集中最普通的類,否則加上一個有C4.5(R-{D},C,s)返回的點。

步驟2.2.2,本發明采用的是C4.5算法訓練決策樹,需要針對C4.5算法進行參數選取。對于C4.5算法,需要調整的參數主要有裁剪比例confidenceFactor和最小分支支撐事例數minNumObj。參數選擇實驗具體方法是:將裁剪比例和最小分支支撐事例數分別按一定大小步長取值,根據相應的取值得到謂詞識別準確率、召回率和F值,最好的識別結果所對應的參數即為最終的參數。

步驟3,訓練過程結束后是識別過程,包括初步識別、特征提取和謂詞判定三個步驟,具體步驟為:

步驟3.1,初步識別過程輸入的是步驟1得到的可疑謂詞及其個數以及經過詞法、句法標注的待測句子,利用相關的判定條件對可疑謂詞進行初步識別,符合判定條件的直接給出識別結果,不符合判定條件的則進行下一步特征提取操作。該步驟使用了基于規則的方法進行謂詞的初步識別。

所述的判定條件是:

(1)可疑謂詞的個數如果為1,則該可疑謂詞為謂詞。該判定條件基于一個約定:任何完整的句子必定含有至少一個謂詞。

(2)可疑謂詞為動詞“是”且處于“是……的”結構中,則判斷該可疑謂詞為非謂詞。

(3)可疑謂詞為“掉、完、完畢”且緊跟在一個動詞之后,則判斷其為非謂詞。

(4)可疑謂詞為“來說、說、來講、講、而言”且處在介詞“對”“就”“從”之后構成介詞性短語,則判斷其為非謂詞。

步驟3.2,識別過程的特征提取輸入的是經過詞法和句法標注的待測句子以及不符合初步識別判定條件的句子,輸出的是相應可疑謂詞的詞法、句法特征。

步驟3.3,謂詞判定過程輸入的是特征提取步驟3.2得到的特征和步驟2.2得到的決策樹判定模型,輸出的是可疑謂詞的判定結果,即是否為謂詞。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310080760.3/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美黑人巨大久久久精品一区| 国产午夜三级一二三区| 国产午夜精品一区二区三区欧美| 日韩一级片在线免费观看| 最新日韩一区| 天天干狠狠插| 浪潮av网站| 国产亚洲久久| 色狠狠色狠狠综合| 欧美日韩久久一区| 久久国产欧美一区二区免费| 国产69精品久久久久777| 狠狠色丁香久久综合频道| 国产高清一区在线观看| 国产午夜伦理片| 欧美一区视频观看| 国产午夜精品一区理论片飘花| 一区二区中文字幕在线观看| 在线国产一区二区三区| 午夜爽爽爽男女免费观看| 亚洲五码在线| 中文字幕一区二区三区免费| 国产一区免费在线| 在线观看欧美日韩国产| 欧美精品中文字幕亚洲专区| 国产91在| 国产另类一区| 亚洲欧美国产一区二区三区 | 国产一区二区二| 中文字幕制服狠久久日韩二区| 国产大学生呻吟对白精彩在线| 国产精品美女久久久免费| 国产精品久久99| 国产乱对白刺激在线视频| 久久国产精品99国产精| 精品国产一区二区三区久久久久久| 欧美精品中文字幕亚洲专区| 强制中出し~大桥未久在线播放| 精品91av| 996久久国产精品线观看| 亚洲精品卡一卡二| 欧美日韩国产一级| 91精品色| 亚洲久久在线| 国产激情二区| 欧美精品国产一区| 国产欧美日韩一区二区三区四区| 国产麻豆91视频| 国产在线视频99| 狠狠色噜噜狼狼狼色综合久| 国产精品一区在线观看| 99欧美精品| 久久福利免费视频| 久久婷婷国产香蕉| 国产精品久久久视频| 欧美精品一区二区久久久| 在线国产二区| 欧美精品中文字幕亚洲专区| 国产视频一区二区视频| 欧美久久一区二区三区| 亚洲精品少妇一区二区 | 色综合久久网| 最新国产一区二区| 日韩精品福利片午夜免费观看| 国产特级淫片免费看| 午夜毛片在线看| 亚洲四区在线| 亚洲国产欧美一区| 欧美性二区| 三上悠亚亚洲精品一区二区| 精品久久一区| 日韩一区二区精品| 久久久久国产亚洲| 国产婷婷一区二区三区久久| 久久久久国产精品www| 国产精品免费观看国产网曝瓜| 欧美精品xxxxx| 欧美一区二区三区免费观看视频| 午夜av片| 在线视频不卡一区| 日本一区二区在线观看视频| 久久99亚洲精品久久99果| 黄毛片在线观看| 国产精品久久久麻豆| 国产一区二区四区| 国产一区二区91| 久久免费精品国产| 精品国产仑片一区二区三区| 在线播放国产一区| 久久99国产综合精品| 国产精品乱战久久久| 亚洲一卡二卡在线| 欧美日本91精品久久久久| 国产精品中文字幕一区| 亚洲精品丝袜| 国产一区二区精华| 久久精品99国产国产| 四虎国产精品永久在线国在线 | 亚洲精品久久久中文| 国产69精品久久99的直播节目 | 日本一区二区三区中文字幕 | 国产欧美久久一区二区三区| 国产精品国外精品| 99久久免费精品国产男女性高好| 国产精品高清一区| 丝袜美腿诱惑一区二区| 狠狠躁夜夜躁| 国精偷拍一区二区三区| 欧美一区二区精品久久911| 国产偷久久一区精品69| 99精品国产免费久久| 久久免费福利视频| 国产一区二区在线91| 国产伦高清一区二区三区| 国产日韩精品一区二区| 国产99小视频| 综合欧美一区二区三区| 国产日韩欧美三级| 亚洲乱码一区二区三区三上悠亚 | 国内视频一区二区三区| 精品久久久综合| 国产免费一区二区三区四区| 香蕉免费一区二区三区在线观看| 国产一级二级在线| 亚洲欧美国产精品久久| 精品国精品国产自在久不卡| 四季av中文字幕一区| 99久久久国产精品免费调教网站| 狠狠色狠狠色综合日日2019| 免费观看xxxx9999片| 狠狠色噜噜狠狠狠狠2021天天| 色综合久久精品| 国产一区二区三区乱码| 久久99精| 国产美女视频一区二区三区| 久久国产欧美一区二区三区免费| 亚州精品国产| 欧美日韩亚洲另类| 日韩一级片免费视频| 欧美老肥婆性猛交视频| 一级午夜电影| 国产一区在线精品| 国产麻豆91欧美一区二区| 天堂av一区二区三区| 亚洲精品性| 国产精品欧美一区乱破 | 午夜激情看片| 国语对白老女人一级hd| 国产不卡一二三区| 欧美在线视频二区| 狠狠插狠狠爱| 欧美一区二区三区免费电影| 国产主播啪啪| 91免费国产视频| 久久精品视频中文字幕| 日本高清不卡二区| 91精品www| 国产清纯白嫩初高生在线播放性色| 日韩一区二区中文字幕| 欧美一级久久精品| 999久久久国产| 99爱精品在线| 91狠狠操| 欧美精品久| 欧美日韩国产一二| 日韩av三区| 国产91九色视频| 午夜影院试看五分钟| 一色桃子av| 欧美精品在线不卡| 日本一区二区三区电影免费观看| 69xx国产| 国产一区二三| 国产一区二区在线免费| 欧美日韩精品在线播放| 国产乱色国产精品播放视频| 激情久久久| 国产一级二级在线| 国产精品99一区二区三区| 亚洲福利视频一区| 日韩精品中文字幕久久臀| 国产乱码精品一区二区三区中文| 欧美一区免费| 国产欧美亚洲精品| 精品久久二区| 欧美日韩精品在线播放| 欧美在线播放一区| 欧美日韩一区二区高清| 国产精品久久久久久久久久嫩草| 视频一区欧美| 日韩国产精品一区二区| 亚洲精品日本久久一区二区三区 | 天堂av一区二区三区| 国产69精品久久777的优势| 欧美日韩一区二区三区免费| 国产精品一区在线播放| 日本一区二区三区四区高清视频| 国产91丝袜在线熟| 亚洲欧美另类综合| 狠狠色丁香久久婷婷综| 国产视频一区二区视频| 538国产精品| 国产一级不卡毛片| 久久精品国产精品亚洲红杏| 日韩中文字幕在线一区| 欧美一级免费在线视频| 91亚洲欧美日韩精品久久奇米色| 99精品国产99久久久久久97| 久久免费视频一区二区| 久久夜靖品2区| 99爱精品视频| 91视频国产一区| 日韩精品一区二区三区免费观看视频| 国内自拍偷拍一区| 欧美日韩精品影院| 国产人澡人澡澡澡人碰视| 色噜噜狠狠色综合中文字幕 | 高清国产一区二区三区| 九一国产精品| 色噜噜狠狠狠狠色综合久| 91国偷自产中文字幕婷婷| 欧美性猛交xxxxxⅹxx88| 91精品国产高清一二三四区| 国产乱码精品一区二区三区中文| 欧美精品二区三区| 国产一卡在线| 国产精品久久久久久久龚玥菲| 97久久精品人人澡人人爽| 日韩av不卡一区二区| 国产精品一区二区毛茸茸| 亚洲精品无吗| 中文丰满岳乱妇在线观看| 国产欧美精品一区二区三区小说| 国产午夜精品一区二区三区最新电影 | 欧洲国产一区| 久久精品爱爱视频| 国产第一区二区| 一区二区在线精品| 精品少妇一区二区三区免费观看焕 | 99久久婷婷国产综合精品电影 | 国产99久久久精品视频| 国产色一区二区| 美女张开腿黄网站免费| 欧美精品久久一区二区| 欧美日韩一区二区电影| 国产一区二区三区中文字幕|