日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于音節(jié)切分和詞切分聯(lián)合學習的多任務泰語分詞方法有效

專利信息
申請?zhí)枺?/td> 202110079486.2 申請日: 2021-01-21
公開(公告)號: CN112883726B 公開(公告)日: 2021-12-28
發(fā)明(設計)人: 線巖團;王悅寒;余正濤;相艷;毛存禮 申請(專利權)人: 昆明理工大學
主分類號: G06F40/289 分類號: G06F40/289;G06F40/129;G06F16/35;G06N3/08
代理公司: 昆明人從眾知識產(chǎn)權代理有限公司 53204 代理人: 何嬌
地址: 650093 云*** 國省代碼: 云南;53
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 音節(jié) 切分 聯(lián)合 學習 任務 泰語 分詞 方法
【說明書】:

發(fā)明涉及基于音節(jié)切分和詞切分聯(lián)合學習的多任務泰語分詞方法。本發(fā)明包括:預處理泰語文本數(shù)據(jù)集;使用窗口化的方式選擇泰語字符特征和字符類別特征作為特征輸入;之后利用注意力機制獲得豐富的上下文特征;最后輸出層使用線性變換和Sigmoid函數(shù)去預測當前序列中的音節(jié)序列標簽和詞序列標簽。本發(fā)明采用多任務學習的方式,它能夠同時學習同一個句子在音節(jié)切分和詞切分的序列標簽,用音節(jié)切分輔助詞切分,以提高模型泛化能力。本發(fā)明在InterTEST2010數(shù)據(jù)集上有更高的準確性,與DeepCut泰語分詞模型相比,系統(tǒng)運行速度至少提高了1.6倍,為后續(xù)的文本分類、信息檢索和機器翻譯提供了支撐。

技術領域

本發(fā)明涉及基于音節(jié)切分和詞切分聯(lián)合學習的多任務泰語分詞方法,屬于自然語言處理領域。

背景技術

在自然語言處理中,泰語分詞是文本分類、信息檢索和機器翻譯等下游任務的基礎。主流的泰語分詞方法將泰語分詞視為基于字符的序列標注問題,其中為每個字符分配一個標簽以表示其邊界信息。

盡管已有的泰語分詞模型取得了很好的進展,但它們考慮的字符信息少,分詞準確率低等問題。Kittinaradorn等人針對以上問題提出了一種基于CNN的分詞模型-DeepCut,該模型利用字符和字符類別嵌入作為特征輸入,使用卷積核寬度為1-12的1d卷積層,進而使用最大池化(Max-pooling)提取來自卷積層特征,全連接層得出相應字符的標簽概率,盡管該分詞模型取得了較好的性能,但由于模型參數(shù)過多,導致分詞速度慢。Pattarawat等人在DeepCut的基礎上進行相關研究,分析了DeepCut模型缺陷,提出了AttaCut-C和AttaCut-SC泰語分詞模型,兩個模型在卷積層中都使用了擴張卷積,使分詞模型具有較高的并行度。此外,在AttaCut-SC模型中的嵌入層融入泰語音節(jié)。相較于DeepCut,AttaCut-SC模型在速度上有很大的提升,但是分詞性能有所下降。

發(fā)明內容

本發(fā)明提供了基于音節(jié)切分和詞切分聯(lián)合學習的多任務泰語分詞方法,以用于對泰語文本句子分詞,解決了由于模型提取的特征不夠豐富,模型參數(shù)過多導致泰語分詞性能較低和分詞速度慢的問題。

發(fā)明技術方案:基于音節(jié)切分和詞切分聯(lián)合學習的多任務泰語分詞方法,所述方法的具體步驟如下:

Step1、對從InterBEST2010的泰語語料庫中獲取的泰語文本進行預處理,為每一個字符匹配它對應的字符類別,給每個字符之間的邊界按照音節(jié)和詞結構特點打標簽。

Step2、通過滑動窗口的方式從經(jīng)過Step1預處理過的數(shù)據(jù)中依次得到包含21個字符信息的輸入,利用字符嵌入和位置嵌入對泰語字符進行特征編碼,將獲得的字符表征和字符類別表征進行拼接得到新的表征,將新的表征輸入Transformer的編碼器模型,確定每個字符組成音節(jié)或詞的概率。

所述步驟Step1的具體步驟為:

Step1.1、針對已經(jīng)進行詞切分的泰語語料,進行過濾篩選,刪除泰語文本中的'NE'、'/NE'、'AB'、'/AB'這些字符,之后依次遍歷泰語文本中的每一個字符,并為每一個字符匹配它對應的字符類別;

Step1.2、根據(jù)泰語文本中用“|”劃分的詞匯,結合字符在詞匯中的位置信息,給每一個字符標注切分標識,一個泰語詞匯中第一個字符,標注為1,其它位置的字符,標注為0;

Step1.3、調用PyThaiNLP中的syllable_tokenize方法對詞匯進行音節(jié)切分,結合字符在音節(jié)中的位置信息,給每一個字符標注切分標識,一個泰語音節(jié)中第一個字符,標注為1,其它位置的字符,標注為0;

Step1.4、以DataFrame的數(shù)據(jù)結構形式對Step1.1、Step1.2和Step1.3中得到的字符、字符類別、組成詞的字符標識和組成音節(jié)的字符標識信息進行存儲;

作為本發(fā)明的優(yōu)選方案,所述步驟Step2的具體步驟如下:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經(jīng)昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110079486.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜影皖精品av在线播放| 鲁丝一区二区三区免费观看| 久草精品一区| 国产一区二区三区精品在线| 99国产精品| 国内精品99| 少妇在线看www| 国产精品一区二区av麻豆| 国产另类一区| 欧美日韩国产一二| 国产精品一区二区三| 欧美一区二区三区久久综合| 福利片91| 日本一区二区三区中文字幕| 久久99久久99精品免观看软件 | 国产午夜精品一区二区三区四区| 中文字幕一区二区三区乱码视频 | 国产九九九精品视频| 日本精品一区二区三区视频| 老太脱裤子让老头玩xxxxx| 91免费视频国产| 黄毛片在线观看| 欧美在线观看视频一区二区 | 99精品一区| 国产在线精品二区| 国产一区二区三区的电影| 色综合久久网| 国产精品剧情一区二区三区| 国产精品99999999| 国产91刺激对白在线播放| 久久96国产精品久久99软件| 亚洲国产精品一区在线| 狠狠色狠狠色88综合日日91 | 少妇高潮在线观看| 91精品一区在线观看| 久久婷婷国产综合一区二区| 欧美精品久久一区二区| 岛国精品一区二区| 午夜激情综合网| 欧美久久久一区二区三区| 久久国产精品精品国产| 日本一区二区三区在线视频| 在线中文字幕一区| 日韩中文字幕在线一区| 香港三日三级少妇三级99| 午夜大片男女免费观看爽爽爽尤物 | 日本一区二区在线电影| 91视频一区二区三区| 国产一级大片| 国产午夜亚洲精品| 欧美亚洲视频一区二区| 亚洲欧美国产日韩色伦| 国产一区二区免费电影| 99久久国产综合精品色伊| 夜夜夜夜曰天天天天拍国产| 午夜肉伦伦影院九七影网| 中文字幕在线播放一区| 99精品视频免费看| 精品福利一区| 国产精品香蕉在线的人| 午夜老司机电影| 欧美高清视频一区二区三区| 丰满少妇高潮惨叫久久久一| 欧美日韩激情一区二区| 精品一区二区三区视频?| 91福利视频免费观看| 日韩中文字幕区一区有砖一区| 日韩av片无码一区二区不卡电影| 久久99精| 欧美乱大交xxxxx古装| 久久99精品国产麻豆宅宅| 天天干狠狠插| 欧美乱大交xxxxx古装| 99精品视频一区| 国产男女乱淫视频高清免费| 亚洲免费永久精品国产| 国产精品色在线网站| 欧美一区二区三区爽大粗免费| 久久精品com| 国产69精品久久99不卡免费版| 国产一二区精品| 国产精品不卡在线| 99精品一级欧美片免费播放| 偷拍久久精品视频| 中日韩欧美一级毛片| 91丝袜国产在线观看| 欧美日韩国产一二| 欧美freesex极品少妇| 日韩久久精品一区二区| 九九精品久久| 91精品丝袜国产高跟在线| 日韩精品中文字| 日本一区二区三区中文字幕| 久久亚洲精品国产一区最新章节| 午夜免费网址| 岛国黄色av| 精品一区二区三区影院| 久久精品手机视频| 午夜国产一区| 欧美系列一区| 国产精品一区二区久久乐夜夜嗨| 99精品久久久久久久婷婷| 国产乱子一区二区| 99久精品视频| 欧美日韩亚洲三区| 美女销魂免费一区二区| 欧美日韩中文字幕一区二区三区| 欧美在线观看视频一区二区 | freexxxx性| 国产亚洲欧美日韩电影网| 免费毛片a| 狠狠色狠狠色综合日日五| 国产精品电影一区二区三区| 国产欧美一区二区三区在线| 欧美国产亚洲精品| 国产精品一区二区av日韩在线| 国产99久久久精品视频| 久久精品99国产精品亚洲最刺激| 国产乱老一区视频| 国产日本一区二区三区| 国产精品视频一区二区在线观看| 国产亚洲综合一区二区| 91香蕉一区二区三区在线观看| 一本色道久久综合亚洲精品图片| 国产精品一区二区久久乐夜夜嗨| 亚洲国产精品一区在线| 久久久精品二区| 国产天堂第一区| 欧美日韩久久一区| 国产一级自拍| 狠狠色噜噜综合社区| 99久久国产综合精品麻豆| 国产精品久久久久久av免费看| 福利片91| 国产69精品99久久久久久宅男| xxxxx色| 一区二区三区国产欧美| 日本精品一区二区三区视频| 91精品美女| 欧美一级不卡| 久久99精| 国产一区二区三区久久久| 午夜色影院| 国产精品剧情一区二区三区| 欧美精品一区二区性色| 国内久久久久久| 欧美黄色一二三区| 午夜精品在线观看| 韩国视频一区二区| 亚洲精品无吗| 欧美hdxxxx| 久久精品国产一区二区三区| 午夜精品一区二区三区在线播放| 国产在线欧美在线| 欧美日本一二三区| 99三级视频| 国产一区二区电影| 麻豆9在线观看免费高清1| 午夜片在线| 欧美日韩卡一卡二| 日韩av在线播| 国产九九影院| 国产精品高潮呻吟三区四区| 狠狠躁夜夜躁xxxxaaaa| 国语对白老女人一级hd| 激情久久一区| 久久国产精品波多野结衣| 日韩亚洲欧美一区| 国产一区二区三区在线电影| 国内精品久久久久影院日本| 国产69精品久久久久男男系列| 久久午夜精品福利一区二区| 国产一区二区三区大片| 26uuu亚洲国产精品| 日韩三区三区一区区欧69国产| 国产在线一区二区视频| 91一区二区在线观看| 欧美一区二区三区另类| 久久夜色精品久久噜噜亚| 99视频一区| 国产精品v欧美精品v日韩| 国产有码aaaae毛片视频| 91精品资源| 热久久一区二区| 国产精品96久久久久久久| 亚洲激情中文字幕| 久久夜靖品2区| 国产vsv精品一区二区62| 年轻bbwbbw高潮| 国产中文字幕一区二区三区 | 久久精品视频3| 99久久国产综合精品色伊 | 麻豆91在线| 国产二区不卡| 午夜av男人的天堂| 欧美日韩偷拍一区| 色婷婷精品久久二区二区6| 国产一区二区中文字幕| 91精品国产高清一二三四区| 精品少妇的一区二区三区四区| 中文丰满岳乱妇在线观看| 日本aⅴ精品一区二区三区日| 欧美日韩一区免费| 久久99亚洲精品久久99果| 中文字幕一区一区三区| 鲁丝一区二区三区免费| 国产精品一卡二卡在线观看| 欧美一区二区精品久久| 欧美一区二区三区免费视频| 国产日韩欧美二区| 日本精品一二三区| 99久久国产综合精品尤物酒店| 精品国产一区二区三区久久久久久| 久久精品麻豆| 亚欧精品在线观看| 久久国产精品广西柳州门| 欧美一区二区三区艳史| 国产午夜三级一二三区| 色婷婷综合久久久久中文| 少妇精品久久久久www蜜月| 男人的天堂一区二区| ass韩国白嫩pics| 欧美一区二区三区高清视频| 久久精品亚洲精品| 国产精品视频1区2区3区| 国产精品高潮呻| 狠狠色丁香久久婷婷综合_中| 国产欧美一区二区三区免费看| 九九精品久久| 久久久综合香蕉尹人综合网| 亚日韩精品| 中文字幕在线一二三区| av素人在线| 99久久婷婷国产亚洲终合精品| 国产在线精品一区二区| 狠狠色噜噜狠狠狠狠色吗综合| 久久久精品久久日韩一区综合| 国产人成看黄久久久久久久久| 国产精品一区二区av麻豆| 国产高清在线一区| 91精品夜夜| 日韩亚洲欧美一区二区 | 欧美日韩亚洲三区| 99国产精品久久久久99打野战| 国产高清不卡一区| 久久久精品视频在线|