日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于人名起源分類的人名音譯方法有效

專利信息
申請號: 201210566217.X 申請日: 2012-12-24
公開(公告)號: CN103020046A 公開(公告)日: 2013-04-03
發明(設計)人: 趙鐵軍;李婷婷;張春越;曹海龍 申請(專利權)人: 哈爾濱工業大學
主分類號: G06F17/28 分類號: G06F17/28
代理公司: 哈爾濱市松花江專利商標事務所 23109 代理人: 王艷萍
地址: 150001 黑龍*** 國省代碼: 黑龍江;23
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 人名 起源 分類 音譯 方法
【權利要求書】:

1.基于人名起源分類的人名音譯方法,其人名起源分類特征、方法和多系統融合方法按照以下步驟進行:

一、人名起源分類:

根據人名起源特征模板采用logistic回歸模型,進行計算:

P(Y=k|x)=exp(wk*x)1+Σk=1K-1exp(wk*x),]]>k=1,2,...,K-1????????????????????????公式一

P(Y=K|x)=11+Σk=1K-1exp(wk*x)]]>公式二

公式一和公式二中K的值是6,Y為1-6,其中1表示中國,2表示英美,3表示阿拉伯,4表示俄國,5表示日本,6表示韓國,x為人名起源特征模板,P表示起源的概率,w是特征的權重向量;

步驟一中所述的人名起源特征模板為中文人名起源特征模板或英文人名起源特征模板;

中文人名起源特征模板為語言模型、字的TF-IDF、長度和姓氏;

語言模型為整合1-gram模型、整合2-gram模型和整合3-gram模型,所述整合n-gram模型是防止該類特征數量過于龐大,而基于最小方差將n-gram的概率特征值劃分到1-100個區間上,形成100個特征;長度為漢字字符數;姓氏為姓氏置信度,姓氏置信度為姓氏出現的次數除以出現的總次數所得的商;

字的TF-IDF為“名”單字TF和“名”單字IDF,根據人名語料統計出人名常用字并記錄每個常用字的字頻,得到6類人名常用字表,然后用下面的兩個公式計算TF和IDF:

TFi=xiΣi=1i=Nxi]]>公式三

IDFi=log26DFi]]>公式四

在公式三及公式四中,x代表第i個字在訓練語料中的字頻,分母是字表中所有字在訓練語料中全部的出現次數,N代表字表中字的個數,DF表示包含i的人名起源類別數;

英文人名起源特征模板為字符語言模型、音節的語言模型、音節的TF-IDF和長度,

語言模型為整合2-gram模型、整合3-gram模型和整合4-gram模型,音節的語言模型為整合1-gram模型、整合2-gram模型和整合3-gram模型,所述整合n-gram模型是防止該類特征數量過于龐大,而基于最小方差將n-gram的概率特征值劃分到1-100個區間上,形成100個特征;長度為字符個數和音節個數,并且采用下述的方法將英文切分成音節:

1、將‘x’替換成‘ks’;

2、{a,o,e,i,u}是基本的元音字符,y如果在輔音后面當作元音處理;

3、當‘w’前面是‘a,e,o’且后面不是‘h’的時候,‘w’和之前的元音當作一個新的元音符號;

4、除了{iu,eo,io,oi,ia,ui,ua,uo}外,其余的連續的元音當作一個新的元音符號處理;

5、將挨著的輔音分開,將元音和緊跟著的輔音分開;

6、輔音和其后的元音形成一個音節,其他的孤立元音和輔音作為單獨的音節;

音節的TF-IDF為音節的TF和音節的IDF,根據人名語料統計出人名常用音節并記錄每個常用音節的頻率,得到6類人名常用音節表,然后用下面的兩個公式計算TF和IDF:

TFi=xiΣi=1i=Nxi]]>公式三

IDFi=log26DFi]]>公式四

在公式三及公式四中,x代表第i個字在訓練語料中的音節的頻率,分母是字表中所有音節在訓練語料中全部的出現次數,N代表字表中音節的個數,DF表示包含i音節的人名起源類別數;

二、線性插值系統融合:

公式五

Q(0,$)=0??????????????????????????公式六

Q(t,p)=maxt,tt-4tt{φ(xt+1t,p,p)+Q(t,p)}]]>公式七

Q(T+1,$)=maxp{φ($,p,$)+Q(T,p)}]]>公式八

公式六、公式七和公式八中T代表的是翻譯結果,P代表的是翻譯的結果概率,t代表翻譯到源語言的第幾個位置,在公式五中,λi代表S屬于起源i的概率,公式五是多系統融合的策略,公式六、七、八是解碼算法。

2.根據權利要求1所述的基于人名起源分類的人名音譯方法,其特征在于步驟一所述中文人名起源特征模板中采用SRILM工具訓練語言模型,其中每個n-gram都有概率,n為1、2或3,統計所有n-gram概率的一維分布,根據這個分布劃分出100個區間,這100個區間是對n-gram特征的一個聚類,每個區間代表一個類別,每個區間內的方差和最小,區間平均值間的方差和最大,利用n-gram的數據求100個區間的分界點:

λ=argminλ(0.7*ΣxiXj(xi-yj)2-0.3*Σi=199(yi-yi+1)2)]]>公式九

公式九中λ代表100個分界點的集合,xi代表每一個n-gram的概率值,yj代表第j個分界區間的平均值。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210566217.X/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 精品国产一区二区在线| 亚洲va国产2019| 丰满岳乱妇bd在线观看k8| 中文无码热在线视频| 欧美色综合天天久久| 国产91精品一区二区麻豆亚洲| 欧美在线一区二区视频| 中文字幕亚洲欧美日韩在线不卡| 色噜噜狠狠狠狠色综合久| 国产伦精品一区二区三区电影 | 亚洲精品久久久久中文字幕欢迎你| 国产一区二区电影| 欧美日韩国产一二| 中文丰满岳乱妇在线观看| 人人要人人澡人人爽人人dvd| 国产免费区| 四虎国产精品久久| 亚洲国产一区二区久久久777| 国产精品久久久久久久新郎| 亚洲精品色婷婷| 国产午夜精品一区二区三区在线观看| 91人人爽人人爽人人精88v| 日韩一级在线视频| 国产偷窥片| 亚洲精品国产精品国自产网站按摩| 午夜亚洲国产理论片一二三四| 亚洲午夜久久久久久久久电影院| 综合久久一区| 国产麻豆91视频| 制服丝袜亚洲一区| 欧美乱大交xxxxx古装| 精品久久一区| 国产伦精品一区二区三区照片91| 国产高清无套内谢免费| 精品91av| 国产精品亚洲精品一区二区三区| 亚洲国产精品国自产拍av| 在线观看欧美日韩国产| 性色av色香蕉一区二区三区| 狠狠色综合久久丁香婷婷| 91超薄丝袜肉丝一区二区| 国产欧美一区二区三区免费视频| 久久精品视频一区二区| 99视频一区| 久久综合久久自在自线精品自| 激情久久久久久| 四虎国产精品永久在线国在线 | 久爱精品视频在线播放| 99国产精品久久久久| 国产69精品久久久久777糖心| 中文字幕二区在线观看| 手机看片国产一区| 久久精品视频3| 国产激情二区| 国产精品一级片在线观看| 国产日韩欧美另类| 久久精品国产综合| 国产足控福利视频一区| 91制服诱惑| 一本一道久久a久久精品综合蜜臀| 欧美日韩乱码| 日韩不卡毛片| 狠狠色狠狠色综合久久一| 欧美资源一区| 亚洲国产精品网站| 日本一二三区视频| 69久久夜色精品国产69–| 91波多野结衣| 91精品免费观看| 88国产精品欧美一区二区三区三| 久久婷婷国产香蕉| 国产91视频一区二区| 91一区二区三区在线| 国产一二区在线| **毛片在线| 中文av一区| 欧美一区二区三区免费在线观看| aaaaa国产欧美一区二区| 91麻豆精品一区二区三区| 欧美3级在线| 欧美精品日韩一区| 久久99精品国产| 97一区二区国产好的精华液| av狠狠干| 亚洲国产精品91| 欧美一区二区三区久久精品视| 小萝莉av| 99精品久久久久久久婷婷| 国产中文字幕一区二区三区 | 国产色婷婷精品综合在线手机播放| 久久婷婷国产香蕉| 一区精品二区国产| 中文字幕另类日韩欧美亚洲嫩草| 国产精品一区二| 亚洲少妇一区二区三区| 91精品视频一区二区三区| 国产精品亚洲二区| 国产伦理精品一区二区三区观看体验 | 少妇太爽了在线观看免费| 国产伦精品一区二区三区免费下载| 亚洲欧美日本一区二区三区 | 一区二区在线国产| 国产精品欧美一区二区三区奶水 | 日本一二三区电影| 欧美一区二区三区性| 国产88av| 欧美性xxxxx极品少妇| 欧美日韩亚洲三区| 日本二区在线播放| 久久久久亚洲精品视频| 欧美日韩国产在线一区| 国产精品电影一区二区三区| 国产视频精品久久| 国产精品v一区二区三区| 强行挺进女警紧窄湿润| 香港三日本8a三级少妇三级99 | 在线播放国产一区| 国产精品v一区二区三区| 午夜av资源| 日韩精品一区二区三区四区在线观看| 欧美日韩一级二级| 大桥未久黑人强制中出| 秋霞av电影网| 国产精品视频1区| 国产一区二区片| 亚洲国产精品国自产拍av| 高清欧美精品xxxxx| **毛片在线免费观看| 国产精品一二二区| 91精品啪在线观看国产线免费| 肉丝肉足丝袜一区二区三区| 乱子伦农村| 91精品中综合久久久婷婷| 国产欧美视频一区二区| 欧美久久一区二区三区| 性色av香蕉一区二区| 91久久精品在线| 91片在线观看| 强制中出し~大桥未久在线播放| 中文字幕制服丝袜一区二区三区| 国产精品一区二区人人爽| 欧美hdfree性xxxx| 激情久久一区| 国产伦精品一区二区三区免| 精品国产区| 亚洲天堂国产精品| 久久精视频| 精品一区中文字幕| 日本一区二区三区四区高清视频| 国产一区正在播放| 日本福利一区二区| 91精品视频一区二区| 亚洲欧美一卡| 午夜av男人的天堂| 国产日韩欧美在线影视| 国产午夜精品一区二区理论影院| 久久久国产精品一区| 狠狠色噜噜综合社区| 久久精品一| 激情久久精品| 亚洲欧美一卡二卡| 亚洲精品久久久久中文第一暮| 欧美久久精品一级c片| 欧美日韩一区不卡| 色噜噜狠狠色综合影视| 日韩精品999| 久久久久国产亚洲| 亚洲精品日韩激情欧美| 欧美一区二区三区另类| 国产一级大片| 欧美激情综合在线| 久久影院国产精品| 国产农村妇女精品一二区| 午夜理伦影院| 国产精品免费专区| 日本二区在线观看| 美女脱免费看直播| 久爱精品视频在线播放| 狠狠色噜噜狠狠狠狠69| 欧美乱大交xxxxx| 一二三区欧美| 女女百合互慰av| 美女脱免费看直播| 午夜伦情电午夜伦情电影| 国内精品在线免费| 久久国产欧美一区二区免费| 精品国产鲁一鲁一区二区三区| 日韩无遮挡免费视频| 福利片一区二区三区| 国产精品一区不卡| 亚洲1区2区3区4区| 九九久久国产精品| 99热一区二区| 国产欧美日韩亚洲另类第一第二页| 国产精品1234区| 亚洲国产精品区| 国产精品日韩电影| 国产精品久久二区| 国产在线一区观看| 久久精品一二三四| 欧美一区二区性放荡片| 99精品少妇| 欧美在线一区二区视频| 国内久久精品视频| 日韩精品乱码久久久久久| 午夜亚洲影院| 少妇高清精品毛片在线视频| 久久久人成影片免费观看| 欧美日韩一区二区三区69堂| 免费精品99久久国产综合精品应用| 精品国产一区在线| 欧美一区二区三区片| 精品一区二区三区视频?| 亚洲国产精品麻豆| 精品国产乱码久久久久久久 | 国产一级片大全| 7777久久久国产精品| 视频一区二区三区中文字幕| 欧美激情午夜| 一区二区久久精品| 日本一级中文字幕久久久久久| 亚洲少妇中文字幕| 九九精品久久| 麻豆国产一区二区三区| 男女无遮挡xx00动态图120秒| 激情久久久久久| 亚洲精品乱码久久久久久写真| 久久国产欧美一区二区三区精品| 国产精品国产三级国产专区53| 91久久国产视频| 欧美日韩一区电影| 狠狠色噜噜狠狠狠狠米奇7777| 亚洲国产美女精品久久久久∴| 国产精品久久久不卡| 日韩精品一区二区三区四区在线观看 | 91久久精品国产亚洲a∨麻豆| 亚洲四区在线| 国产在线拍揄自揄拍| 欧美一区二区三区四区五区六区| 国产69精品久久久久app下载| 欧美日韩国产在线一区| 久久精品综合| 国产一区二区电影在线观看| av午夜在线| 91香蕉一区二区三区在线观看| 欧美日韩乱码|