日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于人名起源分類的人名音譯方法有效

專利信息
申請號: 201210566217.X 申請日: 2012-12-24
公開(公告)號: CN103020046A 公開(公告)日: 2013-04-03
發明(設計)人: 趙鐵軍;李婷婷;張春越;曹海龍 申請(專利權)人: 哈爾濱工業大學
主分類號: G06F17/28 分類號: G06F17/28
代理公司: 哈爾濱市松花江專利商標事務所 23109 代理人: 王艷萍
地址: 150001 黑龍*** 國省代碼: 黑龍江;23
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 人名 起源 分類 音譯 方法
【權利要求書】:

1.基于人名起源分類的人名音譯方法,其人名起源分類特征、方法和多系統融合方法按照以下步驟進行:

一、人名起源分類:

根據人名起源特征模板采用logistic回歸模型,進行計算:

P(Y=k|x)=exp(wk*x)1+Σk=1K-1exp(wk*x),]]>k=1,2,...,K-1????????????????????????公式一

P(Y=K|x)=11+Σk=1K-1exp(wk*x)]]>公式二

公式一和公式二中K的值是6,Y為1-6,其中1表示中國,2表示英美,3表示阿拉伯,4表示俄國,5表示日本,6表示韓國,x為人名起源特征模板,P表示起源的概率,w是特征的權重向量;

步驟一中所述的人名起源特征模板為中文人名起源特征模板或英文人名起源特征模板;

中文人名起源特征模板為語言模型、字的TF-IDF、長度和姓氏;

語言模型為整合1-gram模型、整合2-gram模型和整合3-gram模型,所述整合n-gram模型是防止該類特征數量過于龐大,而基于最小方差將n-gram的概率特征值劃分到1-100個區間上,形成100個特征;長度為漢字字符數;姓氏為姓氏置信度,姓氏置信度為姓氏出現的次數除以出現的總次數所得的商;

字的TF-IDF為“名”單字TF和“名”單字IDF,根據人名語料統計出人名常用字并記錄每個常用字的字頻,得到6類人名常用字表,然后用下面的兩個公式計算TF和IDF:

TFi=xiΣi=1i=Nxi]]>公式三

IDFi=log26DFi]]>公式四

在公式三及公式四中,x代表第i個字在訓練語料中的字頻,分母是字表中所有字在訓練語料中全部的出現次數,N代表字表中字的個數,DF表示包含i的人名起源類別數;

英文人名起源特征模板為字符語言模型、音節的語言模型、音節的TF-IDF和長度,

語言模型為整合2-gram模型、整合3-gram模型和整合4-gram模型,音節的語言模型為整合1-gram模型、整合2-gram模型和整合3-gram模型,所述整合n-gram模型是防止該類特征數量過于龐大,而基于最小方差將n-gram的概率特征值劃分到1-100個區間上,形成100個特征;長度為字符個數和音節個數,并且采用下述的方法將英文切分成音節:

1、將‘x’替換成‘ks’;

2、{a,o,e,i,u}是基本的元音字符,y如果在輔音后面當作元音處理;

3、當‘w’前面是‘a,e,o’且后面不是‘h’的時候,‘w’和之前的元音當作一個新的元音符號;

4、除了{iu,eo,io,oi,ia,ui,ua,uo}外,其余的連續的元音當作一個新的元音符號處理;

5、將挨著的輔音分開,將元音和緊跟著的輔音分開;

6、輔音和其后的元音形成一個音節,其他的孤立元音和輔音作為單獨的音節;

音節的TF-IDF為音節的TF和音節的IDF,根據人名語料統計出人名常用音節并記錄每個常用音節的頻率,得到6類人名常用音節表,然后用下面的兩個公式計算TF和IDF:

TFi=xiΣi=1i=Nxi]]>公式三

IDFi=log26DFi]]>公式四

在公式三及公式四中,x代表第i個字在訓練語料中的音節的頻率,分母是字表中所有音節在訓練語料中全部的出現次數,N代表字表中音節的個數,DF表示包含i音節的人名起源類別數;

二、線性插值系統融合:

公式五

Q(0,$)=0??????????????????????????公式六

Q(t,p)=maxt,tt-4tt{φ(xt+1t,p,p)+Q(t,p)}]]>公式七

Q(T+1,$)=maxp{φ($,p,$)+Q(T,p)}]]>公式八

公式六、公式七和公式八中T代表的是翻譯結果,P代表的是翻譯的結果概率,t代表翻譯到源語言的第幾個位置,在公式五中,λi代表S屬于起源i的概率,公式五是多系統融合的策略,公式六、七、八是解碼算法。

2.根據權利要求1所述的基于人名起源分類的人名音譯方法,其特征在于步驟一所述中文人名起源特征模板中采用SRILM工具訓練語言模型,其中每個n-gram都有概率,n為1、2或3,統計所有n-gram概率的一維分布,根據這個分布劃分出100個區間,這100個區間是對n-gram特征的一個聚類,每個區間代表一個類別,每個區間內的方差和最小,區間平均值間的方差和最大,利用n-gram的數據求100個區間的分界點:

λ=argminλ(0.7*ΣxiXj(xi-yj)2-0.3*Σi=199(yi-yi+1)2)]]>公式九

公式九中λ代表100個分界點的集合,xi代表每一個n-gram的概率值,yj代表第j個分界區間的平均值。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210566217.X/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美日韩三区二区| 扒丝袜网www午夜一区二区三区| 亚洲理论影院| 国产精品乱码一区| 精品国产1区2区3区| 亚洲欧美一卡| 国产精品九九九九九| 国产精品久久免费视频| 97人人澡人人爽91综合色| 国产网站一区二区| 国产精品99在线播放| 国产九九影院| 超碰97国产精品人人cao| 日韩亚洲精品在线| 国产一级片自拍| 91精品视频免费在线观看| 素人av在线| 狠狠色噜噜狠狠狠狠2021免费 | 亚洲va久久久噜噜噜久久0| 国产精品一区二区久久乐夜夜嗨 | 亚洲麻豆一区| 午夜剧场一区| 国产欧美一区二区精品性| 少妇久久精品一区二区夜夜嗨| 亚洲一区欧美| 欧美日韩一区电影| 国产视频一区二区在线| 自拍偷在线精品自拍偷写真图片| freexxxx性| 国产一级片自拍| 97人人澡人人爽人人模亚洲| 99精品黄色| 中文字幕一二三四五区| 国产伦精品一区二区三区免费迷| 91久久香蕉国产日韩欧美9色| 精品国产乱码久久久久久久| 精品国产91久久久久久久 | 91久久国语露脸精品国产高跟| 91avpro| 午夜av电影院| 91夜夜夜| 午夜看片网址| 乱淫免费视频| 久久一区二区三区欧美| 日韩一区二区福利视频| 99精品久久久久久久婷婷| 国产呻吟高潮| 国产999久久久| 国产精品自拍不卡| 国产一区二区视频免费观看| 欧美一区二区三区爽大粗免费| 亚洲精品日韩色噜噜久久五月| 国产69精品久久久久按摩| 欧美精品一区二区三区视频| 久久99久久99精品免观看软件| 国产精品乱码一区| 丰满岳乱妇在线观看中字| 玖玖国产精品视频| 日韩精品一区二区不卡| 国产一区二区三区精品在线| 日韩欧美中文字幕一区| 国产精品欧美一区二区三区| 午夜爽爽爽男女免费观看| 久久福利视频网| 国产又色又爽无遮挡免费动态图| 亚洲国产aⅴ精品一区二区16| 午夜影院啊啊啊| 久久久午夜爽爽一区二区三区三州| 日韩欧美国产精品一区| 亚洲欧美另类久久久精品2019| 日韩夜精品精品免费观看| 国产日韩欧美亚洲| 国产精品二区在线| 99er热精品视频国产| 国产欧美久久一区二区三区| 国产精品视频二区不卡| 销魂美女一区二区| 国产精品入口麻豆九色| 国产91色综合| 久久99精品久久久久婷婷暖91| 国产一区观看| 91精品资源| 日韩精品一二区| 国语精品一区| 亚洲视频精品一区| 国产精品一区二| 国产一区2| 91黄在线看 | 狠狠色噜噜狼狼狼色综合久| 久久国产精品波多野结衣 | 精品婷婷伊人一区三区三| 国产一区日韩在线| 国产精品久久久久久久久久久久冷| 日本看片一区二区三区高清| 国产欧美一区二区精品久久| 亚洲va久久久噜噜噜久久0| 女人被爽到高潮呻吟免费看 | 国产日韩欧美自拍| 亚欧精品在线观看| 91麻豆精品国产91久久| 少妇高潮ⅴideosex| 亚洲s码欧洲m码在线观看| 国产真实一区二区三区| 日韩精品少妇一区二区在线看| 久久国产麻豆| 亚洲第一天堂久久| 国产二区三区视频| 欧美精品一区二区久久| 国产精品日韩一区二区三区| 99久久婷婷国产综合精品电影| 欧美日韩中文国产一区发布 | 国产一区二区在线免费| 欧美高清性xxxx| 午夜一级免费电影| 免费**毛片| 久久精品国产亚洲一区二区| 精品久久一区| 欧美精品五区| 国产欧美日韩中文字幕| 97久久精品人人做人人爽| 亚洲精品乱码久久久久久按摩| 国产欧美一区二区三区四区| 免费观看又色又爽又刺激的视频 | 日本一区二区在线观看视频| 日本一二三四区视频| 99日本精品| 亚洲国产午夜片| 高清欧美xxxx| 日韩国产不卡| 韩国视频一区二区| 亚洲国产精品区| 午夜欧美a级理论片915影院| 99久久婷婷国产综合精品草原| 国产亚洲精品久久久久久网站| 毛片免费看看| 黄色av免费| xxxxhd欧美| 国产麻豆精品久久| 99久久国产免费| 精品国产一区二区三区免费| 色婷婷综合久久久中文一区二区| 欧美亚洲视频一区| 国产精品电影一区二区三区| 国产在线精品区| 香蕉av一区二区| 91精品啪在线观看国产| 国产视频二区| 欧美激情视频一区二区三区免费| 亚洲国产欧美一区| 99爱精品视频| 午夜裸体性播放免费观看| 久久99亚洲精品久久99| 欧美日韩激情一区| 日韩av免费网站| 日本精品一区在线| 国产精品伦一区二区三区级视频频| 国产一区二区三区乱码| 国产精品视频1区| 国产精品欧美一区二区三区| 亚洲高清久久久| 妖精视频一区二区三区| 国产精品一区二区av麻豆| 91麻豆精品国产综合久久久久久| 国产69精品久久久久777糖心| 欧美亚洲精品一区二区三区| 久久久久亚洲最大xxxx| 一区不卡av| 亚洲久色影视| 国精产品一二四区在线看| 国产二区免费| free×性护士vidos欧美| 国产精品视频久久| 国产免费区| 国产女人和拘做受在线视频| 乱子伦农村| 91麻豆精品国产91久久久资源速度| 国产一区二区三区黄| 国产乱码精品一区二区三区中文 | 91精品色| 综合国产一区| 日本一区二区三区中文字幕| 午夜伦理片在线观看| 国产在线不卡一区| 日韩精品一区二区三区免费观看| 狠狠综合久久av一区二区老牛| 亚洲欧美一二三| 中文乱码字幕永久永久电影| 国产一区二区三区黄| 三级视频一区| 国产精品色婷婷99久久精品| 2023国产精品久久久精品双| 国产精品无码专区在线观看| 精品综合久久久久| 精品久久久久久久免费看女人毛片| 91福利视频导航| 国产经典一区二区| 国产精品v欧美精品v日韩精品v| 久久99国产精品久久99果冻传媒新版本 | 麻豆精品久久久| 国产99久久九九精品免费| 午夜精品一区二区三区在线播放| 亚洲国产欧美一区二区三区丁香婷| 97人人模人人爽人人喊38tv| 日韩欧美中文字幕一区| 久久夜靖品2区| 少妇特黄v一区二区三区图片| 福利片一区二区三区| 91精品综合| 久久精品一二三四| 国产综合久久精品| 中文字幕视频一区二区| 亚洲欧洲一区二区| 羞羞免费视频网站| 欧美一区二区三区三州| 午夜无遮挡| 久久人人爽爽| 中文字幕一区二区三区乱码| 国产精品国产亚洲精品看不卡15 | 欧美日韩亚洲国产一区| 欧美激情精品一区| 在线观看黄色91| 国精产品一二四区在线看 | 国产精品九九九九九九| 国产精品一区在线观看| 久久久久国产精品嫩草影院| 91麻豆精品一区二区三区| 狠狠色丁香久久婷婷综| 91久久精品国产91久久性色tv| 色噜噜日韩精品欧美一区二区| 国产精品久久久久久久久久久不卡| 国产精品国产三级国产播12软件 | 亚洲乱视频| 久久九九亚洲| 在线精品国产一区二区三区| 日韩毛片一区| 国产日韩欧美精品一区| 岛国黄色网址| 国产玖玖爱精品视频| 一区二区三区四区国产| 国产91麻豆视频| 久久精品国产综合| 国产一卡在线| 一区二区三区日韩精品| 一区二区欧美精品| 亚洲国产精品入口| 日韩一区免费在线观看|