[發(fā)明專利]基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110271879.3 | 申請(qǐng)日: | 2021-03-13 |
| 公開(kāi)(公告)號(hào): | CN113158693A | 公開(kāi)(公告)日: | 2021-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 楊雅婷;艾孜麥提·艾尼瓦爾;董瑞;馬博;王磊;周喜 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院新疆理化技術(shù)研究所 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58;G06F40/284 |
| 代理公司: | 烏魯木齊中科新興專利事務(wù)所(普通合伙) 65106 | 代理人: | 張莉 |
| 地址: | 830011 新疆維吾爾*** | 國(guó)省代碼: | 新疆;65 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 漢語(yǔ) 關(guān)鍵詞 維吾爾 生成 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成方法,其特征在于該方法包括:漢語(yǔ)關(guān)鍵詞翻譯為維吾爾語(yǔ)關(guān)鍵詞,并進(jìn)行維吾爾語(yǔ)詞干提取、詞性標(biāo)注;確定維吾爾語(yǔ)詞干能夠結(jié)合的詞綴序列;根據(jù)所述詞綴序列,利用維吾爾語(yǔ)詞干、詞綴變體搭配算法確定詞干能夠附加的詞綴變體;根據(jù)所述詞綴變體,結(jié)合維吾爾語(yǔ)音變規(guī)則,生成維吾爾語(yǔ)關(guān)鍵詞詞干對(duì)應(yīng)的所有形態(tài);具體操作按下列步驟進(jìn)行:
a、漢語(yǔ)關(guān)鍵詞翻譯為維吾爾語(yǔ)關(guān)鍵詞:是利用漢維雙語(yǔ)詞典將漢語(yǔ)關(guān)鍵詞翻譯為維吾爾語(yǔ)關(guān)鍵詞,獲取對(duì)應(yīng)的維吾爾語(yǔ)關(guān)鍵詞;
b、維吾爾語(yǔ)詞干提取、詞性標(biāo)注:是對(duì)翻譯后得到的維吾爾語(yǔ)關(guān)鍵詞詞匯進(jìn)行詞干提取和詞性標(biāo)注,切分為詞干和詞綴,并保留詞干部分,其中詞性標(biāo)注為標(biāo)注該詞匯的詞性,如名詞、動(dòng)詞、形容詞;
c、確定維吾爾語(yǔ)關(guān)鍵詞詞干結(jié)合的詞綴序列:以維吾爾語(yǔ)構(gòu)詞規(guī)則為依據(jù),收集維吾爾語(yǔ)詞綴、詞綴能夠附加詞干的詞性以及詞綴的所有變體;根據(jù)維吾爾語(yǔ)關(guān)鍵詞詞干的詞性,獲取能夠和關(guān)鍵詞詞干結(jié)合的詞綴;
d、維吾爾語(yǔ)詞干、詞綴變體搭配算法:根據(jù)維吾爾語(yǔ)詞干結(jié)構(gòu)特征、詞綴結(jié)構(gòu)特征及維吾爾語(yǔ)語(yǔ)音和諧規(guī)則,采用維吾爾語(yǔ)詞干、詞綴變體搭配算法,選擇能夠和維吾爾語(yǔ)關(guān)鍵詞詞干結(jié)合的特定詞綴變體;
e、維吾爾語(yǔ)音變規(guī)則:關(guān)鍵詞詞干與詞綴變體結(jié)合時(shí)發(fā)生的弱化、通化、脫落、增加音變現(xiàn)象,根據(jù)維吾爾語(yǔ)語(yǔ)法,維吾爾語(yǔ)關(guān)鍵詞詞干與詞綴變體結(jié)合時(shí),對(duì)特定類型的詞干或詞綴進(jìn)行音變處理。
2.根據(jù)權(quán)利要求1所述的基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成方法,其特征在于步驟b中所述的詞性標(biāo)注:是根據(jù)維吾爾語(yǔ)詞后綴的結(jié)合規(guī)則,總結(jié)出詞綴組合規(guī)則與維吾爾語(yǔ)詞性的對(duì)應(yīng)關(guān)系,先使用最大熵統(tǒng)計(jì)方法和條件隨機(jī)場(chǎng)統(tǒng)計(jì)方法對(duì)詞性做出一個(gè)粗略的判斷,然后利用總結(jié)出的規(guī)則,對(duì)使用統(tǒng)計(jì)得到的詞匯標(biāo)注結(jié)果進(jìn)行驗(yàn)證。
3.根據(jù)權(quán)利要求1所述的基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成方法,其特征在于步驟c中所述的維吾爾語(yǔ)構(gòu)詞規(guī)則的詞綴選擇:是收集維吾爾語(yǔ)所有構(gòu)形詞綴,根據(jù)維吾爾語(yǔ)語(yǔ)法中詞干與詞綴的結(jié)合規(guī)則,獲得出能夠和特定詞性的維吾爾語(yǔ)詞干結(jié)合的所有維吾爾語(yǔ)詞綴列表,并利用統(tǒng)計(jì)的方法確定與詞干結(jié)合時(shí)的前后循序。
4.根據(jù)權(quán)利要求1所述的基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成方法,其特征在于步驟d中所述的維吾爾語(yǔ)詞干、詞綴變體搭配算法:是總結(jié)出維吾爾語(yǔ)詞干結(jié)構(gòu)分布和詞綴結(jié)構(gòu)分布、詞干-詞綴變體搭配基本規(guī)則和特殊規(guī)則,并以此為基礎(chǔ)建立維吾爾語(yǔ)詞干-詞綴變體搭配算法。
5.一種基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成裝置,其特征在于該裝置是由漢語(yǔ)關(guān)鍵詞翻譯模塊、維吾爾語(yǔ)關(guān)鍵詞預(yù)處理模塊、維吾爾語(yǔ)關(guān)鍵詞詞干選擇詞綴模塊、維吾爾語(yǔ)關(guān)鍵詞詞干與詞綴變體搭配模塊和音變處理模塊組成;其中:
漢語(yǔ)關(guān)鍵詞翻譯模塊:利用漢維翻譯技術(shù),對(duì)漢語(yǔ)關(guān)鍵詞進(jìn)行翻譯,獲取對(duì)應(yīng)的維吾爾語(yǔ)關(guān)鍵詞,其中漢維機(jī)器翻譯技術(shù)可以基于漢維雙語(yǔ)詞典的詞匯翻譯;
維吾爾語(yǔ)關(guān)鍵詞預(yù)處理模塊:采用基于規(guī)則和統(tǒng)計(jì)相結(jié)合的方法,對(duì)翻譯后得到的維吾爾語(yǔ)關(guān)鍵詞詞匯進(jìn)行詞干提取和詞性標(biāo)注,詞干提取是將詞匯切分為詞干和詞綴,并保留詞干部分,其中詞性標(biāo)注為標(biāo)注該詞匯的詞性,如名詞、動(dòng)詞、形容詞;
維吾爾語(yǔ)關(guān)鍵詞詞干選擇詞綴模塊:以維吾爾語(yǔ)構(gòu)詞規(guī)則為依據(jù),采用基于規(guī)則和詞綴庫(kù)相結(jié)合的方法,根據(jù)維吾爾語(yǔ)關(guān)鍵詞詞干的詞性,獲取能夠和關(guān)鍵詞詞干結(jié)合的詞綴;
維吾爾語(yǔ)關(guān)鍵詞詞干與詞綴變體搭配模塊:根據(jù)維吾爾語(yǔ)詞干結(jié)構(gòu)特征、詞綴結(jié)構(gòu)特征及維吾爾語(yǔ)語(yǔ)音和諧規(guī)則,采用維吾爾語(yǔ)詞干、詞綴變體搭配算法,選擇能夠和維吾爾語(yǔ)關(guān)鍵詞詞干結(jié)合的特定詞綴變體;
音變處理模塊:根據(jù)維吾爾語(yǔ)語(yǔ)法,維吾爾語(yǔ)關(guān)鍵詞詞干與詞綴變體結(jié)合時(shí),對(duì)特定類型的詞干或詞綴進(jìn)行音變處理。
6.一種電子設(shè)備,其中,包括:至少一個(gè)處理器,以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行權(quán)利要求1-5中任一項(xiàng)所述的方法。
7.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-5中任一項(xiàng)所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院新疆理化技術(shù)研究所,未經(jīng)中國(guó)科學(xué)院新疆理化技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110271879.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種建筑瓷板清洗裝置
- 下一篇:一種真空混合干燥機(jī)
- 現(xiàn)代漢語(yǔ)信息全息拉丁化漢語(yǔ)語(yǔ)音碼表示法
- 漢字漢語(yǔ)拼音與漢語(yǔ)語(yǔ)音碼雙向可逆轉(zhuǎn)換方法
- 漢語(yǔ)語(yǔ)音碼漢語(yǔ)語(yǔ)音識(shí)別方法
- 一種計(jì)算機(jī)輸入中文的方法
- 漢語(yǔ)語(yǔ)音碼全拼和簡(jiǎn)拼漢語(yǔ)全息信息處理方法
- 一種基于DIVA神經(jīng)網(wǎng)絡(luò)模型的漢語(yǔ)元音發(fā)音方法
- 一種非漢語(yǔ)語(yǔ)音識(shí)別方法、系統(tǒng)及其構(gòu)造方法
- 一種古漢語(yǔ)語(yǔ)義分析方法及其系統(tǒng)
- 漢語(yǔ)定向接龍的查詢方法、裝置、設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 漢語(yǔ)友聲聲數(shù)系統(tǒng)的技術(shù)方法
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 用于選擇用于網(wǎng)絡(luò)發(fā)布的關(guān)鍵詞的方法和設(shè)備
- 關(guān)鍵詞質(zhì)量度的檢測(cè)方法和裝置
- 關(guān)鍵詞排名的檢測(cè)方法和裝置
- 關(guān)鍵詞相似度獲取方法、裝置及服務(wù)器
- 關(guān)鍵詞推薦方法及裝置
- 一種關(guān)鍵詞檢索管理系統(tǒng)
- 一種信息推薦方法、電子設(shè)備、存儲(chǔ)介質(zhì)及系統(tǒng)
- 關(guān)鍵詞廣告投放自動(dòng)化否定關(guān)鍵詞方法及裝置
- 一種長(zhǎng)尾關(guān)鍵詞識(shí)別方法、關(guān)鍵詞搜索方法及計(jì)算機(jī)設(shè)備
- 維吾爾語(yǔ)句子相似度計(jì)算方法
- 維吾爾語(yǔ)倒排索引文件的生成方法
- 維吾爾語(yǔ)詞語(yǔ)對(duì)齊方法
- 維吾爾醫(yī)藥古籍資源網(wǎng)絡(luò)檢索平臺(tái)
- 維吾爾語(yǔ)敏感詞過(guò)濾系統(tǒng)
- 一種維吾爾語(yǔ)拼寫(xiě)檢查方法及裝置
- 一種圖像維吾爾文單詞識(shí)別方法及裝置
- 一種用于術(shù)語(yǔ)管理及抽取的分析方法
- 一種基于拉丁字母的維吾爾語(yǔ)處理方法和系統(tǒng)
- 基于漢語(yǔ)關(guān)鍵詞的維吾爾語(yǔ)關(guān)鍵詞生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





