[發(fā)明專利]語(yǔ)種識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010891340.3 | 申請(qǐng)日: | 2020-08-30 |
| 公開(kāi)(公告)號(hào): | CN112016308A | 公開(kāi)(公告)日: | 2020-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 崔煒 | 申請(qǐng)(專利權(quán))人: | 上海松鼠課堂人工智能科技有限公司 |
| 主分類號(hào): | G06F40/263 | 分類號(hào): | G06F40/263;G06F40/216 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 200237 上海市徐*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)種 識(shí)別 方法 | ||
1.一種語(yǔ)種識(shí)別方法,其特征在于,所述語(yǔ)種識(shí)別方法包括:
接收輸入的需進(jìn)行語(yǔ)種識(shí)別的待識(shí)別語(yǔ)種信息;
根據(jù)接收的所述待識(shí)別語(yǔ)種信息,統(tǒng)計(jì)并獲取所述待識(shí)別語(yǔ)種信息中包含的詞語(yǔ)在對(duì)應(yīng)語(yǔ)種中的出現(xiàn)頻率和排行信息;
根據(jù)所述出現(xiàn)頻率和排行信息,計(jì)算所述待識(shí)別語(yǔ)種信息為對(duì)應(yīng)語(yǔ)種的語(yǔ)種概率;
根據(jù)計(jì)算得到的所述語(yǔ)種概率,確定所述待識(shí)別語(yǔ)種信息對(duì)應(yīng)的語(yǔ)種。
2.如權(quán)利要求1所述的語(yǔ)種識(shí)別方法,其特征在于,所述根據(jù)接收的所述待識(shí)別語(yǔ)種信息,統(tǒng)計(jì)并獲取所述待識(shí)別語(yǔ)種信息中包含的詞語(yǔ)在對(duì)應(yīng)語(yǔ)種中的出現(xiàn)頻率和排行信息,包括:
根據(jù)接收到的所述待識(shí)別語(yǔ)種信息,統(tǒng)計(jì)所述待識(shí)別語(yǔ)種信息中各詞語(yǔ)的出現(xiàn)頻率;
根據(jù)所述詞語(yǔ)對(duì)應(yīng)的所述出現(xiàn)頻率,按照所述出現(xiàn)頻率對(duì)所述詞語(yǔ)進(jìn)行排序,得到每一個(gè)詞語(yǔ)對(duì)應(yīng)的所述出現(xiàn)頻率在所述待識(shí)別語(yǔ)種信息中出現(xiàn)次數(shù)的排列順序所對(duì)應(yīng)的排行信息;
其中,將所述出現(xiàn)頻率和排行信息分別記為f(m)和r(m),m表示所述待識(shí)別語(yǔ)種信息中的詞語(yǔ)的序號(hào),m取值為1、2、3,…,M,M為所述詞語(yǔ)的序號(hào)對(duì)應(yīng)的最大值,m為1時(shí)表示第一個(gè)詞語(yǔ),m為2時(shí)表示第二個(gè)詞語(yǔ),m取值M時(shí)表示第M個(gè)詞語(yǔ)。
3.如權(quán)利要求2所述的語(yǔ)種識(shí)別方法,其特征在于,所述根據(jù)所述出現(xiàn)頻率和排行信息,計(jì)算所述待識(shí)別語(yǔ)種信息為對(duì)應(yīng)語(yǔ)種的語(yǔ)種概率,包括:
根據(jù)已知語(yǔ)種的語(yǔ)種數(shù)據(jù),統(tǒng)計(jì)并記錄所述待識(shí)別語(yǔ)種信息中各詞語(yǔ)在對(duì)應(yīng)的已知語(yǔ)種中出現(xiàn)的已知頻率和已知排序;
根據(jù)所述出現(xiàn)頻率和排行信息,并結(jié)合所述已知頻率和已知排序,計(jì)算得到所述待識(shí)別語(yǔ)種信息為對(duì)應(yīng)語(yǔ)種的語(yǔ)種概率。
4.如權(quán)利要求3所述的語(yǔ)種識(shí)別方法,其特征在于,所述根據(jù)已知語(yǔ)種的語(yǔ)種數(shù)據(jù),統(tǒng)計(jì)并記錄待識(shí)別語(yǔ)種信息中各詞語(yǔ)在對(duì)應(yīng)的已知語(yǔ)種中出現(xiàn)的已知頻率和已知排序,包括:
收集已知語(yǔ)種的語(yǔ)種數(shù)據(jù),得到每個(gè)語(yǔ)種分別對(duì)應(yīng)的已知語(yǔ)種數(shù)據(jù)庫(kù);其中,yi表示語(yǔ)種,i取1,2,…,Y;y1表示第一個(gè)語(yǔ)種,y2表示第二個(gè)語(yǔ)種,以此類推;Y表示所述已知語(yǔ)種數(shù)據(jù)庫(kù)中語(yǔ)種編號(hào)對(duì)應(yīng)的最大值;
基于所述已知語(yǔ)種數(shù)據(jù)庫(kù),統(tǒng)計(jì)并記錄所述待識(shí)別語(yǔ)種信息中包含的第m個(gè)詞語(yǔ)cm在對(duì)應(yīng)的第i個(gè)已知語(yǔ)種yi中出現(xiàn)的已知頻率f(yi,cm)和已知排序r(yi,cm);其中,m取1,2,…,M;f(yi,cm)表示第m個(gè)詞語(yǔ)cm在語(yǔ)種i中對(duì)應(yīng)出現(xiàn)的已知頻率,r(yi,cm)表示所述第m個(gè)詞語(yǔ)cm在語(yǔ)種i中出現(xiàn)頻率的排列順序?qū)?yīng)的已知排序。
5.如權(quán)利要求4所述的語(yǔ)種識(shí)別方法,其特征在于,所述根據(jù)所述出現(xiàn)頻率和排行信息,并結(jié)合所述已知頻率和已知排序,計(jì)算所述待識(shí)別語(yǔ)種信息為對(duì)應(yīng)語(yǔ)種的語(yǔ)種概率,包括:
獲取所述第m個(gè)詞語(yǔ)cm在不同語(yǔ)種i中的出現(xiàn)頻率f(yi,cm)及排行信息r(yi,cm);
根據(jù)所述出現(xiàn)頻率f(m)和排行信息r(m),以及所述出現(xiàn)頻率f(yi,cm)及排行信息r(yi,cm),計(jì)算所述待識(shí)別語(yǔ)種信息與語(yǔ)種i的頻率特征距離以及排行特征距離;
根據(jù)計(jì)算得到的所述頻率特征距離以及排行特征距離,計(jì)算得到所述待識(shí)別語(yǔ)種信息為語(yǔ)種i的語(yǔ)種概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海松鼠課堂人工智能科技有限公司,未經(jīng)上海松鼠課堂人工智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010891340.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 支持多語(yǔ)種接口的電子裝置及方法
- 一種模塊化語(yǔ)種解析裝置及其實(shí)現(xiàn)方法
- 一種終端語(yǔ)種的配置方法及裝置
- 一種多語(yǔ)種文字歸碼轉(zhuǎn)傳裝置及方法
- 一種語(yǔ)種識(shí)別方法、裝置、翻譯機(jī)、介質(zhì)和設(shè)備
- 自動(dòng)識(shí)別語(yǔ)種的翻譯方法、裝置及設(shè)備
- 一種語(yǔ)種識(shí)別模型訓(xùn)練、語(yǔ)種識(shí)別的方法和相關(guān)裝置
- 語(yǔ)種識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)種識(shí)別方法
- 人機(jī)對(duì)話方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





