[發(fā)明專利]一種確定目標(biāo)字符序列對應(yīng)的語調(diào)信息的方法與設(shè)備有效
| 申請?zhí)枺?/td> | 201210094554.3 | 申請日: | 2012-04-01 |
| 公開(公告)號: | CN103365896B | 公開(公告)日: | 2018-02-16 |
| 發(fā)明(設(shè)計)人: | 張超;何徑舟;王強 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/20 |
| 代理公司: | 北京漢昊知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11370 | 代理人: | 羅朋,周建華 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 確定 目標(biāo) 字符 序列 對應(yīng) 語調(diào) 信息 方法 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種用于確定目標(biāo)字符序列對應(yīng)的語調(diào)信息的技術(shù)。
背景技術(shù)
由于自然語言中存在很多帶有聲調(diào)的語言,如越南語、法語等語言,在這些語言中,字母上會有各種聲調(diào),從而更好地表達相關(guān)信息。帶有聲調(diào)的標(biāo)準(zhǔn)文字往往會出現(xiàn)在正規(guī)的場合,如各大網(wǎng)站的網(wǎng)頁上等等。但是在很多場合,為了減少輸入麻煩,這樣的正規(guī)語言會被去掉聲調(diào),按照英文字母的形式進行輸出,例如用戶輸入場景、各大SNS社區(qū)、BBS等都有大量的這種去聲調(diào)的字符序列出現(xiàn)。這樣無疑給計算機匹配帶來巨大的困難,如果不針對去聲調(diào)的字符序列進行還原,即確定該去聲調(diào)的字符序列所對應(yīng)的語調(diào)信息,檢索系統(tǒng)無法通過對序列進行匹配,從而返回相關(guān)文檔。在后期的其他相關(guān)語義研究,比如機器翻譯、語義分析等中,也無法準(zhǔn)確地獲知用戶意圖,從而提供更準(zhǔn)確更優(yōu)質(zhì)的服務(wù)。
因此,如何確定目標(biāo)字符序列對應(yīng)的語調(diào)信息,方便后續(xù)處理,提高語言處理的效率,成為本領(lǐng)域技術(shù)人員亟需解決的問題之一。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于確定目標(biāo)字符序列對應(yīng)的語調(diào)信息的方法與設(shè)備。
根據(jù)本發(fā)明的一個方面,提供了一種由計算機實現(xiàn)的用于確定目標(biāo)字符序列所對應(yīng)的語調(diào)信息的方法,其中,該方法包括以下步驟:
a獲取待確定其語調(diào)信息的目標(biāo)字符序列;
b根據(jù)所述目標(biāo)字符序列,在一個或多個多元語言模型中進行查詢,以獲得與所述目標(biāo)字符序列相匹配的一個或多個語調(diào)索引信息,其中,所述語調(diào)索引信息與其在所述目標(biāo)字符序列中的對應(yīng)序列片段具有相同的去語調(diào)字符串;
c根據(jù)所述一個或多個語調(diào)索引信息,確定所述目標(biāo)字符序列所對應(yīng)的語調(diào)信息。
根據(jù)本發(fā)明的另一方面,還提供了一種用于確定目標(biāo)字符序列所對應(yīng)的語調(diào)信息的語調(diào)確定設(shè)備,其中,該設(shè)備包括:
序列獲取裝置,用于獲取待確定其語調(diào)信息的目標(biāo)字符序列;
索引匹配裝置,用于根據(jù)所述目標(biāo)字符序列,在一個或多個多元語言模型中進行查詢,以獲得與所述目標(biāo)字符序列相匹配的一個或多個語調(diào)索引信息,其中,所述語調(diào)索引信息與其在所述目標(biāo)字符序列中的對應(yīng)序列片段具有相同的去語調(diào)字符串;
語調(diào)確定裝置,用于根據(jù)所述一個或多個語調(diào)索引信息,確定所述目標(biāo)字符序列所對應(yīng)的語調(diào)信息。
根據(jù)本發(fā)明的又一方面,還提供了一種搜索引擎,包括如上所述的用于確定目標(biāo)字符序列所對應(yīng)的語調(diào)信息的裝置。
根據(jù)本發(fā)明的再一方面,還提供了一種搜索引擎插件,包括如上所述的用于確定目標(biāo)字符序列所對應(yīng)的語調(diào)信息的裝置。
根據(jù)本發(fā)明的再一方面,還提供了一種輸入法設(shè)備,包括如上所述的用于確定目標(biāo)字符序列所對應(yīng)的語調(diào)信息的裝置。
根據(jù)本發(fā)明的再一方面,還提供了一種輸入法插件,包括如上所述的用于確定目標(biāo)字符序列所對應(yīng)的語調(diào)信息的裝置。
與現(xiàn)有技術(shù)相比,本發(fā)明根據(jù)待確定其語調(diào)信息的目標(biāo)字符序列,在一個或多個多元語言模型中進行查詢,獲得對應(yīng)的一個或多個語調(diào)索引信息,進而確定該目標(biāo)字符序列所對應(yīng)的語調(diào)信息,方便后續(xù)處理,提高語言處理的效率。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
圖1示出根據(jù)本發(fā)明一個方面的用于確定目標(biāo)字符序列對應(yīng)的語調(diào)信息的設(shè)備示意圖;
圖2示出根據(jù)本發(fā)明另一個方面的用于確定目標(biāo)字符序列對應(yīng)的語調(diào)信息的方法流程圖。
附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實施方式
下面結(jié)合附圖對本發(fā)明作進一步詳細(xì)描述。
圖1示出根據(jù)本發(fā)明一個方面的用于確定目標(biāo)字符序列對應(yīng)的語調(diào)信息的設(shè)備示意圖;語調(diào)確定設(shè)備1包括序列獲取裝置101、索引匹配裝置102和語調(diào)確定裝置103。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210094554.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





