[發明專利]轉換表達方式的方法和裝置有效
| 申請號: | 01116236.8 | 申請日: | 2001-03-12 |
| 公開(公告)號: | CN1319836A | 公開(公告)日: | 2001-10-31 |
| 發明(設計)人: | 脅田由實;松井謙二 | 申請(專利權)人: | 松下電器產業株式會社 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00 |
| 代理公司: | 上海專利商標事務所 | 代理人: | 孫敬國 |
| 地址: | 日本國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 轉換 表達方式 方法 裝置 | ||
本發明涉及一種轉換輸入句子的表達方式并輸出經過轉換的輸入句子的表達方式的表達方式轉換方法、表達方式轉換裝置以及程序,例如,一種執行語言轉換比如書面語翻譯或口語翻譯、將書面語言轉換為口語語言的句子模式轉換或概述一個復雜或冗長的句子并輸出概要的概要生成的表達方式轉換方法、表達方式轉換裝置以及程序。
下文以翻譯軟件程序作為常規技術的實例。
翻譯軟件程序包括語音識別裝置和語言翻譯裝置,并通過如下的方式實現翻譯:連續地執行語音識別以將以聲音信號輸入的聲音句子轉換為以文字串表示的輸出句子,并連續地執行作為表達方式轉換的語言翻譯以將以文字串表示的輸入句子翻譯成另一種語言的句子。
按如上所描述的方式執行語言翻譯的語言翻譯裝置包括分析輸入句子的語法或語義結構的語言分析裝置、基于所分析的結果將輸入句子轉換成另一種語言的語言轉換裝置以及從所翻譯的結果中產生自然語言輸出句子的輸出句子生成裝置。
在口語翻譯軟件程序以及一些書面翻譯軟件程序中,為正確地翻譯不符合語法的不規則的表達方式(經常應用在口語中),經常應用這樣的一種技術:依據語法規則并不能進行語法分析,但是可以學習類似于實際輸入的句子的例句,并且可以搜索類似的例句以進行語言分析。參看在附圖8中所示的實例來描述這種常規的翻譯軟件程序的實例。
在此描述將日語聲音的句子翻譯成英語聲音的句子情況實例。要翻譯的語言稱為原始語言,原始語言所翻譯成的語言稱為目標語言。
在進行翻譯之前,從附圖8的雙語言資料庫1中提取聲音語言的規則。在雙語言資料庫中1中,寫有許多雙語言聲音例句,這些雙語言聲音句子每個都包括一對彼此對等的日語聲音例句和英語聲音例句。在附圖9-1(a)中所示的在雙語言資料庫1中所寫的雙語言聲音例句的實例為雙語言聲音例句70。
在此考慮這樣的情況:當發出該句子的聲音時遺漏或錯誤地識別了某些字詞,將每個聲音例句都分成最小的單元作為語義單元(下文中稱為短語),并生成短語規則和短語間的依賴關系規則。
首先,短語確定裝置61將雙語言聲音例句分成短語。在附圖9-1(b)中,示出了所獲得雙語言短語作為雙語言短語(A)71和雙語言短語(B)72。
然后,雙語言短語字典產生部分62以一定格式建立相關的短語字典62,在該字典中將在短語中的內容字轉換為變量。
例如,在附圖9-1(a)中所示的雙語言聲音例句70包括聲音例句“Heya?noyoyakuo?onegai?shitain?desuga(打不出來)”和“I’d?like?toreserve?a?room,”將該例句劃分為如下的兩個雙語言短語:(A)“heya?no?yoyaku()”以及“reserve?a?room”作為雙語言短語(A)71;以及(B)“onegaishitain?desuga()”和“I’d?like?to”作為雙語言短語(B)72。
通過應用如在附圖9-2(e)中所示前文中所產生的分類詞匯表64,內容字比如“heya()”、“yoyaku()”以及“onegai()”都分別以變量X、Y和Z表示。在此所分類的詞匯表64是一種列出了內容字的表,變量將內容字作為它們的值。例如,變量X取值比如“heya()”或“kaigishitsu()”或“kumma()”,內容字“heya()”是變量X可以取的值。因此,雙語言短語(A)71的內容字“heya()”可以以變量X替換。
在這種方式中,兩個雙語言短語規則(A)“X?no?Y()”“YX”以及(B)“Z?shitain?desuga()”“I’d?like?to”都寫在雙語言短語字典62中。
如附圖9-2(d)所示,為了將短語的順序關系作為短語間規則63的規則,短語間關系比如“(A)o(B)((A)在(B))”“(B)(A)”都存儲在短語間規則表63中。在雙語言資料庫1中執行對所有的聲音句子的這種處理。
在執行翻譯的過程中,首先將原始語言聲音輸入到語音識別裝置64中。語音識別裝置64輸出在聲音上最類似的字串作為語音識別選擇,例如從在雙語言短語字典62中所書寫的字串中輸出作為從以短語間規則63書寫的短語串中能夠推測的短語和字串。
語言翻譯裝置65接收以這種方式識別的連續字串、將所輸入的連續的字串轉換成在雙語言短語字典62中所書寫的短語串并搜索與每個短語串相對應的短語間規則63。然后語言翻譯裝置65基于與每個短語對等的目標語言短語和目標語言的短語間規則將輸入的原始語言識別結果句子轉換為目標語言句子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于松下電器產業株式會社,未經松下電器產業株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/01116236.8/2.html,轉載請聲明來源鉆瓜專利網。





