[發(fā)明專利]一種內(nèi)容匹配的方法及裝置、可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011099984.5 | 申請日: | 2020-10-14 |
| 公開(公告)號: | CN112232091B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 陳海燕;錢開源;張沛宇 | 申請(專利權(quán))人: | 文思海輝智科科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/42;G06F40/289;G06F16/903 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
| 地址: | 102200 北京市昌平區(qū)未來科*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 內(nèi)容 匹配 方法 裝置 可讀 存儲 介質(zhì) | ||
本申請?zhí)峁┮环N內(nèi)容匹配的方法及裝置、可讀存儲介質(zhì)。內(nèi)容匹配的方法,包括:獲取待匹配內(nèi)容;所述待匹配內(nèi)容為UI內(nèi)容或UA內(nèi)容;根據(jù)預設(shè)斷句規(guī)則,將所述待匹配內(nèi)容拆分為待匹配字串;根據(jù)所述待匹配字串對應(yīng)的待匹配內(nèi)容獲取所述待匹配字串的屬性信息;將所述待匹配字串的屬性信息和預設(shè)翻譯記憶庫中的參考字串的屬性信息進行匹配,確定所述待匹配字串與所述參考字串的匹配類型。該方法用以完善UI和UA的匹配方式,提高UI和UA的利用率。
技術(shù)領(lǐng)域
本申請涉及翻譯技術(shù)領(lǐng)域,具體而言,涉及一種內(nèi)容匹配的方法及裝置、可讀存儲介質(zhì)。
背景技術(shù)
軟件本地化翻譯工作中主要涉及兩類文件,包含UI(User Interface,用戶界面)和UA(User Assistant,用戶幫助)文件。傳統(tǒng)技術(shù)使用TM(Translation Memory,翻譯記憶庫)存儲已翻內(nèi)容,以便復用譯文或獲取相近源文的譯文。
UA文件中大多數(shù)的段落都是包含多個句子的長文本。因為文本長度過長,這些段落不容易得到匹配,TM利用率低下。為了提高翻譯效率,傳統(tǒng)技術(shù)往往會先做斷句,再逐句翻譯,以便按句子入庫。而對于UI文件,大部分UI字串比較短,容易出現(xiàn)同一個串在不同場景(即其所屬的UI界面/功能模塊)下意義不同,所以譯文也不同。UI文件中字串的順序是無意義的,而字串ID(Identity Document,身份標識)又是唯一的,因此傳統(tǒng)技術(shù)基于UI的ID進行匹配復用。
因而,傳統(tǒng)技術(shù)中,針對UA文件,往往會斷句后翻譯,UI翻譯前不做斷句操作。進而導致,對于UI文件,長文本段不能斷句,并且UI和UA兩者之間不能很好地進行匹配,影響UI和UA文件的復用,利用率較低。
發(fā)明內(nèi)容
本申請實施例的目的在于提供一種內(nèi)容匹配的方法及裝置、可讀存儲介質(zhì),用以完善UI和UA的匹配方式,提高UI和UA的利用率。
第一方面,本申請實施例提供一種內(nèi)容匹配的方法,包括:獲取待匹配內(nèi)容;所述待匹配內(nèi)容為UI內(nèi)容或UA內(nèi)容;根據(jù)預設(shè)斷句規(guī)則,將所述待匹配內(nèi)容拆分為待匹配字串;根據(jù)所述待匹配字串對應(yīng)的待匹配內(nèi)容獲取所述待匹配字串的屬性信息;將所述待匹配字串的屬性信息和預設(shè)翻譯記憶庫中的參考字串的屬性信息進行匹配,確定所述待匹配字串與所述參考字串的匹配類型。
在本申請實施例中,針對UI內(nèi)容和UA內(nèi)容,采用相同的匹配方式,均先進行斷句得到待匹配字串,然后獲取待匹配字串的屬性信息,基于該屬性信息確定待匹配字串與翻譯記憶庫中的參考字串的匹配類型。通過這種匹配方式,一方面,基于屬性信息的匹配方式可以對UI內(nèi)容和UA內(nèi)容都進行斷句,實現(xiàn)在TM中統(tǒng)一斷句狀態(tài),便于UI內(nèi)容和UA內(nèi)容之間的正確匹配,提高UI內(nèi)容和UA內(nèi)容的利用率。另一方面,當確定匹配類型后,在對UI內(nèi)容和UA內(nèi)容進行利用時,可以結(jié)合匹配類型考慮是否對其進行利用,或者根據(jù)匹配類型選擇應(yīng)用方式,進而提高UI內(nèi)容和UA內(nèi)容的利用率。
作為一種可能的實現(xiàn)方式,所述屬性信息包括:文本屬性和附加屬性;所述附加屬性包括:上下文屬性、標識屬性和組件名屬性中的至少一項。
在本申請實施例中,屬性信息中包括基本的文本屬性,以及能夠?qū)崿F(xiàn)UI內(nèi)容和UA內(nèi)容之間的正確匹配的上下文屬性、標識屬性和組件名屬性中的至少一種屬性,若采用一種屬性,則能夠通過該種屬性進行針對性的匹配,實現(xiàn)快速匹配;若采用多種屬性,則能夠基于不同類型的屬性實現(xiàn)更準確地匹配;從而提高匹配率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于文思海輝智科科技有限公司,未經(jīng)文思海輝智科科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011099984.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





