[發(fā)明專利]文本規(guī)整方法及裝置在審
| 申請?zhí)枺?/td> | 201910023851.0 | 申請日: | 2019-01-10 |
| 公開(公告)號: | CN111435595A | 公開(公告)日: | 2020-07-21 |
| 發(fā)明(設計)人: | 趙超 | 申請(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司;搜狗(杭州)智能科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/25;G10L15/02;G06F40/289;G06F40/30;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京華圣典睿知識產(chǎn)權(quán)代理有限公司 11510 | 代理人: | 趙景平 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 規(guī)整 方法 裝置 | ||
本發(fā)明公開了一種文本規(guī)整方法及裝置,所述方法包括:獲取語音數(shù)據(jù)及所述語音數(shù)據(jù)對應的識別文本;獲取所述識別文本中的詞單元及所述詞單元對應的詞向量;提取規(guī)整特征,具體包括從所述語音數(shù)據(jù)中提取語音特征,并從所述識別文本中提取文本特征;將所述詞向量及所述規(guī)整特征對應的特征向量輸入預先構(gòu)建的文本規(guī)整模型,根據(jù)所述文本規(guī)整模型的輸出得到所述詞單元對應的標簽,所述標簽至少包括:刪除;根據(jù)所述詞單元對應的標簽對所述識別文本進行規(guī)整,得到規(guī)整后的語音識別文本。利用本發(fā)明方案,可以使口語化的語音識別文本更具理解性及表達規(guī)范性。
技術(shù)領(lǐng)域
本發(fā)明涉及文本處理領(lǐng)域,具體涉及一種文本規(guī)整方法及裝置。
背景技術(shù)
同聲傳譯,簡稱“同傳”,是指在不打斷講話者的條件下,將講話內(nèi)容不間斷的實時的翻譯給聽眾。其最大的特點在于效率高,聽眾可以及時地獲取信息,被廣泛地應用于國際會議、外交談判等重要場合。目前,隨著人工智能技術(shù)的發(fā)展,出現(xiàn)了機器同傳,機器同傳最大的優(yōu)勢是不會因為疲倦而導致譯出率下降。但由于機器同傳受限于語音識別及機器翻譯技術(shù),目前機器同傳的總體翻譯質(zhì)量與人工同傳相比還有較大差距,尤其是在一些演講場合,演講者往往根據(jù)主題以及思路即興演講,演講過程中會出現(xiàn)語義不完整、重復、語氣詞等口語化表達,這種現(xiàn)象會影響后續(xù)的翻譯質(zhì)量,甚至會導致翻譯完全錯誤。針對這種情況,現(xiàn)有的機器同傳產(chǎn)品通常采用基于規(guī)則的方法去除其中的一些口語化表達詞,但效果不佳,進而會使后續(xù)機器同傳的效果受到較大影響。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種文本規(guī)整方法及裝置,以使語音識別文本更具理解性及表達規(guī)范性。
為此,本發(fā)明提供如下技術(shù)方案:
一種文本規(guī)整方法,所述方法包括:
獲取語音數(shù)據(jù)及所述語音數(shù)據(jù)對應的識別文本;
獲取所述識別文本中的詞單元及所述詞單元對應的詞向量;
提取規(guī)整特征,具體包括從所述語音數(shù)據(jù)中提取語音特征,并從所述識別文本中提取文本特征;
將所述詞向量及所述規(guī)整特征對應的特征向量輸入預先構(gòu)建的文本規(guī)整模型,根據(jù)所述文本規(guī)整模型的輸出得到所述詞單元對應的標簽,所述標簽至少包括:刪除;
根據(jù)所述詞單元對應的標簽對所述識別文本進行規(guī)整,得到規(guī)整后的語音識別文本。
可選地,所述文本特征包括以下任意一項或多項:詞性特征、Ngram重復特征、臨近詞模糊匹配得分。
可選地,所述語音特征包括以下任意一項或多項:基頻特征、停頓特征、能量特征。
可選地,所述根據(jù)所述詞單元對應的標簽對所述識別文本進行規(guī)整,得到規(guī)整后的文本包括:
刪除所述識別文本中標簽為刪除的詞單元,得到規(guī)整后的文本。
可選地,在獲取所述識別文本中的各詞單元及所述詞單元對應的詞向量之前,所述方法還包括:
濾除所述識別文本中的語氣詞。
可選地,所述方法還包括:
獲取與所述語音數(shù)據(jù)同步的說話人口型信息;
所述提取規(guī)整特征還包括:
從所述口型信息中提取口型特征。
一種文本規(guī)整裝置,所述裝置包括:
語音接收模塊,用于獲取語音數(shù)據(jù);
識別文本獲取模塊,用于獲取所述語音數(shù)據(jù)對應的識別文本;
詞單元獲取模塊,用于獲取所述識別文本中的各詞單元及所述詞單元對應的詞向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司;搜狗(杭州)智能科技有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司;搜狗(杭州)智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910023851.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:控制面板、其制造方法及具有其的洗衣機
- 下一篇:請求分發(fā)方法和裝置





