[發(fā)明專利]語音識別文本連貫性處理方法和裝置有效
| 申請?zhí)枺?/td> | 202010694673.7 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111832308B | 公開(公告)日: | 2023-09-08 |
| 發(fā)明(設計)人: | 繆慶亮;吳仁守;朱欽佩;朱少華 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06F40/211;G10L15/26 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;鄧婷婷 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 文本 連貫性 處理 方法 裝置 | ||
本發(fā)明公開一種語音識別文本連貫性處理方法和裝置,其中,語音識別文本連貫性處理方法,包括:識別出語音識別文本中的至少一個關鍵信息的起始位置;從起始位置開始取多個句子,根據(jù)句子中的每個詞或每個詞組的第一詞嵌入計算與句子對應的第二詞嵌入,根據(jù)第二詞嵌入計算文本片段對應的第三詞嵌入;至少基于第一詞嵌入、第二詞嵌入和第三詞嵌入計算句子與其他句子之間的相似度、句子與起始句子之間的距離衰減以及句子與起始句子之間的連貫度;基于相似度構建語義圖,并根據(jù)語義圖計算句子的重要程度;利用圖聚類算法獲取一個或多個聚類中心,計算相似度、連貫度、重要程度與距離衰減的和值,取和值排名前n的句子作為連貫句子序列。
技術領域
本發(fā)明屬于語音識別后處理技術領域,尤其涉及語音識別文本連貫性處理方法和裝置。
背景技術
相關技術中,語音識別系統(tǒng)ASR(Automatic?Speech?Recognition)識別結果中句子的斷句存在錯誤,導致語音轉寫后的文本在進行質檢和會議摘要等文本分析時出現(xiàn)問題。文本分析系統(tǒng)面臨著ASR識別結果不連貫等問題。
目前判斷句子是否連貫的方法主要有:
基于聲學特征的方法:根據(jù)人在說話時的停頓或者韻律(prosody)進行整句的預測。
基于文本特征的方法:使用語言模型建模或者序列標注建模來預測某個詞后面是否是句子結束的標志。
發(fā)明內容
本發(fā)明實施例提供一種語音識別文本連貫性處理方法及裝置,用于至少解決上述技術問題之一。
第一方面,本發(fā)明實施例提供一種語音識別文本連貫性處理方法,包括:通過預設分類模板或者預設分類模型識別出語音識別文本中的至少一個關鍵信息的起始位置,其中所述預設分類模板或所述預設分類模型均是基于預設關鍵字形成,所述關鍵信息為與所述預設關鍵字對應的內容;從所述起始位置開始取多個句子,根據(jù)每一句子中的每個詞或每個詞組的第一詞嵌入計算與所述每一句子對應的第二詞嵌入,根據(jù)所述第二詞嵌入計算所述多個句子組成的文本片段對應的第三詞嵌入;至少基于所述第一詞嵌入、所述第二詞嵌入和所述第三詞嵌入計算所述每一句子與其他句子之間的相似度、所述每一句子與起始句子之間的距離衰減以及每一句子與起始句子之間的連貫度;基于所述相似度構建語義圖,并根據(jù)所述語義圖計算所述每一句子的重要程度;利用圖聚類算法獲取一個或多個聚類中心,計算每個聚類中心的相似度、連貫度、重要程度與距離衰減的和值,取和值排名前n的句子作為連貫句子序列。
第二方面,本發(fā)明實施例提供一種語音識別文本連貫性處理裝置,包括:識別模塊,配置為通過預設分類模板或者預設分類模型識別出語音識別文本中的至少一個關鍵信息的起始位置,其中所述預設分類模板或所述預設分類模型均是基于預設關鍵字形成,所述關鍵信息為與所述預設關鍵字對應的內容;嵌入模塊,配置為從所述起始位置開始取多個句子,根據(jù)每一句子中的每個詞或每個詞組的第一詞嵌入計算與所述每一句子對應的第二詞嵌入,根據(jù)所述第二詞嵌入計算所述多個句子組成的文本片段對應的第三詞嵌入;第一計算模塊,配置為至少基于所述第一詞嵌入、所述第二詞嵌入和所述第三詞嵌入計算所述每一句子與其他句子之間的相似度、所述每一句子與起始句子之間的距離衰減以及每一句子與起始句子之間的連貫度;構建模塊,配置為基于所述相似度構建語義圖,并根據(jù)所述語義圖計算所述每一句子的重要程度;以及第二計算模塊,配置為利用圖聚類算法獲取一個或多個聚類中心,計算每個聚類中心的相似度、連貫度、重要程度與距離衰減的和值,取和值排名前n的句子作為連貫句子序列。
第三方面,提供一種計算機程序產品,所述計算機程序產品包括存儲在非易失性計算機可讀存儲介質上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執(zhí)行時,使所述計算機執(zhí)行第一方面所述的語音識別文本連貫性處理方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010694673.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





