[發(fā)明專利]語音數(shù)據(jù)句類識別方法和裝置及系統(tǒng)有效
申請?zhí)枺?/td> | 201611185200.4 | 申請日: | 2016-12-20 |
公開(公告)號: | CN106710588B | 公開(公告)日: | 2020-06-02 |
發(fā)明(設計)人: | 李莉;司華建;李寶善 | 申請(專利權)人: | 科大訊飛股份有限公司 |
主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/18;G10L15/30;G10L25/21 |
代理公司: | 北京清亦華知識產(chǎn)權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 語音 數(shù)據(jù) 識別 方法 裝置 系統(tǒng) | ||
本申請?zhí)岢鲆环N語音數(shù)據(jù)句類識別方法和裝置及系統(tǒng),該方法包括:接收待識別的語音數(shù)據(jù);獲取所述語音數(shù)據(jù)的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;根據(jù)預先構建的句類識別模型和所述句類識別特征,識別所述語音數(shù)據(jù)的句類,所述句類識別模型根據(jù)獲取的語音數(shù)據(jù)樣本的句類識別特征構建得到。該方法能夠解決依據(jù)規(guī)則識別句類的局限性,擴展使用范圍,并且可以提高識別準確度。
技術領域
本申請涉及自然語言處理技術領域,尤其涉及一種語音數(shù)據(jù)句類識別方法和裝置及系統(tǒng)。
背景技術
語音數(shù)據(jù)的句類指按照語音數(shù)據(jù)中句子的語氣,將句子劃分的類型,如陳述句、祈使句、感嘆句、一般疑問句及特殊疑問句等,不同句類的句子往往具有不同語義,單純從文本語義上很難區(qū)分開,如在智能問答系統(tǒng)中,語音數(shù)據(jù)“我開通了幾個增值服務”和“我開通了哪幾個增值服務”,二者僅差一個字,但語義完全不同,答案也完全不同,通過句類識別后,得到這兩句語音數(shù)據(jù)分別屬于不同的句類,第一句的句類為數(shù)量類疑問句,第二句的句類為實體類疑問句。為了提高反饋給用戶的答案的準確度,關鍵點之一是識別語音數(shù)據(jù)的句類。
相關技術中,語音數(shù)據(jù)句類識別方法一般通過編寫每種句類的規(guī)則,將待識別語音數(shù)據(jù)對應的識別文本與規(guī)則進行匹配,識別出語音數(shù)據(jù)句類,比如依據(jù)包含的關鍵詞識別。然而,由于自然語言的多樣性,單純通過規(guī)則從文本上匹配,局限性較大,很難準確區(qū)分出不同語音數(shù)據(jù)的句類,尤其是包含相同關鍵詞的語音數(shù)據(jù),更難準確區(qū)分出語音數(shù)據(jù)的句類,如語音數(shù)據(jù)“怎么用這么快我的話費”和語音數(shù)據(jù)“怎么查詢話費”,包含共同的疑問詞“怎么”,但是句類不同,第一句為原因類疑問句,第二句為方式類疑問句,僅僅通過規(guī)則的方式很難區(qū)分;此外,相關技術的方法一般只針對疑問句的句類識別,對陳述句、祈使句、感嘆句等非疑問句識別效果較差,應用范圍較小,實用性差。
發(fā)明內容
本申請旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本申請的一個目的在于提出一種語音數(shù)據(jù)句類識別方法,該方法可以解決依據(jù)規(guī)則識別句類的局限性,擴展使用范圍,并且可以提高識別準確度。
本申請的另一個目的在于提出一種語音數(shù)據(jù)句類識別裝置。
本申請的另一個目的在于提出一種語音數(shù)據(jù)句類識別系統(tǒng)。
為達到上述目的,本申請第一方面實施例提出的語音數(shù)據(jù)句類識別方法,包括:接收待識別的語音數(shù)據(jù);獲取所述語音數(shù)據(jù)的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;根據(jù)預先構建的句類識別模型和所述句類識別特征,識別所述語音數(shù)據(jù)的句類,所述句類識別模型根據(jù)獲取的語音數(shù)據(jù)樣本的句類識別特征構建得到。
本申請第一方面實施例提出的語音數(shù)據(jù)句類識別方法,通過依據(jù)句類識別模型對語音數(shù)據(jù)的句類進行識別,可以有效解決依據(jù)規(guī)則進行識別的局限性,擴展使用范圍,以及依據(jù)聲學上和語義上的特征進行識別,可以提高識別準確度。
為達到上述目的,本申請第二方面實施例提出的語音數(shù)據(jù)句類識別裝置,包括:接收模塊,用于接收待識別的語音數(shù)據(jù);獲取模塊,用于獲取所述語音數(shù)據(jù)的句類識別特征,所述句類識別特征包括如下項中的至少一項:聲學句類識別特征,語義句類識別特征;識別模塊,用于根據(jù)預先構建的句類識別模型和所述句類識別特征,識別所述語音數(shù)據(jù)的句類,所述句類識別模型根據(jù)獲取的語音數(shù)據(jù)樣本的句類識別特征構建得到。
本申請第二方面實施例提出的語音數(shù)據(jù)句類識別裝置,通過依據(jù)句類識別模型對語音數(shù)據(jù)的句類進行識別,可以有效解決依據(jù)規(guī)則進行識別的局限性,擴展使用范圍,以及依據(jù)聲學上和語義上的特征進行識別,可以提高識別準確度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611185200.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種非開挖涉水管道內壁修復材料及其制備方法
- 下一篇:圖片推薦方法和裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置