[發(fā)明專利]一種基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別方法、裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202310241322.4 | 申請(qǐng)日: | 2023-03-14 |
| 公開(kāi)(公告)號(hào): | CN116343771A | 公開(kāi)(公告)日: | 2023-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 張煒瑋;李龍飛;林孟超;盧杰;陳彩可;李浩;李曉琴 | 申請(qǐng)(專利權(quán))人: | 中國(guó)第一汽車股份有限公司;一汽(北京)軟件科技有限公司 |
| 主分類號(hào): | G10L15/08 | 分類號(hào): | G10L15/08;G10L15/22 |
| 代理公司: | 北京翔宇專利代理事務(wù)所(普通合伙) 11960 | 代理人: | 田昱川 |
| 地址: | 130011 吉林省長(zhǎng)*** | 國(guó)省代碼: | 吉林;22 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 知識(shí) 圖譜 音樂(lè) 點(diǎn)播 語(yǔ)音 指令 識(shí)別 方法 裝置 | ||
本發(fā)明公開(kāi)了一種基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別方法、裝置,所述基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別方法包括:獲取用戶點(diǎn)播音樂(lè)的需求語(yǔ)音信號(hào);對(duì)所述需求語(yǔ)音信號(hào)進(jìn)行語(yǔ)義分析,獲得模糊需求特征;根據(jù)所述模糊需求特征在預(yù)設(shè)音樂(lè)知識(shí)圖譜中獲取精確音樂(lè)需求內(nèi)容;根據(jù)所述精確音樂(lè)需求內(nèi)容或根據(jù)所述模糊需求特征以及精確音樂(lè)需求內(nèi)容生成搜索關(guān)鍵詞;根據(jù)所述搜索關(guān)鍵詞獲取待播放內(nèi)容。本發(fā)明通過(guò)結(jié)合音樂(lè)知識(shí)圖譜對(duì)用戶發(fā)出的帶有指代含義的語(yǔ)音點(diǎn)播指令進(jìn)行識(shí)別,根據(jù)識(shí)別結(jié)果獲取精確音樂(lè)需求內(nèi)容,進(jìn)而根據(jù)精確音樂(lè)需求內(nèi)容獲取用戶實(shí)際想要聽(tīng)到的音樂(lè)資源,提升語(yǔ)音指令指代實(shí)體的理解能力及準(zhǔn)確率,優(yōu)化用戶體驗(yàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音指令識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別方法、基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別裝置及電子設(shè)備。
背景技術(shù)
隨著人工智能技術(shù)的發(fā)展,越來(lái)越多的領(lǐng)域引入了語(yǔ)音作為一種新的交互方式,人們逐漸習(xí)慣通過(guò)語(yǔ)音助手來(lái)點(diǎn)播歌曲、相聲、有聲書(shū)等。為了滿足用戶點(diǎn)播需求,當(dāng)前常用的實(shí)現(xiàn)方法是在NLU識(shí)別環(huán)節(jié),識(shí)別出媒介類型信息和條件信息,采用娛樂(lè)應(yīng)用的搜索接口來(lái)搜索符合條件的內(nèi)容,通過(guò)娛樂(lè)應(yīng)用播放待播內(nèi)容。NLU識(shí)別出點(diǎn)播內(nèi)容的媒介類型(如歌曲、有聲節(jié)目、視頻);針對(duì)不同的媒介類型,識(shí)別出該媒介的關(guān)鍵信息,比如對(duì)于歌曲類媒介,會(huì)識(shí)別出歌曲的歌手名、歌曲名、曲風(fēng)流派等信息,對(duì)于有聲節(jié)目類媒介,會(huì)識(shí)別出演播者、專輯名、分類等信息。比如,當(dāng)用戶說(shuō)“播放歌手A的XXX”,能夠識(shí)別出:媒介類型是歌曲、條件1是歌手名A、條件2是歌曲名XXX;通過(guò)一定的搜索規(guī)則定義,在音樂(lè)應(yīng)用的搜索接口,搜索關(guān)鍵詞“XXX?A”,獲取搜索結(jié)果,播放符合條件的歌曲,這種方法在用戶語(yǔ)音中包含的信息比較完整時(shí),能夠有比較好的搜索效果。
但是隨著人們對(duì)語(yǔ)音助手的智能化期待,當(dāng)用戶點(diǎn)播歌曲時(shí),經(jīng)常會(huì)用比較口語(yǔ)化的表達(dá)方式,期望語(yǔ)音助手能夠像人類一樣理解用戶所說(shuō)。比如用戶會(huì)說(shuō)“我想聽(tīng)歌曲XXX的原唱版”,期待語(yǔ)音助手能夠播放符合條件的歌曲。目前關(guān)于音樂(lè)領(lǐng)域的NLU識(shí)別,主要是識(shí)別出歌曲名、歌手名、標(biāo)簽等信息,不能把相關(guān)信息補(bǔ)全,相當(dāng)于只是機(jī)械性的提取關(guān)鍵詞,目前僅能識(shí)別出:用戶意圖是“聽(tīng)歌”,歌曲的名稱是“XXX”,還有個(gè)條件是“原唱版”;使用搜索關(guān)鍵詞“XXX原唱版”在音樂(lè)應(yīng)用進(jìn)行搜索時(shí),獲得的搜索結(jié)果基本都是不符合搜索條件的,因此,目前需要一種對(duì)于包含指代性信息的用戶語(yǔ)音指令進(jìn)行準(zhǔn)確識(shí)別的技術(shù)方案來(lái)解決上述問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別方法、基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別裝置,來(lái)至少解決上述的一個(gè)技術(shù)問(wèn)題。
本發(fā)明提供了下述方案:
一種基于知識(shí)圖譜的音樂(lè)點(diǎn)播語(yǔ)音指令識(shí)別方法,包括:
獲取用戶點(diǎn)播音樂(lè)的需求語(yǔ)音信號(hào);
對(duì)所述需求語(yǔ)音信號(hào)進(jìn)行語(yǔ)義分析,獲得模糊需求特征;
根據(jù)所述模糊需求特征在預(yù)設(shè)音樂(lè)知識(shí)圖譜中獲取精確音樂(lè)需求內(nèi)容;
根據(jù)所述精確音樂(lè)需求內(nèi)容或根據(jù)所述模糊需求特征以及精確音樂(lè)需求內(nèi)容生成搜索關(guān)鍵詞;
根據(jù)所述搜索關(guān)鍵詞獲取待播放內(nèi)容。
可選地,所述對(duì)所述需求語(yǔ)音信號(hào)進(jìn)行語(yǔ)義分析包括:
對(duì)所述需求語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別,獲得語(yǔ)音識(shí)別文本;
對(duì)所述語(yǔ)音識(shí)別文本進(jìn)行特征提取,獲得模糊需求特征。
可選地,所述預(yù)設(shè)音樂(lè)知識(shí)圖譜包括至少一個(gè)第一音樂(lè)知識(shí)節(jié)點(diǎn)以及至少一個(gè)第二音樂(lè)知識(shí)節(jié)點(diǎn),一個(gè)第一音樂(lè)知識(shí)節(jié)點(diǎn)至少與一個(gè)第二音樂(lè)知識(shí)節(jié)點(diǎn)之間具有關(guān)聯(lián)關(guān)系,其中,
每個(gè)音樂(lè)知識(shí)節(jié)點(diǎn)包括如下中的一種:
歌曲基本信息、歌曲相關(guān)影視信息、歌曲相關(guān)歌手信息;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)第一汽車股份有限公司;一汽(北京)軟件科技有限公司,未經(jīng)中國(guó)第一汽車股份有限公司;一汽(北京)軟件科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310241322.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識(shí)圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識(shí)圖譜的構(gòu)建方法、裝置、知識(shí)圖譜系統(tǒng)及設(shè)備
- 一種基于知識(shí)圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于創(chuàng)建知識(shí)圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 音樂(lè)文件提供方法及其提供系統(tǒng)
- 一種獲取關(guān)聯(lián)音樂(lè)信息的方法、系統(tǒng)及移動(dòng)終端
- 一種音樂(lè)搜索方法、裝置及終端設(shè)備
- 音樂(lè)推薦方法、裝置及終端
- 場(chǎng)景音樂(lè)搜索方法及場(chǎng)景音樂(lè)搜索裝置
- 一種音樂(lè)播放方法和系統(tǒng)
- 音樂(lè)生成、播放、識(shí)別方法、裝置及存儲(chǔ)介質(zhì)
- 音樂(lè)檢索方法及裝置
- 音樂(lè)標(biāo)簽的關(guān)聯(lián)方法、裝置及存儲(chǔ)介質(zhì)
- 一種嵌入式音樂(lè)控制系統(tǒng)





