[發(fā)明專利]一種用戶意圖確定方法及裝置在審
| 申請?zhí)枺?/td> | 202110671730.4 | 申請日: | 2021-06-17 |
| 公開(公告)號: | CN113326351A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計(jì))人: | 李林峰;黃海榮 | 申請(專利權(quán))人: | 湖北億咖通科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/35;G06K9/62;G06N3/04;G06N3/08;G10L15/22 |
| 代理公司: | 北京柏杉松知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 項(xiàng)京;趙元 |
| 地址: | 430056 湖北省武漢市經(jīng)濟(jì)技術(shù)開發(fā)區(qū)南*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 意圖 確定 方法 裝置 | ||
本發(fā)明實(shí)施例提供了一種用戶意圖確定方法及裝置,上述方法包括:對待識別語音信息進(jìn)行文字轉(zhuǎn)換,得到待識別語音信息對應(yīng)的目標(biāo)文字;將目標(biāo)文字輸入至預(yù)先訓(xùn)練的用戶意圖識別模型;基于用戶意圖識別模型,提取目標(biāo)文字的目標(biāo)特征,獲取目標(biāo)特征映射到的每一預(yù)設(shè)垂域意圖的第一概率以及映射到的每一預(yù)設(shè)子功能意圖的第二概率;其中,每一預(yù)設(shè)子功能意圖屬于一預(yù)設(shè)垂域意圖;基于最高的第一概率對應(yīng)的預(yù)設(shè)垂域意圖和最高的第二概率對應(yīng)的預(yù)設(shè)子功能意圖之間的對應(yīng)關(guān)系,確定待識別語音信息對應(yīng)的用戶意圖。采用上述方法減小了識別出垂域意圖和子功能意圖的模型網(wǎng)絡(luò)規(guī)模和計(jì)算量。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及一種用戶意圖確定方法及裝置。
背景技術(shù)
目前,在很多人機(jī)語音交互的應(yīng)用場景下,需要對用戶語音信息進(jìn)行識別,得到用戶意圖,為用戶提供匹配用戶意圖的服務(wù)。例如車輛內(nèi)的人機(jī)語音交互系統(tǒng)可以接收車輛內(nèi)人員的語音信息,基于語音信息識別出用戶意圖,如接收到用戶說的語音信息“我要聽音樂”,可以通過對語音信息“我要聽音樂”進(jìn)行用戶意圖識別,識別出用戶意圖是聽音樂,可以根據(jù)用戶意圖為用戶播放音樂。
現(xiàn)有技術(shù)中通常采用神經(jīng)網(wǎng)絡(luò)分類模型針對用戶語音信息進(jìn)行用戶意圖識別,用戶意圖一般分為垂域意圖以及垂域下的多個(gè)子功能意圖。其中,子功能意圖為針對垂域意圖進(jìn)行細(xì)化后的子類別意圖,例如,若垂域意圖包括:導(dǎo)航和音樂,則子功能意圖包括導(dǎo)航和音樂的子類別意圖:導(dǎo)航到目的地、導(dǎo)航到目的地走高速、導(dǎo)航到目的地不走高速、播放某個(gè)歌手的音樂和播放某個(gè)歌手的某一首歌等。
目前,若要識別用戶意圖,一般分別訓(xùn)練出針對垂域意圖的分類模型和針對垂域下的子功能意圖的分類模型,利用兩種分類模型針對用戶語音信息進(jìn)行用戶意圖識別,得到2種用戶意圖。由于需要使用兩種獨(dú)立的分類模型,因此存在模型網(wǎng)絡(luò)規(guī)模較大和計(jì)算量大的問題。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種用戶意圖確定方法及裝置,以減小識別垂域意圖和子功能意圖的模型網(wǎng)絡(luò)規(guī)模和計(jì)算量。
為了達(dá)到上述目標(biāo),本發(fā)明實(shí)施例提供了一種用戶意圖確定方法,包括:
對待識別語音信息進(jìn)行文字轉(zhuǎn)換,得到所述待識別語音信息對應(yīng)的目標(biāo)文字;
將所述目標(biāo)文字輸入至預(yù)先訓(xùn)練的用戶意圖識別模型;
基于所述用戶意圖識別模型,提取所述目標(biāo)文字的目標(biāo)特征,獲取所述目標(biāo)特征映射到的每一預(yù)設(shè)垂域意圖的第一概率以及映射到的每一預(yù)設(shè)子功能意圖的第二概率;其中,每一預(yù)設(shè)子功能意圖屬于一預(yù)設(shè)垂域意圖;
基于最高的所述第一概率對應(yīng)的預(yù)設(shè)垂域意圖和最高的所述第二概率對應(yīng)的預(yù)設(shè)子功能意圖之間的對應(yīng)關(guān)系,確定待識別語音信息對應(yīng)的用戶意圖。
可選的,所述基于最高的所述第一概率對應(yīng)的預(yù)設(shè)垂域意圖和最高的所述第二概率對應(yīng)的預(yù)設(shè)子功能意圖之間的對應(yīng)關(guān)系,確定待識別語音信息對應(yīng)的用戶意圖,包括:
根據(jù)第一概率獲取目標(biāo)垂域意圖以及根據(jù)第二概率獲取第一目標(biāo)子功能意圖,其中,所述第一目標(biāo)子功能意圖為最高的第二概率對應(yīng)的預(yù)設(shè)子功能意圖,所述目標(biāo)垂域意圖為最高的第一概率對應(yīng)的預(yù)設(shè)垂域意圖;
判斷所述第一目標(biāo)子功能意圖所屬的預(yù)設(shè)垂域意圖與所述目標(biāo)垂域意圖是否一致;
若判斷結(jié)果為是,將所述第一目標(biāo)子功能意圖確定為目標(biāo)用戶意圖。
可選的,在所述判斷所述第一目標(biāo)子功能意圖所屬的預(yù)設(shè)垂域意圖與所述目標(biāo)垂域意圖是否一致之后,還包括:
根據(jù)第二概率從屬于所述目標(biāo)垂域意圖的各個(gè)預(yù)設(shè)子功能意圖中獲取第二目標(biāo)子功能意圖,將所述第二目標(biāo)子功能意圖確定為目標(biāo)用戶意圖,其中,所述第二目標(biāo)子功能意圖為:屬于所述目標(biāo)垂域意圖的各個(gè)預(yù)設(shè)子功能意圖中,最高的第二概率對應(yīng)的預(yù)設(shè)子功能意圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖北億咖通科技有限公司,未經(jīng)湖北億咖通科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110671730.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計(jì)裝置以及意圖估計(jì)方法
- 意圖識別方法、裝置、設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 意圖確認(rèn)方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





