[發(fā)明專利]一種基于語義實(shí)現(xiàn)語句泛化的方法和裝置在審
| 申請?zhí)枺?/td> | 202110657017.4 | 申請日: | 2021-06-11 |
| 公開(公告)號: | CN113343708A | 公開(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計)人: | 陳孝良;哈玉杰;蘇少煒 | 申請(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F40/211;G06K9/62;G06Q40/02 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 郭化雨 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語義 實(shí)現(xiàn) 語句 泛化 方法 裝置 | ||
本申請實(shí)施例公開了一種基于語義實(shí)現(xiàn)語句泛化的方法和裝置,包括:對待處理語句作分詞處理,得到語句分詞;根據(jù)所述語句分詞得到擴(kuò)展句;其中,所述擴(kuò)展句是基于從所述語句分詞和所述語句分詞的同義詞中選擇相應(yīng)的分詞進(jìn)行排列組合得到的;根據(jù)所述擴(kuò)展句的分詞生成詞向量,基于所述詞向量得到擴(kuò)展句向量;計算所述擴(kuò)展句向量和語句向量的相似度;其中,所述語句向量是基于由所述語句分詞生成的詞向量得到的;獲取所述相似度滿足條件的目標(biāo)擴(kuò)展句,將所述目標(biāo)擴(kuò)展句作為語句泛化的結(jié)果,用以在配置種子話術(shù)時,減少人工枚舉的工作量,提高擴(kuò)展句的覆蓋面。
技術(shù)領(lǐng)域
本發(fā)明涉及語義識別領(lǐng)域,特別是指一種基于語義實(shí)現(xiàn)語句泛化的方法和裝置。
背景技術(shù)
計算機(jī)能夠“聽懂”人類語言是人們長期以來所追求的,而自然語言處理正是在這種需求下誕生的。自然語言處理所研究的是如何實(shí)現(xiàn)人類使用自然語言和計算機(jī)進(jìn)行有效通信,而作為自然語言處理中常見的場景,語義識別受到了人們的廣泛關(guān)注。語義識別指的是根據(jù)用戶輸入的語句識別出語義,例如接收到用戶說出的一句話“我想聽周杰倫的歌”時,計算機(jī)可以根據(jù)這句話識別出語義是想聽音樂。
通常用戶輸入的語句是口語化的,具有結(jié)構(gòu)復(fù)雜、用詞和句式多樣化等特點(diǎn),因此,為了通過用戶的一句話識別出語義,通常需要配置大量預(yù)置的話術(shù),這些預(yù)置的話術(shù)被稱為種子話術(shù)。當(dāng)獲取到用戶說的一句話時,在種子話術(shù)中找到和這句話語義接近的種子話術(shù),輸出該種子話術(shù)對應(yīng)的語義。在配置種子話術(shù)時,通常一個語義對應(yīng)有多個種子話術(shù),而基于一個語義得到多個作為種子話術(shù)的目標(biāo)擴(kuò)展句,這個過程就是基于語義實(shí)現(xiàn)語句泛化的過程。
在現(xiàn)有技術(shù)中,配置種子話術(shù)時,通常是基于語義采取人工枚舉的方式獲取多個目標(biāo)擴(kuò)展句,用以實(shí)現(xiàn)語句泛化。但是,人工枚舉這種方式需要大量的人工操作,由人工枚舉得到的目標(biāo)擴(kuò)展句覆蓋面會受到限制。
發(fā)明內(nèi)容
有鑒于此,本申請實(shí)施例提供一種基于語義實(shí)現(xiàn)語句泛化的方法和裝置,用以在配置種子話術(shù)時,減少人工枚舉的工作量,提高擴(kuò)展句的覆蓋面。
第一方面,本申請?zhí)峁┮环N基于語義實(shí)現(xiàn)語句泛化的方法,所述方法包括:
對待處理語句作分詞處理,得到語句分詞;
根據(jù)所述語句分詞得到擴(kuò)展句;其中,所述擴(kuò)展句是基于從所述語句分詞和所述語句分詞的同義詞中選擇相應(yīng)的分詞進(jìn)行排列組合得到的;
根據(jù)所述擴(kuò)展句的分詞生成詞向量,基于所述詞向量得到擴(kuò)展句向量;
計算所述擴(kuò)展句向量和語句向量的相似度;其中,所述語句向量是基于由所述語句分詞生成的詞向量得到的;
獲取所述相似度滿足條件的目標(biāo)擴(kuò)展句,將所述目標(biāo)擴(kuò)展句作為語句泛化的結(jié)果。
第二方面,本申請?zhí)峁┮环N基于語義實(shí)現(xiàn)語句泛化的裝置,所述裝置包括:
分詞單元,用于對待處理語句作分詞處理,得到語句分詞;
擴(kuò)展單元:用于根據(jù)所述語句分詞得到擴(kuò)展句;其中,所述擴(kuò)展句是基于從所述語句分詞和所述語句分詞的同義詞中選擇相應(yīng)的分詞進(jìn)行排列組合得到的;
計算單元,用于根據(jù)所述擴(kuò)展句的分詞生成詞向量,基于所述詞向量得到擴(kuò)展句向量;計算所述擴(kuò)展句向量和語句向量的相似度;其中,所述語句向量是基于由所述語句分詞生成的詞向量得到的;
獲取單元:用于獲取所述相似度滿足條件的目標(biāo)擴(kuò)展句,將所述目標(biāo)擴(kuò)展句作為語句泛化的結(jié)果。
第三方面,本申請?zhí)峁┮环N基于語義實(shí)現(xiàn)語句泛化的設(shè)備,其特征在于,所述裝置包括處理器和存儲器,其中,所述存儲器存儲有代碼,所述處理器用于調(diào)用所述存儲器中存儲的代碼,實(shí)現(xiàn)以下功能:
對待處理語句作分詞處理,得到語句分詞;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110657017.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:機(jī)械手
- 下一篇:一種加熱效率高的電磁感應(yīng)加熱裝置
- 互動業(yè)務(wù)終端、實(shí)現(xiàn)系統(tǒng)及實(shí)現(xiàn)方法
- 街景地圖的實(shí)現(xiàn)方法和實(shí)現(xiàn)系統(tǒng)
- 游戲?qū)崿F(xiàn)系統(tǒng)和游戲?qū)崿F(xiàn)方法
- 圖像實(shí)現(xiàn)裝置及其圖像實(shí)現(xiàn)方法
- 增強(qiáng)現(xiàn)實(shí)的實(shí)現(xiàn)方法以及實(shí)現(xiàn)裝置
- 軟件架構(gòu)的實(shí)現(xiàn)方法和實(shí)現(xiàn)平臺
- 數(shù)值預(yù)報的實(shí)現(xiàn)方法及實(shí)現(xiàn)系統(tǒng)
- 空調(diào)及其冬眠控制模式實(shí)現(xiàn)方法和實(shí)現(xiàn)裝置以及實(shí)現(xiàn)系統(tǒng)
- 空調(diào)及其睡眠控制模式實(shí)現(xiàn)方法和實(shí)現(xiàn)裝置以及實(shí)現(xiàn)系統(tǒng)
- 輸入設(shè)備實(shí)現(xiàn)方法及其實(shí)現(xiàn)裝置
- 基于聊天大數(shù)據(jù)知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對話控制方法和系統(tǒng)
- 基于對話知識庫的機(jī)器人對話控制方法和系統(tǒng)
- 一種自然語言語句評價方法及裝置
- 句子級雙語對齊方法及系統(tǒng)
- 一種獲取相似語句的方法、裝置、存儲介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計算機(jī)可讀存儲介質(zhì)
- 文本識別方法、裝置、電子設(shè)備和可讀存儲介質(zhì)





