[發(fā)明專利]一種機器語言生成方法及裝置有效
| 申請?zhí)枺?/td> | 201610207754.3 | 申請日: | 2016-04-01 |
| 公開(公告)號: | CN107291701B | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設(shè)計)人: | 黎檳華;江會星;孫健;初敏 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/42 | 分類號: | G06F40/42 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 諸佩艷 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機器語言 生成 方法 裝置 | ||
本發(fā)明公開了一種機器語言生成方法及裝置,所述機器語言生成方法接收輸入語句,根據(jù)預(yù)設(shè)的框架模型得到輸入語句對應(yīng)的框架列表,并將輸入語句輸入到預(yù)設(shè)的語言生成模型,生成符合框架列表中任一框架的回復(fù)語句輸出。本發(fā)明機器語言生成裝置包括框架生成模塊和語句生成模塊。本發(fā)明的方法及裝置在生成回復(fù)語句時,逐步根據(jù)上文生成多個候選下文,選擇概率最大的候選下文作為獲選下文,從而保證了生成的回復(fù)語句的通順,同時與框架模型產(chǎn)生的框架相結(jié)合,保證了回復(fù)語句包含了一定的固定結(jié)構(gòu),使得回復(fù)語句在包含框架的前提下又非常通順,更加符合語意和人類的自然語言,給人更好的體驗。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能技術(shù)領(lǐng)域,尤其涉及一種機器語言生成方法及裝置。
背景技術(shù)
隨著科技的發(fā)展,人工智能逐漸開始進入工業(yè)、商業(yè)和生活領(lǐng)域。人工語音助手在目前應(yīng)用的相當(dāng)廣闊,例如百度的度秘、微軟的小冰和小娜等等,能夠提供語音交互,根據(jù)用戶的喜好和習(xí)慣,幫助用戶進行日程安排、問題回答等。這些產(chǎn)品的核心是基于語言模型的思想,根據(jù)用戶輸入的上文,預(yù)測出下文并輸出,例如:用戶通過語音提出問題,人工語音助手預(yù)測出相應(yīng)的答案進行回答。
而對于給定上文信息作為條件,預(yù)測下文的概率,現(xiàn)有技術(shù)有n-gram、統(tǒng)計機器翻譯、sequence-to-sequence等,但是這些現(xiàn)有技術(shù)在輸出的生成上均不可控。為了解決輸出可控的問題,現(xiàn)有技術(shù)通過人工構(gòu)造模板,在輸出時根據(jù)模板填充字詞,從而達(dá)到將輸出控制到框架內(nèi)的目的。
然而基于模板填充的方案,需要首先人工構(gòu)造模版。人工構(gòu)造模板時間和人力的消耗巨大,而且覆蓋面十分有限。并且基于模版填充的方案,構(gòu)造出的模版是缺少核心詞的句子,生成時填充核心詞,導(dǎo)致了返回的句子有明顯的模版痕跡,用戶體驗差。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種機器語言生成方法及裝置,以避免現(xiàn)有技術(shù)在輸出的生成上不可控、模板痕跡明顯、用戶體驗差等現(xiàn)象,使得生成的機器語言的句子靈活多變,沒有模板痕跡,符合預(yù)定的框架。
為了實現(xiàn)上述目的,本發(fā)明技術(shù)方案如下:
一種機器語言生成方法,所述機器語言生成方法包括:
接收輸入語句,根據(jù)預(yù)設(shè)的框架模型得到輸入語句對應(yīng)的框架列表;
將輸入語句輸入到預(yù)設(shè)的語言生成模型,生成符合框架列表中任一框架的回復(fù)語句輸出。
本發(fā)明的一種實現(xiàn)方式,所述將輸入語句輸入到預(yù)設(shè)的語言生成模型,生成符合框架列表中任一框架的回復(fù)語句輸出,包括:
將輸入語句輸入到預(yù)設(shè)的語言生成模型,開始逐步生成回復(fù)語句,每一步驟根據(jù)上文生成下文,所有生成的下文組成回復(fù)語句,記錄每一步驟中所有候選下文對應(yīng)的概率;
判斷生成的回復(fù)語句是否符合輸入語句對應(yīng)的框架列表中的任一框架,如果符合則輸出該回復(fù)語句作為輸入語句對應(yīng)的回復(fù),否則進入下一步;
從所有步驟對應(yīng)的未選擇過的候選下文中選擇概率最高的候選下文,作為其對應(yīng)的步驟所選擇的下文,繼續(xù)逐步生成回復(fù)語句,返回到上一步驟繼續(xù)進行判斷。
本發(fā)明的另一種實現(xiàn)方式,所述將輸入語句輸入到預(yù)設(shè)的語言生成模型,生成符合框架列表中任一框架的回復(fù)語句輸出,包括:
將輸入語句輸入到預(yù)設(shè)的語言生成模型,開始逐步生成回復(fù)語句,每一步驟根據(jù)上文生成下文,所有生成的下文組成回復(fù)語句,記錄每一步驟中所有候選下文對應(yīng)的概率;
判斷生成的回復(fù)語句是否符合輸入語句對應(yīng)的框架列表中的任一框架,如果符合則輸出該回復(fù)語句作為輸入語句對應(yīng)的回復(fù),否則進入下一步;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610207754.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





