[發(fā)明專利]一種機器語言生成方法及裝置有效

申請?zhí)枺?/td>	201610207754.3	申請日：	2016-04-01
公開（公告）號：	CN107291701B	公開（公告）日：	2020-12-01
發(fā)明（設(shè)計）人：	黎檳華;江會星;孫健;初敏	申請（專利權(quán)）人：	阿里巴巴集團控股有限公司
主分類號：	G06F40/42	分類號：	G06F40/42
代理公司：	杭州君度專利代理事務(wù)所(特殊普通合伙) 33240	代理人：	諸佩艷
地址：	英屬開曼群島大開***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種機器語言生成方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種機器語言生成方法及裝置，所述機器語言生成方法接收輸入語句，根據(jù)預(yù)設(shè)的框架模型得到輸入語句對應(yīng)的框架列表，并將輸入語句輸入到預(yù)設(shè)的語言生成模型，生成符合框架列表中任一框架的回復(fù)語句輸出。本發(fā)明機器語言生成裝置包括框架生成模塊和語句生成模塊。本發(fā)明的方法及裝置在生成回復(fù)語句時，逐步根據(jù)上文生成多個候選下文，選擇概率最大的候選下文作為獲選下文，從而保證了生成的回復(fù)語句的通順，同時與框架模型產(chǎn)生的框架相結(jié)合，保證了回復(fù)語句包含了一定的固定結(jié)構(gòu)，使得回復(fù)語句在包含框架的前提下又非常通順，更加符合語意和人類的自然語言，給人更好的體驗。

技術(shù)領(lǐng)域

本發(fā)明屬于人工智能技術(shù)領(lǐng)域，尤其涉及一種機器語言生成方法及裝置。

背景技術(shù)

隨著科技的發(fā)展，人工智能逐漸開始進入工業(yè)、商業(yè)和生活領(lǐng)域。人工語音助手在目前應(yīng)用的相當(dāng)廣闊，例如百度的度秘、微軟的小冰和小娜等等，能夠提供語音交互，根據(jù)用戶的喜好和習(xí)慣，幫助用戶進行日程安排、問題回答等。這些產(chǎn)品的核心是基于語言模型的思想，根據(jù)用戶輸入的上文，預(yù)測出下文并輸出，例如：用戶通過語音提出問題，人工語音助手預(yù)測出相應(yīng)的答案進行回答。

而對于給定上文信息作為條件，預(yù)測下文的概率，現(xiàn)有技術(shù)有n-gram、統(tǒng)計機器翻譯、sequence-to-sequence等，但是這些現(xiàn)有技術(shù)在輸出的生成上均不可控。為了解決輸出可控的問題，現(xiàn)有技術(shù)通過人工構(gòu)造模板，在輸出時根據(jù)模板填充字詞，從而達(dá)到將輸出控制到框架內(nèi)的目的。

然而基于模板填充的方案，需要首先人工構(gòu)造模版。人工構(gòu)造模板時間和人力的消耗巨大，而且覆蓋面十分有限。并且基于模版填充的方案，構(gòu)造出的模版是缺少核心詞的句子，生成時填充核心詞，導(dǎo)致了返回的句子有明顯的模版痕跡，用戶體驗差。

發(fā)明內(nèi)容

本發(fā)明的目的是提供一種機器語言生成方法及裝置，以避免現(xiàn)有技術(shù)在輸出的生成上不可控、模板痕跡明顯、用戶體驗差等現(xiàn)象，使得生成的機器語言的句子靈活多變，沒有模板痕跡，符合預(yù)定的框架。

為了實現(xiàn)上述目的，本發(fā)明技術(shù)方案如下：

一種機器語言生成方法，所述機器語言生成方法包括：

接收輸入語句，根據(jù)預(yù)設(shè)的框架模型得到輸入語句對應(yīng)的框架列表；

將輸入語句輸入到預(yù)設(shè)的語言生成模型，生成符合框架列表中任一框架的回復(fù)語句輸出。

本發(fā)明的一種實現(xiàn)方式，所述將輸入語句輸入到預(yù)設(shè)的語言生成模型，生成符合框架列表中任一框架的回復(fù)語句輸出，包括：

將輸入語句輸入到預(yù)設(shè)的語言生成模型，開始逐步生成回復(fù)語句，每一步驟根據(jù)上文生成下文，所有生成的下文組成回復(fù)語句，記錄每一步驟中所有候選下文對應(yīng)的概率；

判斷生成的回復(fù)語句是否符合輸入語句對應(yīng)的框架列表中的任一框架，如果符合則輸出該回復(fù)語句作為輸入語句對應(yīng)的回復(fù)，否則進入下一步；

從所有步驟對應(yīng)的未選擇過的候選下文中選擇概率最高的候選下文，作為其對應(yīng)的步驟所選擇的下文，繼續(xù)逐步生成回復(fù)語句，返回到上一步驟繼續(xù)進行判斷。

本發(fā)明的另一種實現(xiàn)方式，所述將輸入語句輸入到預(yù)設(shè)的語言生成模型，生成符合框架列表中任一框架的回復(fù)語句輸出，包括：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司，未經(jīng)阿里巴巴集團控股有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610207754.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：信息修正方法、裝置、存儲介質(zhì)及電子設(shè)備
下一篇：一種進行翻譯的方法和系統(tǒng)

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】