[發明專利]一種自然語言的生成方法、自然語言生成裝置及電子設備有效
| 申請號: | 201610965589.8 | 申請日: | 2016-11-04 |
| 公開(公告)號: | CN108021547B | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 丁磊;鄭繼川;董濱;姜珊珊;童毅軒 | 申請(專利權)人: | 株式會社理光 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06F16/33 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;劉偉 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 生成 方法 裝置 電子設備 | ||
本發明提供了一種自然語言的生成方法、自然語言生成裝置及電子設備。本發明直接從語料庫中提取句式模板,保證了后續生成的自然語句的句式正確性,而且,句式模板的提取,只需要刪除輸入模式中預先定義的語句中的組成成分,避免了過多的人工工作。另外,本發明基于輸入語義與句式模板之間的匹配度,選擇候選句式模板,提高了所生成自然語句的正確性。
技術領域
本發明涉及自然語言處理技術領域,具體涉及一種自然語言的生成方法、自然語言生成裝置及電子設備。
背景技術
隨著人工智能的發展,人機對話等智能系統的應用范圍越來越廣,對擬人化輸出的需求,即對直接輸出自然語言的需求越來越高。現有技術生成并輸出自然語言的實現方案,包括有:1)通過預先定義的語言模型生成自然語句;2)通過人工定義的模板生成自然語句。
上述兩類方法在實際應用過程中分別存在一定的問題。例如,第1種實現方案中,很難通過數學模型很好地表達自然語言的語法與邏輯關系,因此難以保證生成的語言的正確性;第2種基于人工模板的方案,通常只能應用于特定領域或單一用途,缺乏靈活性且需要大量的人工工作。
因此,亟需一種自然語言的生成方法,能夠提高方案的實現靈活性,減少人工工作量,并能夠提高語言生成結果的正確性。
發明內容
本發明實施例要解決的技術問題是提供一種自然語言的生成方法、自然語言生成裝置及電子設備,用以提高自然語句生成的靈活性,減少人工工作量,并提高語言生成結果的正確性。
為解決上述技術問題,本發明實施例提供的自然語言的生成方法,包括:
根據語料庫中的語句,生成匹配預定義的輸入模式的至少一個句式模板;
獲得基于所述輸入模式的輸入語義,計算所述輸入語義與句式模板之間的匹配度,選擇出所述匹配度滿足預定條件的至少一個候選句式模板;
根據所述輸入語義和所述候選句式模板,生成自然語句。
其中,上述方法中,在生成匹配預定義的輸入模式的至少一個句式模板的步驟之后,所述方法還包括:計算每兩個句式模板之間的相似度;
在計算所述輸入語義與句式模板之間的匹配度的過程中,根據當前計算匹配度的句式模板與其他句式模板之間的相似度,確定下一個計算所述匹配度的句式模塊。
其中,上述方法中,所述計算每兩個句式模板之間的相似度的步驟,包括:
根據以下公式,計算每兩個句式模板之間的相似度Sim(p1,p2):
其中:
w表示子語義對應的詞;p1、p2分別表示每兩個句式模板中的第一句式模板和第二句式模板;s表示句式模板中的一個填充位置;T(p,s)表示語料庫中能夠填充在句式模板p的填充位置s中的詞的集合;Num(T())表示集合T()中詞的數量;n表示T(p,s)中詞的數量;θw表示詞w的預設權重系數,x表示T(p,s)中的詞,cos(w,x)表示詞w與x的余弦相似度;
T(p1,s)∩T(p2,s)表示兩個集合的交集,T(p1,s)∪T(p2,s)表示兩個集合的并集;表示針對句式模板中的所有填充位置s對應的Y值進行求和計算。
其中,上述方法中,所述計算所述輸入語義與句式模板之間的匹配度的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社理光,未經株式會社理光許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610965589.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種即食雞樅菌及其制備方法
- 下一篇:一種黑果枸杞保健醋飲料及制備方法





