[發明專利]一種自然語言的生成方法、自然語言生成裝置及電子設備有效
| 申請號: | 201610965589.8 | 申請日: | 2016-11-04 |
| 公開(公告)號: | CN108021547B | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 丁磊;鄭繼川;董濱;姜珊珊;童毅軒 | 申請(專利權)人: | 株式會社理光 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06F16/33 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;劉偉 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 生成 方法 裝置 電子設備 | ||
1.一種自然語言的生成方法,其特征在于,包括:
根據語料庫中的語句,生成匹配預定義的輸入模式的至少一個句式模板;
獲得基于所述輸入模式的輸入語義,計算所述輸入語義與句式模板之間的匹配度,選擇出所述匹配度滿足預定條件的至少一個候選句式模板;
根據所述輸入語義和所述候選句式模板,生成自然語句,
在生成匹配預定義的輸入模式的至少一個句式模板的步驟之后,所述方法還包括:計算每兩個句式模板之間的相似度;
在計算所述輸入語義與句式模板之間的匹配度的過程中,根據當前計算匹配度的句式模板與其他句式模板之間的相似度,確定下一個計算所述匹配度的句式模塊,
其中,所述計算每兩個句式模板之間的相似度的步驟,包括:
根據以下公式,計算每兩個句式模板之間的相似度Sim(p1,p2):
其中:
w表示子語義對應的詞;p1、p2分別表示每兩個句式模板中的第一句式模板和第二句式模板;s表示句式模板中的一個填充位置;T(p,s)表示語料庫中能夠填充在句式模板p的填充位置s中的詞的集合;Num(T())表示集合T()中詞的數量;n表示T(p,s)中詞的數量;θw表示詞w的預設權重系數,x表示T(p,s)中的詞,cos(w,x)表示詞w與x的余弦相似度;
T(p1,s)∩T(p2,s)表示兩個集合的交集,T(p1,s)∪T(p2,s)表示兩個集合的并集;表示針對句式模板中的所有填充位置s對應的Y值進行求和計算。
2.如權利要求1所述的方法,其特征在于,
所述計算所述輸入語義與句式模板之間的匹配度的步驟,包括:
針對所述輸入語義中的每個子語義,分別根據該子語義在句式模板中的填充位置,確定所述語料庫中能夠填充在該填充位置的詞的第一集合;以及,根據該子語義與第一集合中的各個詞之間的余弦相似度,計算得到該子語義與句式模板中對應填充位置的匹配因子,其中,所述匹配因子與所述余弦相似度正相關;
根據每個子語義與句式模板中對應填充位置的匹配因子,計算所述輸入語義與句式模板之間的匹配度。
3.如權利要求1所述的方法,其特征在于,
所述根據所述輸入語義和所述候選句式模板,生成自然語句的步驟,包括:
將所述輸入語義和/或替換語義中的詞,填充至所述候選句式模板中的對應位置,得到候選自然語句,其中,所述替換語義與所述輸入語義的語義近似度高于預設閾值;
計算所述候選自然語句中的各個填充位置的子語義組成的填充語義,與對應的候選句式模板之間的匹配度,并根據所述匹配度,篩選出匹配度達到預定門限的自然語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社理光,未經株式會社理光許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610965589.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種即食雞樅菌及其制備方法
- 下一篇:一種黑果枸杞保健醋飲料及制備方法





