[發明專利]一種自然語言的生成方法、自然語言生成裝置及電子設備有效

申請號：	201610965589.8	申請日：	2016-11-04
公開（公告）號：	CN108021547B	公開（公告）日：	2021-05-04
發明（設計）人：	丁磊;鄭繼川;董濱;姜珊珊;童毅軒	申請（專利權）人：	株式會社理光
主分類號：	G06F40/30	分類號：	G06F40/30;G06F40/211;G06F16/33
代理公司：	北京銀龍知識產權代理有限公司 11243	代理人：	許靜;劉偉
地址：	日本***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種自然語言生成方法裝置電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種自然語言的生成方法，其特征在于，包括：

根據語料庫中的語句，生成匹配預定義的輸入模式的至少一個句式模板；

獲得基于所述輸入模式的輸入語義，計算所述輸入語義與句式模板之間的匹配度，選擇出所述匹配度滿足預定條件的至少一個候選句式模板；

根據所述輸入語義和所述候選句式模板，生成自然語句，

在生成匹配預定義的輸入模式的至少一個句式模板的步驟之后，所述方法還包括：計算每兩個句式模板之間的相似度；

在計算所述輸入語義與句式模板之間的匹配度的過程中，根據當前計算匹配度的句式模板與其他句式模板之間的相似度，確定下一個計算所述匹配度的句式模塊，

其中，所述計算每兩個句式模板之間的相似度的步驟，包括：

根據以下公式，計算每兩個句式模板之間的相似度Sim(p₁，p₂)：

其中：

w表示子語義對應的詞；p₁、p₂分別表示每兩個句式模板中的第一句式模板和第二句式模板；s表示句式模板中的一個填充位置；T(p，s)表示語料庫中能夠填充在句式模板p的填充位置s中的詞的集合；Num(T())表示集合T()中詞的數量；n表示T(p，s)中詞的數量；θ_w表示詞w的預設權重系數，x表示T(p，s)中的詞，cos(w，x)表示詞w與x的余弦相似度；

T(p₁，s)∩T(p₂，s)表示兩個集合的交集，T(p₁，s)∪T(p₂，s)表示兩個集合的并集；表示針對句式模板中的所有填充位置s對應的Y值進行求和計算。

2.如權利要求1所述的方法，其特征在于，

所述計算所述輸入語義與句式模板之間的匹配度的步驟，包括：

針對所述輸入語義中的每個子語義，分別根據該子語義在句式模板中的填充位置，確定所述語料庫中能夠填充在該填充位置的詞的第一集合；以及，根據該子語義與第一集合中的各個詞之間的余弦相似度，計算得到該子語義與句式模板中對應填充位置的匹配因子，其中，所述匹配因子與所述余弦相似度正相關；

根據每個子語義與句式模板中對應填充位置的匹配因子，計算所述輸入語義與句式模板之間的匹配度。

3.如權利要求1所述的方法，其特征在于，

所述根據所述輸入語義和所述候選句式模板，生成自然語句的步驟，包括：

將所述輸入語義和/或替換語義中的詞，填充至所述候選句式模板中的對應位置，得到候選自然語句，其中，所述替換語義與所述輸入語義的語義近似度高于預設閾值；

計算所述候選自然語句中的各個填充位置的子語義組成的填充語義，與對應的候選句式模板之間的匹配度，并根據所述匹配度，篩選出匹配度達到預定門限的自然語句。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于株式會社理光，未經株式會社理光許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】