[發明專利]解析裝置、解析方法及存儲介質在審
| 申請號: | 202010122489.5 | 申請日: | 2020-02-27 |
| 公開(公告)號: | CN112463934A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 小林優佳;藤村浩司;巖田憲治;吉田尚水 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 林娜;段承恩 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解析 裝置 方法 存儲 介質 | ||
一種解析裝置、解析方法及存儲介質,能夠更容易地掌握與類別關聯的詞匯。實施方式的解析裝置具備算出部、決定部、適用部、決定部以及顯示控制部。算出部算出表示類別的第1詞匯與第2詞匯的第1相似度。適用部將所述第1相似度比第1閾值大的一個以上的第2詞匯適用于一個以上的模板語句。決定部對包含所述第2詞匯的模板語句進行解析,將所述第2詞匯分類為一個以上的第1類別。顯示控制部將在所述第1類別的分類中使用過的所述第2詞匯按每個所述第1類別顯示于顯示部。
技術領域
本發明的實施方式涉及解析裝置、解析方法及存儲介質。
背景技術
在通過輸入自然語句進行的檢索中,需要事先收羅用戶會輸入的詞匯(檢索關鍵字)。以往,開發人員對各內容手動賦予對應的檢索關鍵字。因此,必須考慮對每個內容使用怎樣的檢索關鍵字,生成數據庫會花費成本。雖然能夠使用同義詞詞典等對一個關鍵字進行擴展,但除此以外的近義詞等需要手動賦予。近年來使用了相似度計算器的技術,該相似度計算器使用大量的文書對詞匯間的相似度模型進行學習而算出詞匯間的含義的相似度。
發明內容
然而,在以往的技術中,無法事先確認將怎樣的關鍵字分配給各類別。通過使用大量的文書進行機器學習而生成的相似度計算器有時會給出不希望的結果來作為含義上的相似度,有時將開發人員不想要的詞匯(關鍵字)分配給類別。本發明所要解決的課題是提供一種能夠更容易地掌握與類別關聯的詞匯的解析裝置、解析方法及程序。
實施方式的解析裝置具備算出部、適用部、決定部以及顯示控制部。算出部算出表示類別的第1詞匯、與第2詞匯的第1相似度。適用部將所述第1相似度比第1閾值大的一個以上的第2詞匯適用于一個以上的模板語句。決定部對包含所述第2詞匯的模板語句進行解析,將所述第2詞匯分類為一個以上的第1類別。顯示控制部將在所述第1類別的分類中使用過的所述第2詞匯按每個所述第1類別顯示于顯示部。
根據上述推定裝置,能夠更容易地掌握與類別關聯的詞匯。
附圖說明
圖1是示出第1實施方式的解析裝置的功能構成的例子的框圖。
圖2是示出第1實施方式的對話系統的功能構成的例子的框圖。
圖3是示出第1實施方式的語音對話處理的例子的流程圖。
圖4A是示出第1實施方式的詞匯與類別的關聯度的算出例1的圖。
圖4B是示出第1實施方式的詞匯與類別的關聯度的算出例2的圖。
圖5是示出表示第1實施方式的詞匯與類別的關聯的顯示信息的例1的圖。
圖6是示出表示第1實施方式的詞匯與類別的關聯的顯示信息的例2的圖。
圖7是示出第1實施方式的詞匯與類別的關聯度的算出方法的例子的流程圖。
圖8是示出第2實施方式的受理類別的變更的顯示信息的例子的圖。
圖9是示出第2實施方式的受理類別的刪除的顯示信息的例子的圖。
圖10是示出第2實施方式的受理類別的追加的顯示信息的例子的圖。
圖11是示出第3實施方式的受理詞匯與類別的關聯度的變更的顯示信息的例子的圖。
圖12是示出第5實施方式的表示詞匯與類別的關聯的顯示信息的例子的圖。
圖13是示出第1至第5實施方式的解析裝置的硬件構成的例子的圖。
標號說明
1:算出部;
2:適用部;
3:決定部;
4:顯示控制部;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122489.5/2.html,轉載請聲明來源鉆瓜專利網。





