[發明專利]語句結構向量化裝置、語句結構向量化方法及語句結構向量化程序在審
| 申請號: | 201980086927.2 | 申請日: | 2019-01-31 |
| 公開(公告)號: | CN113330430A | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 伍井啟恭 | 申請(專利權)人: | 三菱電機株式會社 |
| 主分類號: | G06F16/00 | 分類號: | G06F16/00 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 馬建軍;鄧毅 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 結構 量化 裝置 方法 程序 | ||
1.一種語句結構向量化裝置,其特征在于,該語句結構向量化裝置具有:
詞素分析部,其對輸入語句進行詞素分析,由此生成多個詞素;
依賴分析部,其對所述多個詞素進行依賴分析,由此生成與所述多個詞素相關的依存結構圖;以及
語句結構向量化部,其從所述依存結構圖中提取多個部分結構信息,將與所述多個部分結構信息對應的詞素串轉換成數值序列,由此生成語句結構向量。
2.根據權利要求1所述的語句結構向量化裝置,其特征在于,
所述語句結構向量化部生成多個詞素信息,該多個詞素信息包含所述多個詞素的各個詞素與通過依賴分析得到的表示依賴關系的信息的對,
所述語句結構向量化部從所述多個詞素信息中提取所述多個部分結構信息。
3.根據權利要求1或2所述的語句結構向量化裝置,其特征在于,
在設N為3以上的整數時,所述多個部分結構信息包含與1個詞素相關的1詞素結構信息~與N個詞素相關的N詞素結構信息,
所述語句結構向量化部通過對N-1詞素結構信息和2詞素結構信息進行合并的處理來生成所述N詞素結構信息。
4.根據權利要求1~3中的任意一項所述的語句結構向量化裝置,其特征在于,該語句結構向量化裝置還具有存儲部,該存儲部存儲所述語句結構向量。
5.根據權利要求1~4中的任意一項所述的語句結構向量化裝置,其特征在于,
該語句結構向量化裝置還具有處理部,該處理部進行使用所述語句結構向量的處理。
6.根據權利要求5所述的語句結構向量化裝置,其特征在于,
所述處理部具有檢索處理部,該檢索處理部使用所述語句結構向量從檢索對象文檔中檢索文檔。
7.根據權利要求5或6所述的語句結構向量化裝置,其特征在于,
所述處理部具有分類處理部,該分類處理部使用所述語句結構向量進行檢索對象文檔的分類。
8.一種語句結構向量化方法,其特征在于,該語句結構向量化方法具有以下步驟:
對輸入語句進行詞素分析,由此生成多個詞素;
對所述多個詞素進行依賴分析,由此生成與所述多個詞素相關的依存結構圖;以及
從所述依存結構圖中提取多個部分結構信息,將與所述多個部分結構信息對應的詞素串轉換成數值序列,由此生成語句結構向量。
9.一種語句結構向量化程序,其特征在于,該語句結構向量化程序使計算機執行以下處理:
對輸入語句進行詞素分析,由此生成多個詞素;
對所述多個詞素進行依賴分析,由此生成與所述多個詞素相關的依存結構圖;以及
從所述依存結構圖中提取多個部分結構信息,將與所述多個部分結構信息對應的詞素串轉換成數值序列,由此生成語句結構向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三菱電機株式會社,未經三菱電機株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980086927.2/1.html,轉載請聲明來源鉆瓜專利網。





