[發明專利]注解輔助裝置及記錄介質有效
| 申請號: | 201680006728.2 | 申請日: | 2016-01-20 |
| 公開(公告)號: | CN107209759B | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 飯田龍;鳥澤健太郎;橋本力;吳鐘勛;大竹清敬;木俵豐 | 申請(專利權)人: | 國立研究開發法人情報通信研究機構 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/169 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 李海龍 |
| 地址: | 日本國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 注解 輔助 裝置 記錄 介質 | ||
提供一種能夠容易且低成本地構筑對文本的注解的注解輔助裝置。注解數據生成輔助系統(160)包括:輸入輸出裝置(202),通過對話型處理來接受輸入;詞素解析系統(380)以及依存關系解析系統(382),對文本檔案(192)的文本數據進行詞素解析以及依存解析;第1~第4候補生成部(388、390、392以及394),在詞素串中的謂語的依存關系中檢測省略或者指示語,確定注解處理的對象位置,使用語言知識來推定所插入的表達的候補;候補DB(386),存儲所推定出的候補;和對話型注解裝置(396),從候補DB(386)讀出注解處理的候補,將通過輸入輸出裝置(202)的對話型處理而選擇出的候補附加為注解。
技術領域
本發明涉及自然語言處理技術,尤其是涉及用于對文本有效地進行針對自然語言的語句中頻繁出現的省略、代詞等指示語的照應關系的注解的注解輔助裝置。
背景技術
在自然語言的文本中,頻繁出現省略以及指示語。例如考慮圖1所示的例句30。例句30包括第一句和第二句。在第二句中包含「其」這一指示語(代詞)42。在該情況下,「其」這一指示語指代第一句的「農歷新年的日期」這一表達40。將如此確定指示語所指代的詞語的處理稱為「照應解析」。另一方面,考慮圖2的例句60。該例句60包括第一句和第二句。在第二句中,省略了「搭載自診斷功能」這一謂語部分的主語,在該主語的省略位置76,省略了第一句的「新型交換機」這一單詞72。同樣地,省略了「預定設置200系統。」這一謂語部分的主語。在該主語的省略位置74,省略了第一句的「N公司」這一單詞70。將如此檢測主語等的省略并且對其進行補足的處理稱為「省略解析」。以后,將照應解析和省略解析一起稱為「照應/省略解析」。
在所謂的人工智能中,為了取得與人的交流,自然語言處理是不可缺少的技術。作為自然語言處理的重要的問題,存在自動翻譯以及問題解答等。照應/省略解析的技術,在這種自動翻譯以及問題解答中是必不可少的技術。但是,現狀的照應/省略解析的技術水平,雖然也根據語言而不同,但是還未達到實用級別。
如此,照應/省略解析的性能不能提高的理由,可以考慮各種理由。作為主要的理由,可以列舉在這種解析中需要一般常識。為了考慮一般常識,需要考慮與照應/解析相關的人的判斷。但是,考慮了這樣的要素的解析算法比較困難。歸根到底,需要準備大量人的判斷作為學習數據,生成通過統計學習來進行照應/省略解析的解析器。但是,已知用于生成這樣的解析器構筑用的學習數據的成本是非常大的。因此,由于不能生成足夠量的學習數據,所以難以實現照應/省略解析的性能的提高。
為了提高自然語言處理的性能,進而使人工智能更智能,需要解決與照應/省略解析相關的這樣的問題。
作為生成照應/省略解析器的學習數據的技術,存在后述的非專利文獻1所記載的技術。在該技術中,如以下那樣進行學習數據的生成。即,進行如下作業:人從開頭開始閱讀文本,人工檢測代詞以及省略等。作為機械的支援,例如是預先列舉照應關系的指代目標的表達的程度。
另一方面,在后述的非專利文獻2中,公開了自動地按一定的步驟進行照應/省略解析的照應/省略解析算法。該文獻所公開的技術,利用詞素解析、語法/依存解析(以下簡稱為「依存解析」)等所輸出的信息、和詞典等外部資源工具。這里所利用的詞典,是匯集了如下特性的詞典,即,例如「吃」這一動詞的賓語中包括相當于「食物」的表達。在非專利文獻2所公開的技術中,除此之外,還參考從文本中得到的信息來進行代詞的指代目標以及省略的補足。
在先技術文獻
非專利文獻
非專利文獻1:飯田龍、小町守、井之上直也、乾健太郎、松本裕治、謂語構造和照應關系的注解:NAIST從文本語料庫構筑的經驗到自然語言處理(述語耩造と照応関係のアノテーション:NAISTテキストコーパス耩築の経験から、自然言語処理),Vol.17,No.2,pp.25-50,2010.
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國立研究開發法人情報通信研究機構,未經國立研究開發法人情報通信研究機構許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680006728.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能化自動轉換開關
- 下一篇:一種地電阻率垂直觀測裝置





