[發明專利]差分抽取裝置、方法以及程序在審
| 申請號: | 202111008156.0 | 申請日: | 2021-08-31 |
| 公開(公告)號: | CN114519998A | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 田中大貴;籠嶋岳彥;巖田憲治;藤村浩司 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04;G10L13/08;G10L15/02;G10L15/183 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 李今子 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 抽取 裝置 方法 以及 程序 | ||
本發明的實施方式涉及差分抽取裝置、方法以及程序。實施方式的差分抽取裝置具備文本獲取部、發音串變換部、標記串變換部以及比較部。所述文本獲取部獲取記載有輸入標記串的文本。所述發音串變換部將所述輸入標記串變換為發音串。所述標記串變換部將所述發音串變換為輸出標記串。所述比較部比較所述輸入標記串和所述輸出標記串而抽取差分。
優先權基礎申請等關聯申請的引用
本申請以2020年11月4日提交的日本專利申請第2020-184610號為基礎,主張優先權,其全部內容通過引用并入本文。
技術領域
本發明的實施方式涉及差分抽取裝置、方法以及程序。
背景技術
一般而言,用于通過搜索未登記于詞典的未知詞作為詞典登記的候補,從而支援用戶的詞典登記作業的技術正在開發。作為這種技術,例如,已知有如下方式:從對文本進行詞素解析而得到的結果抽取復合詞,如果該復合詞未登記于已構建詞典,則視為未知詞。
該方式通常不特別成為問題,但根據本發明人的研究,有時關于即使不登記也成為正確的標記的未知詞也作為詞典登記的候補而被抽取。在該情況下,會登記不需要登記的詞。
發明內容
本發明要解決的課題是提供能夠防止未知詞中的即使不登記也成為正確的標記的未知詞的登記的差分抽取裝置、方法以及程序。
實施方式的差分抽取裝置具備文本獲取部、發音串變換部、標記串變換部以及比較部。所述文本獲取部獲取記載有輸入標記串的文本。所述發音串變換部將所述輸入標記串變換為發音串。所述標記串變換部將所述發音串變換為輸出標記串。所述比較部比較所述輸入標記串和所述輸出標記串而抽取差分。
根據上述結構的差分抽取裝置,能夠防止未知詞中的即使不登記也成為正確的標記的未知詞的登記。
附圖說明
圖1是例示第1實施方式的差分抽取裝置的結構的框圖。
圖2是例示第1實施方式中的從發音串向標記串的變換的示意圖。
圖3是用于說明第1實施方式中的比較部的示意圖。
圖4是例示第1實施方式中的顯示畫面的示意圖。
圖5是用于說明第1實施方式中的動作的流程圖。
圖6是用于說明第1實施方式中的動作的示意圖。
圖7是例示第1實施方式中的日語的音節的示意圖。
圖8是例示第1實施方式中的發音狀態聲響得分矢量的示意圖。
圖9是例示第1實施方式的變形例的特征量變換部的框圖。
圖10是用于說明第1實施方式的變形例中的動作的流程圖。
圖11是例示第2實施方式的差分抽取裝置的結構的框圖。
圖12是用于說明第2實施方式中的動作的流程圖。
圖13是用于說明第2實施方式中的單詞推測部的示意圖。
圖14是例示第2實施方式中的顯示畫面的示意圖。
圖15是示出第2實施方式中的指示例的示意圖。
圖16是例示第3實施方式的差分抽取裝置的結構的框圖。
圖17是用于說明第3實施方式中的動作的流程圖。
圖18是例示第3實施方式的顯示畫面的示意圖。
圖19是示出第3實施方式的單詞登記部的登記例的示意圖。
圖20是示出第3實施方式的登記反映時的顯示例的示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111008156.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示裝置
- 下一篇:有機電致發光材料及其器件





