日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]聲音檢索裝置有效

專利信息
申請號: 200810091710.4 申請日: 2008-04-09
公開(公告)號: CN101286170A 公開(公告)日: 2008-10-15
發明(設計)人: 花沢利行;岡登洋平 申請(專利權)人: 三菱電機株式會社
主分類號: G06F17/30 分類號: G06F17/30;G10L15/08;G10L15/14
代理公司: 中國國際貿易促進委員會專利商標事務所 代理人: 吳麗麗
地址: 日本*** 國省代碼: 日本;JP
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 聲音 檢索 裝置
【說明書】:

技術領域

本發明涉及利用聲音識別來檢索文書等各種文本(text)的裝置。

背景技術

對于利用聲音來檢索文書等各種文本的技術,一般有以下的方法:利用聽寫(dictation)型聲音識別而將聲音變換為文本,在文本上進行全文檢索。但是,在該方法中,能夠識別的短語數限于數千~數萬,因此,在對包含這以外的短語的文書等進行檢索的情況下,需要考慮未知詞的處理。

作為對策,在特開2003-271629號公報中,揭示了以下的技術:以單詞為單位在檢索對象的文書中只識別出現頻度高的高位K個單詞,而以音節為單位識別除此以外的單詞。然后,利用作為識別結果被抽出的單詞,通過全文檢索而預先選擇文書,然后,推測作為音節序列而識別出的部分的單詞,得到最終的檢索結果。

專利文獻1:特開2003-271629號公報

在上述現有技術中,針對輸入聲音中的被識別為單詞的位置,將單詞作為索引語而進行全文檢索。因此,有以下的問題,即如果在識別為單詞的位置有錯誤識別,則檢索精度低下。例如有以下的問題:即使假設發言為“和歌山の那智大滝”,識別結果的全部單詞得到“岡山の町大田區”,也無法檢索到包含“和歌山県の那智大滝”的文書。

發明內容

本發明就是為了解決上述問題而提出的,其目的在于:即使在發言的文字標記和聲音識別結果的文字標記不一致的情況下,如果音響上類似,也能夠進行檢索。

另外,其目的在于:提供一種即使在包含未知詞的文書中也能夠抑制識別率低下的技術。

另外,其目的在于:即使在發言短而檢索線索少的情況下,也減少檢索遺漏的技術。

本發明的聲音檢索裝置具備:

將檢索對象的文書等文本數據分割為規定的語言單位并輸出的學習數據分割單元;

根據上述分割結果,作成聲音識別用的語言模型的語言模型作成單元;

按照比上述學習數據分割單元中的分割單位小的單位,對上述檢索對象的文書等文本數據進行分割,作成文本檢索辭典的文本辭典作成單元;

使用上述語言模型識別輸入聲音,并作為文本輸出聲音識別結果的聲音識別單元;

將上述聲音識別結果分割為與上述文本辭典作成單元一樣的分割單位并輸出的對照單位變換單元;

將上述對照單位變換單元的輸出作為輸入,使用上述文本檢索辭典,進行文本檢索的文本檢索單元。

根據本發明,構成為參照被分割為語言單位的語言模型和聲音特征被模型化了的音響模型,進行輸入聲音的聲音識別,輸出音素標記,按照與以比上述語言模型小的單位分割的文本檢索辭典的分割單位相同的單位,由對照單位變換單元分割上述音素標記,使用該分割結果,由文本檢索單元進行文本檢索辭典的檢索,因此,具有以下的效果:即使在識別結果的單詞序列中包含錯誤識別的情況下,也能夠檢索希望的設施。

附圖說明

圖1是表示本發明的聲音檢索裝置的實施例1的結構的框圖。

圖2是語言模型學習數據存儲器的內容例子的說明圖。

圖3是文本檢索辭典的內容例子的說明圖。

圖4是實施例2的加權系數表的內容例子的說明圖。

圖5是實施例2的語言模型的作成流程圖。

圖6是表示實施例3的結構的框圖。

圖7是實施例3的語言模型的作成流程圖。

圖8是表示實施例4的結構的框圖。

圖9是實施例4的聲音識別候選數表的內容例子的說明圖。

圖10是實施例4的文本檢索單元的文本檢索流程圖。

具體實施方式

實施例1

圖1是表示本發明的聲音檢索裝置的實施例1的結構的框圖。

在該圖中,1是聲音輸入端,2是輸入聲音,3是聲音識別單元,4是對聲音識別結果的對照單位進行變換的對照單位變換單元,5是文本檢索單元,6是語言模型存儲器,7是音響模型存儲器,8是語言模型學習數據存儲器,9是學習數據分割單元,10是語言模型作成單元,11是文本檢索辭典作成單元,12是文本檢索辭典存儲器,13是檢索結果。在音響模型存儲器7中存儲有對聲音的特征進行了模型化后的音響模型。在本實施例中,音響模型例如是HMM(Hidden?MarkovModel)。

在本實施例中,以以下的情況為例子進行說明,即將日本全國的設施、觀光點的名稱(以后為了簡化,將設施和觀光點總稱為設施)看作是由若干個單詞組成的文本文書,通過聲音識別來檢索設施或觀光點的名稱。進而,不只是通常的單詞聲音識別,還通過文本檢索的構架來實施設施名稱檢索,其優點是:即使用戶無法正確地知道檢索對象的設施名,只要一部分匹配,則也能夠進行檢索。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三菱電機株式會社,未經三菱電機株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200810091710.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产麻豆一区二区| 亚洲精品乱码久久久久久按摩| 国产电影一区二区三区下载| 国产乱了高清露脸对白| 88国产精品视频一区二区三区| 日韩一级精品视频在线观看 | 国产一区二三| 日韩一区二区福利视频| 一区二区三区四区中文字幕| 国产偷亚洲偷欧美偷精品| 国产精品6699| 日韩久久精品一区二区三区| 国产精品入口麻豆九色| 欧美日韩国产精品一区二区三区| 欧美一区二区三区久久久| 99久久国产综合精品麻豆| 99久久夜色精品国产网站| 欧美3级在线| 午夜无人区免费网站| 欧美精品在线视频观看| 国产精品不卡在线| 91麻豆精品国产91久久| 91狠狠操| 国产69精品久久久久久| 91视频一区二区三区| 欧美一区二区三区四区在线观看| 国产欧美亚洲精品| 国产不卡网站| 欧美日韩中文不卡| 91精品国产高清一区二区三区| 狠狠色成色综合网| 日韩精品午夜视频| 欧美系列一区二区| 欧美色综合天天久久| 国产欧美一区二区在线| 国产九九影院| 国产无遮挡又黄又爽免费网站| 91精品第一页| 国产91九色视频| 久久夜色精品久久噜噜亚| 狠狠色噜噜狠狠狠狠| 最新av中文字幕| 久久精品国产亚| 精品国产免费久久| 国产视频一区二区不卡| 国产精品久久久综合久尹人久久9| 在线亚洲精品| 国产欧美三区| 草逼视频网站| 狠狠插影院| 91精品综合在线观看| 国产精品免费不卡| 久爱精品视频在线播放| 国产一区=区| 国产大片黄在线观看私人影院 | 自偷自拍亚洲| 国产一区免费在线观看| 国产精品视频一区二区三| 精品一区二区在线视频| 亚洲国产精品综合| 午夜大片男女免费观看爽爽爽尤物| 狠狠色噜噜狠狠狠狠88| 精品国产一区二区三区久久久久久| 狠狠色噜噜狠狠狠狠2021免费 | 日韩精品久久一区二区| 精品videossexfreeohdbbw| 人人澡超碰碰97碰碰碰| 在线精品视频一区| 精品999久久久| 久久er精品视频| 99国产精品久久久久| 欧美3p激情一区二区三区猛视频| 免费毛片**| 一区二区三区国产精品视频 | 色一情一交一乱一区二区三区| 国产精品一区在线观看| 国产一区二区三区黄| 国产一区日韩在线| 自拍偷在线精品自拍偷无码专区 | 亚欧精品在线观看| 午夜剧场a级免费| 国产资源一区二区三区|