[發明專利]一種將五線譜圖像轉換為聲音文件的方法無效
| 申請號: | 200910307828.0 | 申請日: | 2009-09-28 |
| 公開(公告)號: | CN101661745A | 公開(公告)日: | 2010-03-03 |
| 發明(設計)人: | 張海英;郭人通;郝貴青;陽鋒;劉國勝;肖盛杰;張巖;陳常晉;張雷;李玉軍 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G10H7/00 | 分類號: | G10H7/00;G06K9/00;G10L13/02 |
| 代理公司: | 西安弘理專利事務所 | 代理人: | 羅 笛 |
| 地址: | 710048*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 五線譜 圖像 轉換 聲音文件 方法 | ||
技術領域
本發明屬于圖像識別技術領域,涉及一種五線譜識別方法,具體涉及一種將五線譜圖像 轉換為聲音文件的方法。
背景技術
目前,國內對于五線譜圖像的識別技術還處在初級階段,通常采用的方法是人工識別五 線譜中的音符,然后進行演奏,基于數字圖像處理的五線譜圖像識別方法還未見涉及,將五 線譜圖像轉換為聲音文件并且播放,具有很好的應用前景。
發明內容
本發明的目的是提供一種將五線譜圖像轉換為聲音文件的方法,將圖像中的五線譜信息 轉換為具有某種規律的代碼,每一個代碼對應一個音符的聲音文件,為無聲文件轉換成有聲 文件提供基礎。
本發明的技術方案是:一種將五線譜圖像轉換為聲音文件的方法,具體按照以下步驟實 施:
步驟1:定義音符代碼,錄制音符的標準聲音文件
給每個音符定義一個代碼,代碼由四位十進制數組成,第一位為音高,第二位為音名, 第三位為音調轉換標記,第四位為音長;將每個音符按照規定的音高、音名、音調和音長, 錄制成標準聲音文件,存儲在計算機中;
步驟2:采集五線譜圖像
用掃描儀或攝像頭獲取要識別的五線譜圖像,以圖片格式文件存儲在計算機中;
步驟3:計算機識別五線譜圖像中的小節線、含符干音符、全音符、升降記號、休止符 以及譜號,將識別結果轉換為音符代碼后再存儲為聲音文件;
步驟4:播放聲音文件
對照步驟1得到的標準聲音文件,播放步驟3得到的聲音文件,即為要識別的五線譜圖像 中音符的聲音。
本發明的特點還在于,步驟3中將五線譜圖像轉換為音符代碼后再存儲為聲音文件,具 體按照以下步驟實施:
步驟1:圖像的二值化
(1)將彩色圖像轉換為灰度圖像
計算機對RGB三色彩通道位圖上的值求圖像灰度加權和,采用以下公式:
Gray=Red*0.30+Gre*0.59+Blu*0.11
得到圖像中各個像素的灰度值;
(2)確定閾值
對灰度圖像進行取樣,采用大津法對收集到的數據進行處理,獲得二值化的閾值,對待 處理圖像,記t為前景與背景的分割閾值,前景點數占圖像比例為w0,平均灰度為u0;背景 點數占圖像比例為w1,平均灰度為u1,圖像的總平均灰度為:u=w0*u0+w1*u1,從最小灰度 值到最大灰度值遍歷t,當t使得值g=w0*w1*(u0-u1)^2最大時t即為分割的最佳閾值;
(3)二值化
灰度值大于或等于閾值的像素,其灰度值用1表示,表示屬于前景;否則,灰度值用0表 示,像素點被排除在物體區域以外,表示背景或者例外的物體區域;
步驟2:確定各譜線的位置及相鄰線之間的平均間距,并擦除譜線
(1)確定譜線位置及相鄰線之間的平均間距
對上步得到的二值圖進行橫向投影,在投影值列表中找到5個最大的值,取他們的平均 值,記為MA,將閾值設為0.5MA,投影值大于這個值則判定該條線可能為譜線,稱為候選譜 線,在確定圖中各候選譜線后,對各相鄰線的非零線間寬進行統計,找出占比重最大一組, 將其值確定為單位元長度D;
(2)譜線的擦除
譜線的邊界使用B2×n矩陣進行描述,其中n為譜線的長度,B1j為上邊界的縱坐標, B2j為下邊界的縱坐標,其中0<j≤n,
在出現譜線組的位置,分別對五條譜線所處區域做橫向掃描,當像素點連續為前景的次 數大于某設定閾值時,認為這條線段是構成當前譜線的一部分,將該線段上各點與B2×n矩 陣中相應的邊界坐標比較,若小于現有上邊界或大于現有下邊界,則更新邊界信息,處理完 區域內所有的像素點后,得到完整的橫向線邊界描述;
步驟3:圖像的分割
若相鄰兩組譜線的間距大于8D,則在距邊沿譜線4D處進行分割;若相鄰兩組譜線的間距 小于8D,則在間隔部分的平分線處進行分割;
步驟4:圖像的識別
(1)小節線及含符干音符的識別
a.縱向線段的識別
對分割后的圖像做縱向投影,設Sc為投影篩選閾值,Sv為縱向線判定閾值,Bt為最大 斷筆次數,Db為最大斷筆距離,判定縱向線時,按以下步驟進行:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910307828.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于構建數字權限管理許可證格式的方法和裝置
- 下一篇:半導體裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





