[發明專利]基于行游程鄰接表的樂譜快速連通域分析方法無效
| 申請號: | 201010275849.1 | 申請日: | 2010-09-07 |
| 公開(公告)號: | CN101930544A | 公開(公告)日: | 2010-12-29 |
| 發明(設計)人: | 鄒采榮;楊銀賢;趙力;奚吉;王開;陳存寶;王青云;余華 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06T7/00 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 許方 |
| 地址: | 215123 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 游程 鄰接 樂譜 快速 連通 分析 方法 | ||
技術領域
本發明涉及多媒體信號處理技術領域,尤其是在數字音樂圖書館等音樂樂譜數字化應用開發的領域。
背景技術
樂譜的發明是人類音樂史上的里程碑,它的出現使人們可以在一個相對標準的平臺上進行音樂的交流和傳承。但是,古往今來的優秀音樂作品大都以紙質樂譜的形式保留下來,直至今天,紙質樂譜仍是表達和描述音樂作品的主要載體。紙質樂譜的存在使得音樂的人們交流和保存音樂,但是紙質樂譜的保存需要占用一定的存儲空間,不利于保存與交流,特別是紙質狀樂譜無法實現高速查詢與檢索,而只能能以純手工的方式進行。紙質樂譜的這些缺點,使得樂譜的交流與保存極為不便。
光學樂譜識別技術(OMR)是近年來發展起來的實現紙質樂譜數字化的一種主流技術,不同于傳統的圖像存儲格式(如JPG,TIF,GIF等)采用光學掃描壓縮存貯樂譜圖像,而是記錄樂譜所表達的音樂內容,因此所需要的存儲空間更小,并且可以很方便的對其進行編輯、加工、打印、傳播或者實時演奏。OMR技術為紙質樂譜的數字化提供了一個智能、高效的新途徑,可以廣泛的應用在計算機輔助音樂教學、數字音樂圖書館建設、互聯網音樂搜索、計算機音樂合成等領域。
一個完整的OMR處理系統大致包括以下幾個組成模塊:1)紙質樂譜圖像輸入及預處理,2)樂譜譜線檢測定位及刪除,3)樂譜圖像分割,4)樂譜圖像識別,5)樂譜重建及音樂語義解釋。樂譜的分割是識別的前提,關系到整個OMR系統的性能。目前廣泛采用的樂譜分割方式主要有投影法,區域生長法,邊緣提取及連通域分析等方法。投影法方法簡單,但往往只能實現對直線區域和非直線區域的有效分割,或者是進行直線的提取,無法實現對各具體連通域進行分割;邊緣提取法,區域生長法以及傳統連通域方法雖能提取圖像中的各個連通區域,但運行速度慢且復雜,往往需要對圖像進行多次掃描才能完成。
國外有關OMR的研究起始于60年代后期,當時由于技術條件和硬件設備的限制,所研究的內容也是非常有限的。到了70年代,隨著光學掃描儀的出現和機器性能的提升,OMR才真正已經引起眾多學者的廣泛注意。進入80年代后,隨著計算機圖形圖像技術的不斷發展與成熟,研究內容越來越深入,部分研究成果也正逐步進入實用階段。
在我國,一方面由于計算機音樂發展起步晚,計算機音樂只是少數音樂工作者的“專利”,社會缺乏計算機識別樂譜的需要;另一方面,由于國內高校的學科設置綜合化程度、學科交叉的跨度與國外有著相當大的差距,長期以來,從事計算機音樂研究的專業人才嚴重缺乏。因此,OMR技術在國內的系統研究和實踐工作幾乎為空白。目前,西北工業大學與西安音樂學院合作正在開展印刷體光學樂譜識別技術的研究,但目前國內外有關樂譜分割技術的研究還很少,很大一部分仍然是基于傳統的圖像樂譜分割技術。
發明內容
本發明的目的是為了提供一種快速有效的樂譜連通域快速分析方法,進一步提高光學樂譜識別系統中樂譜連通域分割的速度和正確率,以便獲得更高的樂譜識別率。
本發明為實現上述目的,采用如下技術方案:
本發明基于行游程鄰接表的樂譜快速連通域分析方法,包括如下步驟:
(1)對圖像F(x,y)由上至下進行行掃描,記錄下各行的黑色游程信息,得到整幅圖像的水平黑色游程信息表Yctable:{spj,lj,Ni,Flagi,i|j=1,2,…Ni,i=1,2,…xsize},其中xsize為樂譜圖像F(x,y)的總行數,i表示行號,Ni為第i行的水平黑色游程總數,Flagi表示該第i行有無黑色游程,值為1則表示存在水平黑色游程,反之則無,spj表示第i行的第j個水平黑色游程的起點,lj為第i行的第j個水平黑色游程的長度;
(2)建立重要信息統計矩陣向量:包括尺寸為1×M的上一行各黑色游程段所屬的連通域編號向量syhbh,其中M為上一行黑色游程的段數,以及尺寸為1×N的下一行各黑色游程段所屬的連通域編號向量xyhbh,其中N為上一行黑色游程的段數,連通域編號的最小值設為1;n×2×bht的連通域像素向量ltyxsb,其中n為各個連通域中所包含的像素的個數,bht為連通域的個數,以便保存各連通域中所包含的全部像素的橫坐標和縱坐標;廢除的連通域編號向量fcdltybh,用來保存哪些連通域編號在算法執行中被執行了合并而消失;并設置圖像水平黑色游程信息表Yctable的行號i=1;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010275849.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顧客消費分析系統
- 下一篇:基因芯片閱讀儀及基因芯片判讀方法





