[發明專利]一種圖像主要目標的定位與識別方法有效

申請號：	201410100575.0	申請日：	2014-03-18
公開（公告）號：	CN103824067A	公開（公告）日：	2014-05-28
發明（設計）人：	李侃;白琳;徐琛	申請（專利權）人：	北京理工大學
主分類號：	G06K9/00	分類號：	G06K9/00;G06K9/32
代理公司：	暫無信息	代理人：	暫無信息
地址：	100081 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種圖像主要目標定位識別方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種圖像主要目標定位與識別方法，屬于數字圖像處理領域。

背景技術

隨著人工智能技術的不斷發展，如何實現計算機自主認識周圍環境、模仿人類自主理解周圍世界，已成為當前以及今后很長一段時間計算機、人工智能技術的主要研究目標。實現計算機自主認識周圍環境、自主理解周圍世界的關鍵環節——實現圖像主要目標定位與識別。圖像主要目標是指處于原始圖像中央區域內，處于較淺深度的目標。圖像主要目標定位與識別技術是目前圖像處理研究領域的一個熱點、難點，其具有很寬廣的應用前景。例如：在反恐維安等警方調查活動中，實現計算機自動發現、定位犯罪份子等。隨著監控視頻探頭的普及與應用，越來越成為輔助警方分析犯罪活動，抓捕罪犯的有力幫手。由于監控視頻拍攝的視頻圖像一般都幾個小時，甚至幾天的時長，而犯罪活動一般只有短短的幾分鐘。想要從冗長的視頻錄像中發現、定位犯罪活動的時間，分析犯罪過程，目前只能完全依靠警員長時間的觀看視頻錄像來確定。這不僅耗費了大量的人力，而且花費時間也比較長，降低了第一時間抓捕罪犯的機率。

目前，圖像主要目標定位與識別研究仍處于初期階段。大部分的研究工作仍處于單個目標的識別與定位，并不能有效的確認圖像中的主要目標。

美國伊利諾伊州大學香檳分校的Pedro?F.Felzenszwalb博士和他的團隊開創性的提出了輪廓模型（Deformable?Part?Model）較好的實現了圖像中各種目標的定位與識別。開啟了圖像目標識別研究領域的新時代，但是輪廓模型并不能分析、定位圖像的主要目標。

美國普林斯頓大學的Li.L.J博士和Fei-Fei.L博士的研究團隊長期致力于圖像分割與目標識別的研究工作，在數字圖像的場景識別與目標定位研究中取得了很好的效果。他們通過構建聯合概率模型，實現了計算機自動定位與識別圖像中的各種目標，實現各種目標的簡單文字標注，但是沒能找出圖像的主要目標。

美國卡內基.梅隆大學的A.Gupta教授領導的研究團隊和美國伊利諾伊州大學香檳分校的Ali?Farhadi博士的研究團隊以概率模型為基礎，進行了大量關于圖像目標定位與識別的研究。A.Gupta教授領導的研究團隊提出一種基于貝葉斯方法的概率模型，通過計算各種類型的圖像中不同目標出現的概率，來提高圖像中的各種目標定位與識別的準確性。Ali?Farhadi博士的研究團隊通過采用改進的輪廓模型，提高圖像中各種目標的定位與識別的準確性。而且他們還開創性的提出了圖像語言短語（Visual?Phrases）來發現圖像中的各種目標之間的特定關系，并通過統計的方法試圖找出圖像中的主要目標。

因此，需要設計一種更符合人類認知過程的、更加高效的計算機圖像識別方法，實現計算機快速自動發現、定位冗長視頻中包含犯罪活動或犯罪分子的關鍵幀。

發明內容

本發明的目的是為了提供一種圖像主要目標的定位與識別方法，實現計算機快速自動發現、定位冗長視頻中包含犯罪活動或犯罪分子的關鍵幀。

本發明的目的是通過以下技術方案實現的。

一種圖像主要目標的定位與識別方法，其具體操作步驟為：

步驟一、從待識別圖像中識別單體目標，操作步驟包括：

步驟1.1：輪廓模型（Deformable?Part?Models）集合中包含單體輪廓模型和關系輪廓模型。單體輪廓模型和關系輪廓模型均為m×n的矩陣模型，其中，m、n∈(0,300)，且m、n均為正整數。依次使用輪廓模型集合中的每個單體輪廓模型對待識別圖像進行步驟1.2的操作。

步驟1.2：使用當前單體輪廓模型，以逐像素的方法遍歷待識別圖像，將完全匹配成功的像素區域，用正好能覆蓋的矩形框標記出來。

經過步驟一的操作，可以得到待識別圖像中的單體目標。

步驟二、從待識別圖像中識別關系目標，操作步驟包括：

步驟2.1：依據搜索關鍵詞，從輪廓模型集合中的關系模型子集中找到含有關鍵詞的關系模型。

步驟2.2：依次使用步驟2.1得到的關系輪廓模型對待識別圖像進行步驟2.3的操作。