[發明專利]使用否定數據優化多類別多媒體數據分類有效
| 申請號: | 201680006455.1 | 申請日: | 2016-01-15 |
| 公開(公告)號: | CN107209861B | 公開(公告)日: | 2021-12-31 |
| 發明(設計)人: | 華先勝;李勁;I·米斯拉 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 王茂華;黃捷 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 否定 數據 優化 類別 多媒體 分類 | ||
描述了用于通過利用否定多媒體數據項訓練和更新分類器來優化多類別圖像分類的技術。該技術描述了訪問多個多媒體數據項中的肯定多媒體數據項,從肯定多媒體數據項中提取特征,以及至少部分基于特征來訓練分類器。分類器可以包括多個模型向量,每個模型向量對應于個體標簽之一。系統可以使用肯定多媒體數據和否定多媒體數據迭代地測試分類器,并且可以取決于多媒體數據項是肯定的還是否定的來有區別地更新與分類器相關聯的一個或多個模型向量。還描述了用于應用分類器以至少部分基于將相似度值與從分類器訓練得到的相應統計值相比較來確定新的多媒體數據項是否與主題相關聯的技術。
背景技術
計算機視覺可以包括對象識別、對象分類、對象類檢測、圖像分類等。對象識別可以描述尋找特定對象(例如,特定樣式的手提包、特定人物的臉部等)。對象分類和對象類檢測可以描述尋找屬于特定類(例如,面部、鞋子、汽車等)的對象。多媒體數據分類可以描述將整個多媒體數據項分配給特定類(例如,位置識別、紋理分類等)。使用多媒體數據的計算機對象識別、檢測和/或分類是具有挑戰性的,因為一些對象和/或多媒體數據項可能不屬于特定類,但是可能被(誤)分類為與特定類相關聯的標簽,盡管其不屬于該特定類。因此,用于準確地確定對象和/或多媒體數據項不是類的一部分(即,拒絕對象和/或多媒體數據項)的技術對于提高分類準確性是有用的。
用于拒絕對象和/或多媒體數據項的當前技術是容易出錯的。用于拒絕對象和/或多媒體數據項的一種技術利用閾值來拒絕具有低于預定閾值的分類后(post-classification)值的任何對象和/或多媒體數據項。然而,通常,這種閾值技術不準確,并且與主題相關聯的對象和/或多媒體數據項被錯誤地拒絕。例如,用戶可以在“狗”類中輸入用于分類的小狗的照片。由于小狗很難分類,所以分類器可能輸出低于預定閾值的分類值,以表示該小狗不與“狗”類中的任何標簽相關聯。然而,小狗是一只狗,因此,這種分類是不準確的。
其他技術(例如,n+1分類技術)收集肯定和否定數據。肯定數據可以包括與類(例如,狗)中的標簽相關聯的對象和/或多媒體數據項。否定數據可以包括不與類中的任何標簽相關聯的對象和/或多媒體數據項(例如,不是狗)。這樣的技術訓練分類器以識別與類中的每個標簽相關聯的對象和/或多媒體數據項(例如,識別對象和/或多媒體數據項是特定類型的狗),以及識別與不與該類中的任何標簽相關聯的附加類相關聯的對象和/或多媒體數據項(例如,識別對象和/或多媒體數據項不是狗)。然而,否定數據可以包括非常多樣化的標簽和類別集合,因此,個體模型可能不能準確地標識不屬于類(例如,狗)中的標簽的對象和/或多媒體數據項。
發明內容
本公開描述了用于通過利用否定多媒體數據項訓練分類器來優化多類別多媒體數據分類的技術。通過提高對輸入的多媒體數據項進行分類的準確性并且減少用于訓練分類器的計算資源量,本文中描述的技術利用否定多媒體數據項來優化多類別多媒體數據分類。通過訓練分類器以更好地區分與主題(例如,類、類別等)相關聯的多媒體數據項和不與該主題相關聯的多媒體數據項,利用否定多媒體數據項改進了分類器準確性。
本文中的系統和方法描述了訪問多個多媒體數據項,其可以包括用于訓練分類器的肯定多媒體數據項和否定多媒體數據項的。肯定多媒體數據項可以包括屬于與主題相關聯的標簽的多媒體數據項。否定多媒體數據項可以包括不屬于該主題的多媒體數據項。系統可以使用肯定多媒體數據和否定多媒體數據迭代地測試分類器,并且可以取決于多媒體數據項是肯定的還是否定的來有區別地更新與分類器相關聯的模型向量。在一個示例中,系統可以訪問多個否定多媒體數據項中的否定多媒體數據項。系統可以從否定多媒體數據項中提取特征,并且將分類器應用于特征以確定與和主題相關聯的標簽相對應的相似度值。分類器可以包括多個模型向量,每個模型向量對應于與主題相關聯的標簽之一。系統可以確定與特定標簽相關聯的相似度值大于與特定標簽相關聯的統計值。統計值可以由使用肯定多媒體數據項訓練分類器來得出。至少部分基于確定相似度值大于統計值,系統可以調整與特定標簽相對應的個體模型向量以更新分類器從而更準確地確定多媒體數據項是否屬于主題。在附加或替代示例中,系統可以訪問肯定多媒體數據項,并且可以使用不同的過程來更新分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680006455.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





