[發明專利]用于確定分段的混合式主動機器學習系統和方法在審
| 申請號: | 201880018481.5 | 申請日: | 2018-03-15 |
| 公開(公告)號: | CN110419057A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 茍良;H·楊 | 申請(專利權)人: | 維薩國際服務協會 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 錢慰民;張鑫 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機系統 聚類 標簽 機器學習過程 用戶界面 半監督 機器學習模型 機器學習系統 可視化數據 反饋 標簽執行 重新確定 更新 分段 關聯 群體 | ||
計算機系統可以基于實體的特征和相關標簽執行半監督機器學習過程,以聚類群體中的多個實體。計算機系統可以生成表示實體的聚類和相關標簽的可視化數據以顯示在用戶界面上。用戶可以查看實體的聚類,并使用用戶界面添加或修改與特定實體或實體集相關聯的標簽。計算機系統可以使用用戶的反饋來更新標簽,然后使用半監督的機器學習過程以更新后的標簽作為輸入來重新確定實體的聚類。因此,計算機系統可以使用用戶的反饋來提高機器學習模型的準確性,而不需要更大量的標記的輸入數據。
本申請是要求2017年3月17日提交的第15/462,675號美國專利申請的提交日的權益的國際專利申請,所述美國專利申請以全文引用的方式并入本文中以用于所有目的。
背景技術
分段可用于劃分廣泛群體中的各種實體,使得特定分段中的實體具有類似的特征。例如,可以使用分段來識別不同對象和字符以用于圖像識別,識別音頻中的詞語以用于語音識別,以及根據常見人口統計學或心理圖像學(psychographics)識別個體市場。過去,使用由領域專家定義的規則集執行分段。近來,已經由機器學習過程執行分段,其能夠識別群體數據中的模式。例如,機器學習過程可以構建模型以基于字母“a”的其它圖像和其它字母的圖像來識別圖像中的字母“a”。當更多群體數據被輸入機器學習過程時,這種機器學習過程可以構建更準確的模型。但是,獲得足夠的群體數據以提供足夠的準確度可能是困難而且昂貴的。例如,獲得成千上萬的圖像并且識別、標記所描繪的對象或字母可能是困難而且昂貴的。因此,需要改進的機器學習過程來構建更準確的模型。
發明內容
計算機系統可以執行基于用戶反饋的半監督機器學習過程。半監督機器學習過程可用于基于實體的特征和相關標簽聚類群體內的多個實體。例如,計算機系統可以獲得由多個個體執行的交易的交易數據,并且可以基于他們所執行的交易類型來聚類個體。計算機系統可以獲得與實體子集相關聯的標簽數據,并且可以使用此信息在半監督機器學習過程中細化實體的聚類。
然后,計算機系統可以生成可視化數據,所述可視化數據表示實體的聚類和相關標簽,并且可以顯示在用戶界面上。計算機系統還可以生成實體和特征的b-聚類視圖和熱圖視圖。用戶可以查看實體的聚類,并使用用戶界面添加或修改與特定實體或實體集相關聯的標簽。計算機系統可以接收用戶的反饋以更新標簽,然后使用半監督機器學習過程以更新后的標簽作為輸入來重新確定實體的聚類。結果是,實體的聚類被進一步細化,使得具有類似特征和標簽的實體比在先前的迭代中更靠近在一起。計算機系統還可以基于該實體和具有某個標簽的其他實體之間的距離,預測要與特定實體相關聯的標簽。
計算機系統是有優勢的,因為它使得用戶能夠迭代地細化實體的聚類并通過用戶界面輕松地確定哪些標簽應用于哪些實體。因此,計算機系統可以使用用戶的反饋來提高機器學習模型的準確性,而不需要大量的標簽數據。因此,可以使用用戶的反饋來改進建立的機器學習模型,而不需要更大量的輸入標簽數據來提高準確性。
其它實施例涉及與本文中所描述的方法相關聯的系統。可以參考以下具體實施方式和附圖來更好地了解本發明實施例的性質和優點。
附圖說明
圖1是根據一些實施例的使得用戶能夠向計算機系統提供反饋的分段系統的框圖,該計算機系統確定并可視化數據的群體的分段。
圖2是根據一些實施例的執行分段的計算機系統的功能框圖。
圖3是根據一些實施例的半監督機器學習過程的示意圖。
圖4是根據一些實施例的可視化生成過程以及用于顯示視覺表示并接收用戶反饋的對應用戶界面的功能框圖。
圖5顯示了根據一些實施例的顯示聚類視圖、視圖選擇面板、標簽選擇表和控制面板的用戶界面的圖示。
圖6是根據一些實施例的使用用戶反饋執行半監督機器學習的方法的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于維薩國際服務協會,未經維薩國際服務協會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880018481.5/2.html,轉載請聲明來源鉆瓜專利網。





