[發(fā)明專利]使用基于學(xué)習(xí)者模型的對話模板的圖像對象消歧解決方案有效
| 申請?zhí)枺?/td> | 202010045971.3 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111522982B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計)人: | V.艾坎巴拉姆;P.戴伊;R.科庫;R.S.米塔爾 | 申請(專利權(quán))人: | 國際商業(yè)機器公司 |
| 主分類號: | G06F16/55 | 分類號: | G06F16/55;G06F40/205;G06F40/284;G06F40/30 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 邸萬奎 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 使用 基于 學(xué)習(xí)者 模型 對話 模板 圖像 對象 解決方案 | ||
本文提供了用于圖像對象消歧解決方案的方法、系統(tǒng)和計算機程序產(chǎn)品。一種方法的示例包括:發(fā)起用于解決與圖像中的對象相對應(yīng)的標簽組當(dāng)中的歧義的對話;使用單詞網(wǎng)來確定區(qū)分該組內(nèi)的至少一個第一標簽和至少一個第二標簽的屬性;從屬性中選擇第一屬性以生成問題,其中所述選擇至少部分基于用戶的學(xué)習(xí)者模型,該學(xué)習(xí)者模型包括指示用戶對屬性中的每一個和一個或多個標簽中的每一個的先驗知識水平的信息;將信任分數(shù)分配給答案;以及基于信任分數(shù)與閾值的比較,確定是否呈現(xiàn)至少第二問題來驗證第一答案。
技術(shù)領(lǐng)域
本申請一般涉及信息技術(shù),并且更具體地,涉及圖像識別技術(shù)。
背景技術(shù)
通常,人們在參與活動時進行學(xué)習(xí)。使用物理-數(shù)字耦合,人們可以把文字附加到他們經(jīng)歷的事情上。
當(dāng)前具有物理-數(shù)字交互的學(xué)習(xí)應(yīng)用通常分為兩類:應(yīng)用發(fā)起的活動和用戶發(fā)起的活動。在應(yīng)用發(fā)起的活動中,應(yīng)用向用戶提供上下文,并且用戶需要例如找到相關(guān)的物理對象并拍照。在用戶發(fā)起的活動中,用戶拍攝用戶想要了解更多的對象的照片。然而,很少有應(yīng)用允許通過數(shù)字對象與用戶交互。
發(fā)明內(nèi)容
在本公開的一個示例實施例中,提供了用于使用基于學(xué)習(xí)者模型的對話模板的圖像對象消歧(disambiguation)解決方案的技術(shù)。示例性計算機實現(xiàn)的方法包括發(fā)起與用戶的對話,用于解決與圖像中的對象相對應(yīng)的分類標簽組當(dāng)中的歧義。該方法還包括使用單詞網(wǎng)(wordweb)來確定一個或多個屬性,該一個或多個屬性區(qū)分組內(nèi)的分類標簽中的至少第一個和分類標簽中的至少第二個。該方法還包括至少部分地基于用戶的學(xué)習(xí)者模型選擇屬性中的第一屬性來生成要呈現(xiàn)給用戶的問題,其中學(xué)習(xí)者模型包括指示用戶對(i)一個或多個屬性中的每一個和(ii)一個或多個分類標簽中的每一個的先驗知識水平的信息。此外,該方法包括向由用戶響應(yīng)于該問題而輸入的回答分配信任分數(shù)(belief?score),其中該信任分數(shù)至少部分基于用戶關(guān)于第一屬性的先驗知識水平。此外,該方法包括至少部分基于信任分數(shù)與第一閾值的比較,確定是否向用戶呈現(xiàn)至少一個第二問題以驗證回答。此外,該方法包括當(dāng)信任分數(shù)超過閾值時,從分類標簽組中移除(i)第一分類標簽和(ii)第二分類標簽中的至少一個。
在實施例的另一示例中,計算機實現(xiàn)的方法包括發(fā)起與用戶的對話,以解決與圖像中的對象相對應(yīng)的分類標簽組當(dāng)中的歧義。該方法還包括使用單詞網(wǎng)來標識一個或多個概念,這些概念區(qū)分組內(nèi)的至少一個第一分類標簽和至少一個第二分類標簽。該方法還包括對一個或多個概念進行排序,以對用戶最可能理解的概念進行優(yōu)先級排序(prioritize),其中所述排序至少部分基于學(xué)習(xí)分數(shù)集,該學(xué)習(xí)分數(shù)集指示用戶對一個或多個概念中的每一個的知識水平。該方法還包括至少部分基于具有最高排序的概念生成要呈現(xiàn)給用戶的問題。另外,該方法包括為用戶響應(yīng)于該問題而輸入的回答分配信任分數(shù),其中該信任分數(shù)至少部分基于用戶對于具有最高排序的概念的學(xué)習(xí)分數(shù)。此外,該方法包括至少部分基于信任分數(shù)來確定是否生成至少一個進一步的問題以驗證用戶的回答。
本發(fā)明的另一實施例或其元件可以以有形地包含計算機可讀指令的計算機程序產(chǎn)品的形式來實現(xiàn),當(dāng)實現(xiàn)時,該計算機可讀指令使得計算機執(zhí)行如本文所述的多個方法步驟。此外,本發(fā)明的另一實施例或其元件可以以包括存儲器和至少一個處理器的系統(tǒng)的形式來實現(xiàn),該處理器耦合到存儲器并被配置為執(zhí)行所述方法步驟。此外,本發(fā)明的另一實施例或其元件可以以用于執(zhí)行本文描述的方法步驟的裝置或其元件的形式來實現(xiàn);該裝置可以包括(多個)硬件模塊或硬件和軟件模塊的組合,其中軟件模塊存儲在有形的計算機可讀存儲介質(zhì)(或多個這樣的介質(zhì))中。
本發(fā)明的這些和其他目的、特征和優(yōu)點將從下面結(jié)合附圖閱讀的對其說明性實施例的詳細描述中變得顯而易見。
附圖說明
圖1是示出根據(jù)本發(fā)明的示例性實施例的系統(tǒng)架構(gòu)的圖;
圖2是示出根據(jù)本發(fā)明的示例性實施例的單詞網(wǎng)的示例的圖;
圖3是根據(jù)本發(fā)明的示例性實施例的過程流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國際商業(yè)機器公司,未經(jīng)國際商業(yè)機器公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010045971.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:顯示裝置
- 下一篇:圖像形成裝置、判定裝置以及控制方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 一種基于個人線下好友關(guān)系的在線學(xué)習(xí)方法
- 一種分析學(xué)習(xí)者學(xué)習(xí)活動的設(shè)備和方法及其對應(yīng)的介質(zhì)
- 輔助學(xué)習(xí)的方法及裝置
- 基于教育大數(shù)據(jù)的學(xué)習(xí)者模型動態(tài)構(gòu)建方法
- 使用指導(dǎo)者模型訓(xùn)練學(xué)習(xí)者模型的人工智能系統(tǒng)和方法
- 基于大數(shù)據(jù)的學(xué)習(xí)路徑規(guī)劃方法、裝置、設(shè)備和存儲介質(zhì)
- 一種面向聽障人士的輔助發(fā)音學(xué)習(xí)方法及其系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種基于演化博弈的在線知識共享動態(tài)獎勵方法





