[發(fā)明專利]基于心理學(xué)行為分析的眾包欺詐檢測方法有效
| 申請?zhí)枺?/td> | 201410376503.9 | 申請日: | 2014-08-02 |
| 公開(公告)號: | CN104133769B | 公開(公告)日: | 2017-01-25 |
| 發(fā)明(設(shè)計)人: | 李鵬;張楷卉;劉洋 | 申請(專利權(quán))人: | 哈爾濱理工大學(xué) |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F17/30 |
| 代理公司: | 哈爾濱東方專利事務(wù)所23118 | 代理人: | 陳曉光 |
| 地址: | 150080 黑龍江省哈*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 心理學(xué) 行為 分析 欺詐 檢測 方法 | ||
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于心理學(xué)行為分析的眾包欺詐檢測方法。
背景技術(shù):
目前,在軟件測試、人工智能的內(nèi)容篩選及機器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)標(biāo)記等領(lǐng)域都有眾包的應(yīng)用。然而眾包技術(shù)還處于發(fā)展階段,仍有眾多因素嚴(yán)重影響了眾包結(jié)果質(zhì)量,使得眾包不能夠有效地為任務(wù)需求者服務(wù)。最終收集來的眾包結(jié)果含有大量的垃圾數(shù)據(jù),需求者不得不浪費眾多人力和物力,以解決眾包被檢測者的欺詐行為帶來的后果。現(xiàn)有的一些眾包質(zhì)量控制技術(shù)雖然得到了應(yīng)用但卻收效甚微,為了提高眾包質(zhì)量,使得眾包得到有效地應(yīng)用。一種具有檢測欺詐行為眾包被檢測者,并且過濾掉質(zhì)量較差的垃圾數(shù)據(jù)的眾包欺詐檢測方法亟待被提出。
發(fā)明內(nèi)容:
本發(fā)明采用一種基于心理學(xué)的行為分析方法,引入艾賓浩斯遺忘曲線對眾包被檢測者的行為規(guī)律進行判斷,通過比較欺詐行為與可靠行為之間的差異,完成眾包的欺詐檢測。
上述的目的通過以下的技術(shù)方案實現(xiàn):
一種基于心理學(xué)行為分析的眾包欺詐檢測方法,該方法包括如下步驟:被檢測者對原始數(shù)據(jù)文檔進行工作;
通過時鐘控制單元對整個系統(tǒng)的全局進行時間控制,從被檢測者著手工作開始計時,當(dāng)達到預(yù)定的時間點時,觸發(fā)各個單元執(zhí)行特定功能;根據(jù)時鐘控制單元記錄的工作的時間以及次數(shù),將文檔傳遞至數(shù)據(jù)分組單元進行動態(tài)地分組;
通過數(shù)據(jù)分組單元根據(jù)被檢測者對各個文檔打分后保持當(dāng)前狀態(tài)不變的時間長度以及文檔被重復(fù)打分的次數(shù),將文檔階段性地分組,并且將達到標(biāo)準(zhǔn)的文檔傳送到其他單元進行處理;
隨著任務(wù)的推進,被檢測者標(biāo)簽質(zhì)量控制單元會對所得的文檔子集上的反映進行篩選,最后被檢測者質(zhì)量控制單元根據(jù)以上結(jié)果比對進而檢測到被檢測者的欺詐行為,發(fā)送電信號驅(qū)動標(biāo)記機進行標(biāo)記。
所述的基于心理學(xué)行為分析的眾包欺詐檢測方法,所述的數(shù)據(jù)分組單元中包含三個子數(shù)據(jù)集O、W和T,用于階段性地存儲分組數(shù)據(jù),并且不斷地把文檔定時重新呈獻給用戶再次工作。
所述的基于心理學(xué)行為分析的眾包欺詐檢測方法,所述的被檢測者標(biāo)簽質(zhì)量控制單元會對所得的文檔子集上的反映進行篩選,是依據(jù)被檢測者記憶會隨著時間的推移而減退,并且針對認真程度不同的工作,記憶的清晰程度也同樣不同情況,根據(jù)被檢測者的記憶在工作時間以及多次工作一致程度上的反映,此單元階段性地對各被檢測者所完成任務(wù)的標(biāo)簽質(zhì)量進行評估,并將其與閾值相比較篩選出質(zhì)量合格的標(biāo)簽。
所述的基于心理學(xué)行為分析的眾包欺詐檢測方法,被檢測者標(biāo)簽質(zhì)量控制單元會對所得的文檔子集上的反映進行篩選,是根據(jù)所述的時鐘控制單元、所述的數(shù)據(jù)分組單元、所述的被檢測者標(biāo)簽質(zhì)量控制單元的輸出數(shù)據(jù),綜合根據(jù)被檢測者在各時間段的表現(xiàn)以及完成任務(wù)的質(zhì)量,檢測被檢測者的欺詐行為,識別并過濾那些不可信的被檢測者。
有益效果:
1.本發(fā)明通過對被檢測者重復(fù)性工作進行比較,得出質(zhì)量評判結(jié)果,改變以往眾包檢測的單純篩選機制,增大了眾包檢測的適應(yīng)范圍,促進了眾包技術(shù)在多領(lǐng)域的應(yīng)用和發(fā)展。
2.本發(fā)明能夠通過采用一種基于心理學(xué)的行為分析方法,引入艾賓浩斯遺忘曲線對眾包被檢測者的行為規(guī)律進行判斷,通過比較欺詐行為與可靠行為之間的差異,完成眾包的欺詐檢測,提高了眾包質(zhì)量篩選的準(zhǔn)確度,大幅度的節(jié)省任務(wù)發(fā)起者的人力、物力以及時間。本發(fā)明技術(shù)是一種應(yīng)用于眾包中的質(zhì)量控制方法,其創(chuàng)新地將心理學(xué)中的艾賓浩斯記憶規(guī)律與計算機技術(shù)結(jié)合,解決在眾包工作中的工人存在欺詐行為的問題。
3.我們參加了國際文本檢索會議的眾包評測,以評測我們的技術(shù)。會議為各個檢測參賽單位提供了屬于10個主題的2758個網(wǎng)頁文件作為測試數(shù)據(jù)。首先,我們建立了眾包平臺,令用戶依據(jù)6個關(guān)聯(lián)性等級對會議提供給我們的測試數(shù)據(jù)進行打分貼標(biāo)簽。然后,我們將系統(tǒng)檢測過濾后的具有標(biāo)簽的數(shù)據(jù)結(jié)果提交給評委。最后,會議利用他們的黃金標(biāo)準(zhǔn)(會議給出的具有標(biāo)簽的數(shù)據(jù))對各參賽隊伍提交的結(jié)果進行評估。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱理工大學(xué),未經(jīng)哈爾濱理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410376503.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





