[發(fā)明專(zhuān)利]一種定標(biāo)集確定方法及裝置在審
申請(qǐng)?zhí)枺?/td> | 201910361757.6 | 申請(qǐng)日: | 2019-04-30 |
公開(kāi)(公告)號(hào): | CN110096708A | 公開(kāi)(公告)日: | 2019-08-06 |
發(fā)明(設(shè)計(jì))人: | 王棟;付瑞吉;宋巍;王士進(jìn);胡國(guó)平;秦兵;劉挺 | 申請(qǐng)(專(zhuān)利權(quán))人: | 科大訊飛股份有限公司 |
主分類(lèi)號(hào): | G06F17/27 | 分類(lèi)號(hào): | G06F17/27;G06F16/35;G06K9/62 |
代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王雨;王寶筠 |
地址: | 230088 安徽*** | 國(guó)省代碼: | 安徽;34 |
權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 答題內(nèi)容 聚類(lèi)簇 定標(biāo) 屬性差別 抽取 聚類(lèi) 從屬 申請(qǐng) 評(píng)測(cè) 自動(dòng)評(píng)測(cè) 準(zhǔn)確度 均衡性 答題 題目 覆蓋 保證 | ||
本申請(qǐng)公開(kāi)了一種定標(biāo)集確定方法及裝置,本方法首先獲取各答題對(duì)象對(duì)目標(biāo)題目的答題內(nèi)容,然后根據(jù)各所述答題內(nèi)容間的屬性差別,對(duì)各答題內(nèi)容進(jìn)行聚類(lèi),通過(guò)聚類(lèi)可以將屬性相近的答題內(nèi)容聚集到一個(gè)聚類(lèi)簇中,由此得到至少兩個(gè)聚類(lèi)簇,其中,從屬于同一聚類(lèi)簇的各答題內(nèi)容的屬性差別更小,而從屬于不同聚類(lèi)簇的答題內(nèi)容的屬性差別更大。進(jìn)一步,從每個(gè)聚類(lèi)簇中抽取答題內(nèi)容,由抽取的答題內(nèi)容組成定標(biāo)集。綜上可見(jiàn),本申請(qǐng)抽取的定標(biāo)集包含了各個(gè)聚類(lèi)簇中的答題內(nèi)容,也即覆蓋了各屬性的答題內(nèi)容,保證了定標(biāo)集的均衡性。進(jìn)一步,基于本申請(qǐng)抽取的定標(biāo)集訓(xùn)練的自動(dòng)評(píng)測(cè)模型,其評(píng)測(cè)準(zhǔn)確度也會(huì)更高。
技術(shù)領(lǐng)域
本申請(qǐng)涉及自然語(yǔ)言處理領(lǐng)域,更具體地說(shuō),涉及一種定標(biāo)集確定方法及裝置。
背景技術(shù)
當(dāng)今社會(huì)各行各業(yè)都存在對(duì)用戶(hù)的考評(píng),且考試的種類(lèi)越來(lái)越多,考試過(guò)程需要對(duì)答題者提交的答題內(nèi)容進(jìn)行評(píng)測(cè),以對(duì)答題者的水平進(jìn)行衡量。評(píng)測(cè)過(guò)程可以采用有定標(biāo)評(píng)測(cè)方法,即自動(dòng)評(píng)測(cè)前,需要預(yù)先抽取一部分答題內(nèi)容進(jìn)行人工評(píng)測(cè),人工評(píng)測(cè)后的答題內(nèi)容可以作為自動(dòng)評(píng)測(cè)模型的定標(biāo)集。
目前,定標(biāo)集的抽取方法為在所有答題內(nèi)容中隨機(jī)抽取一定數(shù)量的答題內(nèi)容。可以理解的是,由于答題者的水平參差不齊,所以答題內(nèi)容間也存在差別。按照現(xiàn)有的隨機(jī)抽取法抽取的定標(biāo)集,可能無(wú)法均勻的覆蓋各水平答題者的答題內(nèi)容,由此造成定標(biāo)集的不均衡,基于該定標(biāo)集訓(xùn)練后的自動(dòng)評(píng)測(cè)模型的準(zhǔn)確度也會(huì)降低。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)?zhí)峁┝艘环N定標(biāo)集確定方法及裝置,以解決現(xiàn)有定標(biāo)集確定方法中抽取的定標(biāo)集不均衡的缺點(diǎn)。
為了實(shí)現(xiàn)上述目的,現(xiàn)提出的方案如下:
一種定標(biāo)集確定方法,包括:
獲取各答題對(duì)象對(duì)目標(biāo)題目的答題內(nèi)容;
根據(jù)各所述答題內(nèi)容間的屬性差別,對(duì)各所述答題內(nèi)容進(jìn)行聚類(lèi),得到至少兩個(gè)聚類(lèi)簇;
從每個(gè)所述聚類(lèi)簇中抽取答題內(nèi)容,由抽取的答題內(nèi)容組成定標(biāo)集。
優(yōu)選地,根據(jù)各所述答題內(nèi)容間的屬性差別,對(duì)各所述答題內(nèi)容進(jìn)行聚類(lèi),包括:
確定每?jī)蓷l答題內(nèi)容的相似度,所述相似度表征了該兩條答題內(nèi)容的屬性差別;
根據(jù)所述每?jī)蓷l答題內(nèi)容的相似度,對(duì)各所述答題內(nèi)容進(jìn)行聚類(lèi)。
優(yōu)選地,確定每?jī)蓷l答題內(nèi)容的相似度,包括:
確定每?jī)蓷l答題內(nèi)容的相似度特征向量;
根據(jù)每?jī)蓷l答題內(nèi)容的相似度特征向量,確定每?jī)蓷l答題內(nèi)容的相似度。
優(yōu)選地,確定每?jī)蓷l答題內(nèi)容的相似度特征向量,包括:
確定每一所述答題內(nèi)容的聚類(lèi)特征;
針對(duì)每?jī)蓷l答題內(nèi)容,根據(jù)該兩條答題內(nèi)容各自的聚類(lèi)特征,確定該兩條答題內(nèi)容的相似度特征向量。
優(yōu)選地,根據(jù)每?jī)蓷l答題內(nèi)容的相似度特征向量,確定每?jī)蓷l答題內(nèi)容的相似度,包括:
確定所述目標(biāo)題目所屬的目標(biāo)題型;
確定與所述目標(biāo)題型對(duì)應(yīng)的權(quán)重向量,所述權(quán)重向量表示目標(biāo)題型的目標(biāo)題目下,每?jī)蓷l答題內(nèi)容的相似度特征向量中,各維度對(duì)相似度值的影響比重;
基于所述權(quán)重向量,對(duì)所述每?jī)蓷l答題內(nèi)容的相似度特征向量做加權(quán)求和或加權(quán)平均,得到每?jī)蓷l答題內(nèi)容的相似度值。
優(yōu)選地,確定與所述目標(biāo)題型對(duì)應(yīng)的權(quán)重向量,包括:
查詢(xún)預(yù)設(shè)的題型與權(quán)重向量的對(duì)應(yīng)關(guān)系,確定所述目標(biāo)題型對(duì)應(yīng)的權(quán)重向量;
或,
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910361757.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種智能評(píng)測(cè)方法和系統(tǒng)
- 答題數(shù)據(jù)處理方法和裝置
- 一種基于教學(xué)內(nèi)容的人機(jī)互動(dòng)方法及裝置、用戶(hù)設(shè)備
- 答題卡圖片定位方法、裝置、可讀存儲(chǔ)介質(zhì)以及電子設(shè)備
- 答題卡圖片糾偏方法、裝置、可讀存儲(chǔ)介質(zhì)以及電子設(shè)備
- 一種定標(biāo)集確定方法及裝置
- 數(shù)據(jù)處理方法與裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 答題卡內(nèi)容識(shí)別方法
- 練習(xí)冊(cè)內(nèi)容識(shí)別方法
- 一種答題圖片的防抓取方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種信息風(fēng)險(xiǎn)監(jiān)測(cè)方法及裝置
- 基于大數(shù)據(jù)的聚類(lèi)方法、設(shè)備、存儲(chǔ)介質(zhì)及裝置
- 數(shù)據(jù)聚類(lèi)的簇?cái)?shù)確定方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種無(wú)人機(jī)基站的部署方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 聚類(lèi)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種客服對(duì)話語(yǔ)料聚類(lèi)方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 文本識(shí)別方法和裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像的聚類(lèi)方法和裝置
- 文本聚類(lèi)方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 多媒體內(nèi)容處理方法、裝置、設(shè)備及介質(zhì)
- ZQ定標(biāo)電路和具有它的半導(dǎo)體裝置
- 光功率自動(dòng)定標(biāo)系統(tǒng)及方法
- 多載波系統(tǒng)中基于實(shí)例進(jìn)程的自動(dòng)定標(biāo)方法
- 一種基于探元指向角光學(xué)推掃衛(wèi)星在軌分步幾何定標(biāo)方法
- 一種基于使用歷史的視線跟蹤定標(biāo)方法
- 輻射定標(biāo)方法及裝置
- 一種定標(biāo)裝置及定標(biāo)方法
- 用于云雷達(dá)的極化定標(biāo)方法、裝置及系統(tǒng)
- 一種DBF星載SAR系統(tǒng)內(nèi)定標(biāo)裝置及內(nèi)定標(biāo)方法
- 紅外輻射聯(lián)合定標(biāo)系統(tǒng)及其定標(biāo)方法