[發(fā)明專利]題庫的數(shù)據(jù)組織方法、裝置及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202110588181.4 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113297381A | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計)人: | 黃鶴南;王巖;程童;王敏;顏聰;董金奎;張文翰;冉煜;劉向陽 | 申請(專利權(quán))人: | 作業(yè)幫教育科技(北京)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06Q50/20 |
| 代理公司: | 北京清誠知識產(chǎn)權(quán)代理有限公司 11691 | 代理人: | 喻穎 |
| 地址: | 100085 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 題庫 數(shù)據(jù) 組織 方法 裝置 電子設(shè)備 | ||
本發(fā)明屬于在計算機技術(shù)領(lǐng)域,提供一種題庫的數(shù)據(jù)組織方法、裝置及電子設(shè)備,所述方法包括:題庫篩選出內(nèi)容相同的題目;將內(nèi)容相同的各題目組成一個簇,存儲各簇及其對應(yīng)題目的對應(yīng)關(guān)系,后續(xù)題庫管理以及對外提供數(shù)據(jù)服務(wù)時,基于簇進行,從而可以提高對題庫中內(nèi)容相同題目的處理效率,方便題目管理。
技術(shù)領(lǐng)域
本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別適用于互聯(lián)網(wǎng)在線教育技術(shù),更具體的是涉及一種題庫的數(shù)據(jù)組織方法、裝置、電子設(shè)備及計算機可讀介質(zhì)。
背景技術(shù)
目前,市面上出現(xiàn)了越來越多的拍照搜題類產(chǎn)品,該類產(chǎn)品的核心競爭力主要在于題目搜索的準確率,準確率越高,表明搜到的題目與原題越相似,有利于提升用戶體驗,增加用戶粘性。
拍照搜題功能基于題庫實現(xiàn),目前題庫中存在很多重復(fù)的題目,對數(shù)據(jù)管理以及檢索等數(shù)據(jù)服務(wù)而言,存在可以優(yōu)化的潛力。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題
本發(fā)明旨在解決現(xiàn)有題庫中對內(nèi)容相同題目處理效率低下的技術(shù)問題。
(二)技術(shù)方案
為解決上述技術(shù)問題,本發(fā)明的一方面提出一種題庫的數(shù)據(jù)組織方法,所述方法包括如下步驟:
從所述題庫篩選出內(nèi)容相同的題目;
將內(nèi)容相同的各題目組成一個簇,存儲各簇及其與題目的對應(yīng)關(guān)系,后續(xù)基于簇進行題庫管理以及對外提供數(shù)據(jù)服務(wù)。
根據(jù)本發(fā)明一種優(yōu)選的實施方式,從所述題庫篩選出內(nèi)容相同的題目,包括:
通過對所述題庫中的題目進行聚類處理以形成多個簇,每個簇包括一個或多個內(nèi)容相同的題目。
根據(jù)本發(fā)明一種優(yōu)選的實施方式,所述簇結(jié)構(gòu)為環(huán)形聚簇,所述環(huán)形聚簇包括兩兩內(nèi)容相同的題目,兩兩內(nèi)容相同的題目存在對應(yīng)關(guān)系。
根據(jù)本發(fā)明一種優(yōu)選的實施方式,所述簇結(jié)構(gòu)為星型聚簇,所述星型聚簇包括一個作為簇頭的虛擬題目和作為簇成員的內(nèi)容相同的各個題目,所述虛擬題目選自作為所述簇內(nèi)成員的各個題目,或者由作為所述簇內(nèi)成員的各個題目生成,所述簇的簇頭與作為所述簇內(nèi)成員的各個題目存在對應(yīng)關(guān)系。
根據(jù)本發(fā)明一種優(yōu)選的實施方式,所述作為簇頭的虛擬題目通過以下中的一種方式形成:
所述作為簇頭的虛擬題目為位于對應(yīng)的所述簇內(nèi)的內(nèi)容相同的各個題目中質(zhì)量最優(yōu)的一個;
所述作為簇頭的虛擬題目包括多個字段,所述多個字段的每一個均為在對應(yīng)的所述簇內(nèi)的內(nèi)容相同的各個題目的對應(yīng)字段中所選擇的質(zhì)量最優(yōu)一個;
所述作為簇頭的虛擬題目是對應(yīng)的所述簇內(nèi)各個題目中置信度最高的題目,其中,題目置信度根據(jù)題目屬性進行配置;可選的,所述題目屬性包括:題目字段的格式、題目來源、題目被搜索次數(shù)中的至少一種。
根據(jù)本發(fā)明一種優(yōu)選的實施方式,所述簇頭通過以下方式獲得:
獲取組成所述虛擬題目的各指定字段;
從所述簇內(nèi)所有題目的每個指定字段中票選作為虛擬題目的指定字段;
根據(jù)各個指定字段構(gòu)建虛擬題目,并將該虛擬題目作為簇頭;所述簇頭與對應(yīng)的簇內(nèi)的所有題目內(nèi)容相同,且存在對應(yīng)關(guān)系。
根據(jù)本發(fā)明一種優(yōu)選的實施方式,所述從所述簇內(nèi)所有題目的每個指定字段中票選作為虛擬題目的指定字段,包括:
配置各個指定字段對應(yīng)的票選標準;
根據(jù)各個指定字段對應(yīng)的票選標準及該指定字段選出組成虛擬題目的該指定字段;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于作業(yè)幫教育科技(北京)有限公司,未經(jīng)作業(yè)幫教育科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110588181.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





