[發明專利]科目識別訓練方法、裝置有效
| 申請號: | 201711241772.4 | 申請日: | 2017-11-30 |
| 公開(公告)號: | CN109858006B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 興百橋 | 申請(專利權)人: | 億度慧達教育科技(北京)有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289;G06Q50/20 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 100144 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 科目 識別 訓練 方法 裝置 | ||
1.一種科目識別訓練方法,其特征在于,包括:
訓練識別步驟:根據樣本題目的各個分詞在多個不同科目中的詞頻數值,對所述樣本題目的科目進行識別,其中,所述樣本題目具有科目標記;
判斷步驟:判斷識別結果與所述樣本題目的科目標記是否一致;
調整訓練步驟:若一致,則結束訓練并輸出所述各個分詞在多個不同科目中的詞頻數值;若不一致,則根據各個分詞在某一科目中的詞頻數值與在其它科目中的詞頻數值之間的關系,對各個分詞在多個不同科目中的所述詞頻數值進行調整;
訓練返回步驟:使用調整后的詞頻數值更新原詞頻數值,并返回訓練識別步驟繼續進行科目識別訓練;
其中,根據各個分詞在某一科目中的詞頻數值與在其它科目中的詞頻數值之間的關系,對各個分詞在多個不同科目中的詞頻數值進行調整,包括:根據各個分詞在某一科目中的詞頻數值與該分詞在其它所有科目中的詞頻數值總和之間的關系,對各個分詞在多個不同科目中的詞頻數值進行調整。
2.根據權利要求1所述的方法,其特征在于,所述根據各個分詞在某一科目中的詞頻數值與該分詞在其它所有科目中的詞頻數值總和之間的關系,對各個分詞在多個不同科目中的詞頻數值進行調整,包括:
針對多個分詞中的每個分詞,判斷當前分詞在除當前科目外的其它科目中的詞頻數值總和是否為0;
若當前分詞在其它科目中的詞頻數值總和為0,則將當前分詞在當前科目中的詞頻數值調整為第一設定詞頻數值。
3.根據權利要求2所述的方法,其特征在于,
所述第一設定詞頻數值為:當前詞頻數值與所述多個不同科目的科目數量值、所述多個分詞的分詞數量值之和;
或者,
所述第一設定詞頻數值為:當前詞頻數值與第一乘積與第二乘積之和,其中,所述第一乘積為所述多個不同科目的科目數量值與第一權重系數的乘積;所述第二乘積為所述多個分詞的分詞數量值與第二權重系數的乘積。
4.根據權利要求2或3所述的方法,其特征在于,所述方法還包括:
若當前分詞在其它科目中的詞頻數值總和不為0,則判斷當前分詞在當前科目中的詞頻數值是否大于當前分詞在其他科目中的詞頻數值總和;
若大于,則將當前分詞在當前科目中的詞頻數值調整為第二設定詞頻數值。
5.根據權利要求4所述的方法,其特征在于,
所述第二設定詞頻數值為:當前詞頻數值與所述多個不同科目的科目數量值之和;
或者,
所述第二設定詞頻數值為:當前詞頻數值與第三乘積之和;其中,所述第三乘積為所述多個不同科目的科目數量值與第三權重系數的乘積。
6.根據權利要求1所述的方法,其特征在于,所述根據樣本題目的各個分詞在多個不同科目中的詞頻數值,對所述樣本題目的科目進行識別,包括:
根據樣本題目的各個分詞在多個不同科目中的詞頻數值,獲得各個分詞對各個科目的貢獻度數值,其中,所述貢獻度數值表示某一分詞在某一科目中的詞頻數值與該分詞在除該科目之外的其它科目中的詞頻數值總和的比例關系;
針對每個科目,獲得多個分詞的貢獻度數值之和;
將貢獻度數值之和最大的科目確定為所述樣本題目的科目。
7.根據權利要求6所述的方法,其特征在于,所述根據樣本題目的各個分詞在多個不同科目中的詞頻數值,獲得各個分詞對各個科目的貢獻度數值,包括:
根據各個分詞在各個科目中的詞頻數值,以及,在所述多個不同科目中的詞頻數值的總和,獲得各個分詞對各個科目的貢獻度數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于億度慧達教育科技(北京)有限公司,未經億度慧達教育科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711241772.4/1.html,轉載請聲明來源鉆瓜專利網。





