[發明專利]用于識別信息的方法和裝置有效
| 申請號: | 201710513137.0 | 申請日: | 2017-06-29 |
| 公開(公告)號: | CN109214501B | 公開(公告)日: | 2021-11-30 |
| 發明(設計)人: | 張愛喜;葉韻;陳宇;翁志 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100080 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 信息 方法 裝置 | ||
1.一種用于識別信息的方法,其特征在于,所述方法包括:
獲取待識別信息;
將所述待識別信息導入神經網絡模型,生成所述待識別信息分別屬于至少三種預設類型中的各種類型的概率,并且根據生成的概率識別所述待識別信息所屬的類型,其中,所述神經網絡模型根據更新后的初始神經網絡模型得到,初始神經網絡模型基于以下步驟更新:
將第一訓練樣本導入初始神經網絡模型,生成所述第一訓練樣本屬于所述各種類型的概率,其中,所述初始神經網絡模型用于表征信息與信息屬于所述各種類型的概率之間的對應關系;
獲取至少一個區分難度權重,其中,區分難度權重用于表征區分類型對中兩種類型的信息的難度,區分難度權重包括兩種類型的信息之間的相似度,類型對由上述至少三種預設類型中的兩種類型組成;
基于所述至少一個區分難度權重和所述第一訓練樣本屬于所述各種類型的概率,確定初始神經網絡模型的模型誤差;
根據所述模型誤差更新初始神經網絡模型。
2.根據權利要求1所述的方法,其特征在于,所述基于所述至少一個區分難度權重和所述第一訓練樣本屬于所述各種類型的概率,確定初始神經網絡模型的模型誤差,包括:
根據所述第一訓練樣本屬于所述各種類型的概率,確定用于表征所述第一訓練樣本屬于所述各種類型的概率的概率誤差;
對于至少一個類型對中的每個類型對,根據該類型對中的兩種類型的區分難度權重和對應的概率誤差的和,確定該類型對的權重概率誤差;
根據所確定的權重概率誤差,確定上述模型誤差。
3.根據權利要求1或2所述的方法,其特征在于,所述獲取至少一個區分難度權重,包括:
對于至少一個類型對中的每個類型對,訓練針對該類型對的二分類模型,其中,該二分類模型用于表征信息與指示信息之間的對應關系,指示信息用于指示信息屬于該類型對中的兩種類型中的一種;
利用預先標注有類型的測試樣本,確定各個二分類模型的模型誤差;
對于所訓練的每個二分類模型,根據該二分類模型的模型誤差,確定該二分類模型所針對的類型對的區分難度權重。
4.根據權利要求3所述的方法,其特征在于,所述對于至少一個類型對中的每個類型對,訓練針對該類型對的二分類模型,包括:
對于所述至少一個類型對中的每個類型對中的每個類型,獲取預先標注有該類型和屬于該類型的概率的第二訓練樣本的集合;響應于屬于該類型的概率小于預設概率閾值的第二訓練樣本在該集合中的比例小于預設比例閾值,基于屬于該類型的概率小于預設概率閾值的第二訓練樣本,擴增得到擴增樣本;將擴增樣本與該集合中的第二訓練樣本進行合并,得到合并樣本集合;
對于所述至少一個類型對中的每個類型對,利用該類型對中的兩種類型分別對應的合并樣本集合,訓練針對該類型對的二分類模型。
5.根據權利要求4所述的方法,其特征在于,所述對于所述至少一個類型對中的每個類型對中的每個類型,獲取預先標注有該類型和屬于該類型的概率的第二訓練樣本的集合,包括:
對于所述至少一個類型對中的每個類型對中的每個類型,獲取預先標注有該類型的第二訓練樣本;將預先標注該類型的第二訓練樣本導入預先建立的概率生成模型,確定預先標注該類型的第二訓練樣本屬于該類型的概率,其中,所述概率生成模型用于表征第二訓練樣本與第二訓練樣本分別屬于所述各種類型的概率之間的對應關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710513137.0/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





