[發明專利]基于反識別渲染的文本內容識別率測試方法及裝置有效
| 申請號: | 201410549089.7 | 申請日: | 2014-10-16 |
| 公開(公告)號: | CN105574038B | 公開(公告)日: | 2019-03-01 |
| 發明(設計)人: | 張翔 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/30 | 分類號: | G06F16/30;G06F17/21 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 倪志華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 識別 渲染 文本 內容 識別率 測試 方法 裝置 | ||
本發明提供一種基于反識別渲染的文本內容識別率測試方法及裝置,所述方法包括:接收關鍵詞和與所述關鍵詞對應的識別率測試樣本,所述識別率測試樣本為所述關鍵詞和反識別元素的組合;通過文本內容識別算法計算所述識別率測試樣本,以獲得所述關鍵詞對應的識別率,其中,所述識別率=成功識別數/識別率測試樣本的數量,所述成功識別數為通過所述算法將識別率測試樣本識別為所述關鍵詞的數量。本發明的基于反識別渲染的文本內容識別率測試方法及裝置,可實時地對文本內容識別的有效性算法進行測試評估,以通過該測試結果對文本內容識別算法進行優化,不僅提升了文本內容識別算法優化的及時性,也大大的節約了人力成本。
技術領域
本發明屬于計算機技術領域,具體涉及一種基于反識別渲染的文本內容識別率測試方法及裝置。
背景技術
隨著計算機技術的飛速發展,互聯網技術應用中,很多場景都需要對文本內容進行識別,例如輿情識別,其用于收集各種社交媒體渠道的實時信息,并對信息的文本內容進行識別。
然而,在現有技術中,缺少對文本內容識別算法的測試體系,尤其是對反識別渲染后的文本內容識別算法缺少測試體系,導致每次對文本內容識別算法優化后,無法測試其識別效果是否提升,只能依靠人為的經驗對其做出判斷后,不斷嘗試對文本內容識別算法進行修改,費時費力。
發明內容
本發明的目的在于提供一種基于反識別渲染的文本內容識別率測試方法及裝置。
為實現上述發明目的之一,本發明一實施方式提供了一種基于反識別渲染的文本內容識別率測試方法,其包括:
接收關鍵詞和與所述關鍵詞對應的識別率測試樣本,所述識別率測試樣本為所述關鍵詞和反識別元素的組合;
通過文本內容識別算法計算所述識別率測試樣本,以獲得所述關鍵詞對應的識別率,其中,所述識別率=成功識別數/識別率測試樣本的數量,所述成功識別數為通過所述算法將識別率測試樣本識別為所述關鍵詞的數量。
“接收關鍵詞和與所述關鍵詞對應的識別率測試樣本,所述識別率測試樣本為所述關鍵詞和反識別元素的組合”具體包括:
接收關鍵詞;
根據反識別模板將所述關鍵詞渲染為識別率測試樣本,所述反識別模板包括反識別元素及反識別元素與所述關鍵詞的對應關系。
作為本發明一實施方式的進一步改進,所述方法還包括:
接收與所述關鍵詞對應的誤報關鍵詞,以及與所述誤報關鍵詞對應的誤報率測試樣本,所述誤報率測試樣本為所述誤報關鍵詞和反識別元素的組合;
通過文本內容識別算法計算所述誤報率測試樣本,以獲得所述關鍵詞對應的誤報率,其中,所述誤報率=誤識別數/誤報率測試樣本的數量,所述誤識別數為通過所述算法將所述誤報率測試樣本識別為所述關鍵詞的數量。
作為本發明一實施方式的進一步改進,“接收與所述關鍵詞對應的誤報關鍵詞,以及與所述誤報關鍵詞對應的誤報率測試樣本,所述誤報率測試樣本為所述誤報關鍵詞和反識別元素的組合”具體包括:
接收與所述關鍵詞對應的誤報關鍵詞;
根據反識別模板將所述誤報關鍵詞渲染為誤報率測試樣本,所述反識別模板包括反識別元素及反識別元素與所述誤報關鍵詞的對應關系。
作為本發明一實施方式的進一步改進,“接收與所述關鍵詞對應的誤報關鍵詞”具體包括:
對所述關鍵詞中的至少一個字進行組詞,以將所述關鍵詞生成為至少一個誤報關鍵詞。
作為本發明一實施方式的進一步改進,所述方法還包括計算所述反識別渲染文本內容的識別有效性,
所述識別有效性=[識別率+(1-誤報率)]/2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410549089.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種Web應用的前端頁面的處理方法及裝置
- 下一篇:一種家電電子說明書系統





