[發明專利]一種語句判別方法與系統在審
| 申請號: | 201710258869.X | 申請日: | 2017-04-19 |
| 公開(公告)號: | CN107423280A | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | 王鵬 | 申請(專利權)人: | 廣州視源電子科技股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 何世磊 |
| 地址: | 510530 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語句 判別 方法 系統 | ||
技術領域
本發明涉及語句判別技術領域,特別涉及一種語句判別方法與系統。
背景技術
眾所周知的,在職場求職的過程中,簡歷被公認為求職成功的“敲門磚”。具體的,簡歷就是對個人學歷、經歷、特長、愛好及獲獎情況等所作的簡明扼要的書面介紹,是一種有針對性的自我介紹的規范化、邏輯化的書面表達。
在簡歷的篩選過程中,常常需要對簡歷進行整體評分。而進行評分時求職者的獲獎情況是一個十分重要的評分指標。獲獎情況一般通過獲獎描述性語句來進行詳細描述。例如,常見的獲獎描述性語句可以為“第八屆全國信息技術應用水平大賽,獲得“中興杯”安卓智能終端創意團體賽全國二等獎,作品《水果忍者》手機UI主題?!痹谶M行簡歷評分的過程中,識別簡歷中的一段文本是否為獲獎描述性文本對簡歷的最終得分有著直接影響。
一般的,現有的對簡歷進行評分一般采用人工的方式進行,通過人工查詢簡歷中的獲獎描述語句(例如語句中包含“大賽”以及“二等獎”詞匯即可判斷該語句為獲獎描述語句)進而對簡歷進行評分。但是此方法僅適用于數據工作量較小的情況,當所需要處理的簡歷量非常大時,通過人工查閱評分的方法無疑費時費力,尤其在當前大數據的環境下,無法滿足實際應用需求。
發明內容
基于此,本發明的目的是提出一種新型的語句判別方法與系統,可同時對大量簡歷中的獲獎描述語句進行準確判別,在很大程度上提高了數據處理效率,滿足了實際應用需求。
本發明提出一種語句判別方法,其中,所述方法包括如下步驟:
對一待判別語句進行歸一化處理后進行分值計算以得到一當前分值;
將所述當前分值與一預設分值進行比較,若所述當前分值大于所述預設分值,則確定所述待判別語句為所述獲獎描述性語句。
所述語句判別方法,其中,對所述待判別語句進行歸一化處理后進行分值計算的模型為N-gram獲獎判別模型,其中所述N-gram獲獎判別模型為將預設獲獎描述性語句經分詞處理后再根據N-gram算法運算所建立,當所述N-gram獲獎判別模型中N的值為3時,所述N-gram獲獎判別模型為trigram獲獎判別模型,所述trigram獲獎判別模型的表達式具體為:
其中,P(wi|wi-2wi-1)為已知第i-1以及第i-2個詞的情況下,第i個詞出現的概率,P(wi|wi-1)為已知第i-1個詞的情況下,第i個詞出現的概率,P(wi)為第i個詞單獨出現的概率,C(wi-2wi-1wi)>0為第i、第i-1以及第i-2個詞同時出現的次數,C(wi-2wi-1wi)=0且C(wi-1wi)>0為第i以及第i-1個詞同時出現的次數,αP(wi),C(wi-1wi)=0且C(wi)>0為第i個詞單獨出現的次數,α為回溯權值,對應的值為0.45。
所述語句判別方法,其中,對一待判別語句進行歸一化處理后進行分值計算以得到一當前分值的步驟包括:
基于所述trigram獲獎判別模型對所述待判別語句的長度進行歸一化處理;
根據公式對所述待判別語句進行分值計算以得到所述當前分值,其中Score(Snew)為所述待判別語句的所述當前分值,L(S)為所述待判別語句中詞的個數。
所述語句判別方法,其中,所述將預設獲獎描述性語句經分詞處理的步驟包括:
將所述預設獲獎描述性語句以詞匯為基本單位進行拆分以得到依次排列的多個所述詞匯;
在經拆分后的所述預設獲獎性描述性語句的句首以及句末分別插入標志性字符。
所述語句判別方法,其中,所述預設分值為-5。
本發明還提出一種語句判別系統,其中,所述系統包括:
分值計算模塊,用于對一待判別語句進行歸一化處理后進行分值計算以得到一當前分值;
獲獎判別模塊,用于將所述當前分值與一預設分值進行比較,若所述當前分值大于所述預設分值,則確定所述待判別語句為所述獲獎描述性語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州視源電子科技股份有限公司,未經廣州視源電子科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710258869.X/2.html,轉載請聲明來源鉆瓜專利網。





