[發明專利]用于稿件中的職務信息的檢查方法和裝置有效
| 申請號: | 201210335592.3 | 申請日: | 2012-09-11 |
| 公開(公告)號: | CN103678353A | 公開(公告)日: | 2014-03-26 |
| 發明(設計)人: | 周志揚;朱建波 | 申請(專利權)人: | 北京大學;北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 稿件 中的 職務 信息 檢查 方法 裝置 | ||
1.一種用于稿件中的職務信息的檢查方法,其特征在于,包括:
利用人名數據庫對稿件進行全文檢索,以確定所述稿件中的人名;
以確定的所述人名檢索職務數據庫,以確定所述人名所關聯的職務;
利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確。
2.根據權利要求1所述的方法,其特征在于,還包括:預先創建所述人名數據庫,其中包括多條記錄,所述各條記錄包括用于記載人名的字段;其中,利用人名數據庫對稿件進行全文檢索包括:
將所述各條記錄中記載的人名與所述稿件的全文進行匹配;
如果在所述稿件中匹配到與所述記錄中記載的人名相同的詞,則將所述匹配到的詞確定為所述稿件中的人名。
3.根據權利要求1所述的方法,其特征在于,還包括:預先創建所述職務數據庫,其中包括多條記錄,所述各條記錄包括用于記載人名的第一字段和用于記載職務的第二字段;其中,以確定的所述人名檢索職務數據庫包括:
將確定的所述人名匹配所述各條記錄;
如果在所述記錄的所述第一字段中匹配到所述人名,則提取當前所述記錄中的第二字段中的職務;
將所述提取的職務確定為所述人名所關聯的職務。
4.根據權利要求1所述的方法,其特征在于,利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確包括:
提取所述人名在所述稿件中相鄰的詞;
判斷所述相鄰的詞是否為職務;
如果所述相鄰的詞是職務,則確定所述相鄰的詞是否匹配以所述職務數據庫確定的職務;
如果不匹配,則標注所述相鄰的詞。
5.根據權利要求1所述的方法,其特征在于,預先創建所述職務數據庫,其中包括多條記錄,所述各條記錄包括:用于記載人名的第一字段、用于記載職務的第二字段;以及用于記載所述職務的索引的第三字段,所述索引的大小與所述職務的級別線性相關;其中,以確定的所述人名檢索職務數據庫,在確定所述人名所關聯的職務的同時,還確定所述所關聯的職務的索引。
6.根據權利要求5所述的方法,其特征在于,利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確包括:
確定所述稿件中為并列關系的所述人名;
判斷所述并列的人名的所述索引在所述并列關系中的先后排序是否符合所述人名所關聯的職級為從高到低;
如果不符合,則標注所述并列的人名。
7.根據權利要求6所述的方法,其特征在于,所述并列關系為以下模式:
職務1、職務2......職務m1人名1、職務1、職務2......職務m2人名2、......、職務1、職務2......職務mn人名n,
其中,n為大于等于2的自然數;m1、m2、......、mn均為非負整數,職務可有可無。
8.根據權利要求7所述的方法,其特征在于,確定所述稿件中為并列關系的所述人名包括:
A)判斷當前的所述人名在所述稿件中上文相鄰的詞;
B)如果無詞或者詞不是職務,則確定所述當前人名之前無并列的人名,結束所述當前人名的并列關系的判斷;
C)如果詞是標點符號或詞是職務,則對在上文相鄰的字符循環執行步驟B和C;
D)如果詞是人名,則將所述判斷得到的人名加入所述并列關系,并以所述判斷得到的人名作為當前的所述人名循環執行上述判斷并列關系的步驟。
9.一種用于稿件中的職務信息的檢查裝置,其特征在于,包括:人名模塊,用于利用人名數據庫對稿件進行全文檢索,以確定所述稿件中的人名;
職務模塊,用于以確定的所述人名檢索職務數據庫,以確定所述人名所關聯的職務;
判斷模塊,用于利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確。
10.根據權利要求9所述的裝置,其特征在于,所述判斷模塊包括:提取模塊,用于提取所述人名在所述稿件中相鄰的詞;
職務判斷模塊,用于判斷所述相鄰的詞是否為職務;
匹配模塊,用于如果所述相鄰的詞是職務,則確定所述相鄰的詞是否匹配以所述職務數據庫確定的職務;
標注模塊,用于如果不匹配,則標注所述相鄰的詞。
11.根據權利要求9所述的裝置,其特征在于,預先創建所述職務數據庫,其中包括多條記錄,所述各條記錄包括:用于記載人名的第一字段、用于記載職務的第二字段;以及用于記載所述職務的索引的第三字段,所述索引的大小與所述職務的級別線性相關;其中,所述職務在確定所述人名所關聯的職務的同時,還確定所述所關聯的職務的索引,所述判斷模塊包括:
并列模塊,用于確定所述稿件中為并列關系的所述人名;
排序模塊,用于判斷所述并列的人名的所述索引在所述并列關系中的先后排序是否符合所述人名所關聯的職級為從高到低;
標注模塊,用于如果不符合,則標注所述并列的人名。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;北大方正集團有限公司;北京北大方正電子有限公司,未經北京大學;北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210335592.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:降低彩色圖像實時傳輸數據量的方法
- 下一篇:基于紅外光柵的養殖場監視方法





