[發(fā)明專利]面向人物傳記的事件分類方法無效
| 申請?zhí)枺?/td> | 201110095809.3 | 申請日: | 2011-04-18 |
| 公開(公告)號: | CN102200997A | 公開(公告)日: | 2011-09-28 |
| 發(fā)明(設(shè)計)人: | 周文;葛晶 | 申請(專利權(quán))人: | 上海大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海上大專利事務(wù)所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 人物傳記 事件 分類 方法 | ||
1.一種面向人物傳記的事件分類方法,操作步驟如下:
A.?構(gòu)建訓(xùn)練語料庫
B.?詞庫的訓(xùn)練
C.?人物事件分類。
2.根據(jù)權(quán)利要求1所述的面向人物傳記的事件分類方法,其特征在于所述步驟A中構(gòu)建訓(xùn)練語料庫的具體操作步驟如下:
A1.從互聯(lián)網(wǎng)或其他信息源獲取人物描述語言的文本;
A2.標注語句的類型,語料標注的類別有:性別、民族、出生時間、出生地、黨派、現(xiàn)任職務(wù)、學(xué)習(xí)經(jīng)歷,若所標注的人物為科學(xué)家,則標注的類別還有:發(fā)表文章、參與項目;
A3.如果一句語句有多個類型,則標注多個類型;
A4.將標注好的文本按照人物類別分開存儲,人物類別包括:政治人物,科學(xué)家,影視明星;相同的人物類別可有多個文本。
3.根據(jù)權(quán)利要求1所述的面向人物傳記的事件分類方法,其特征在于,所述步驟B中詞庫的訓(xùn)練,?其操作步驟如下:
B1.?建立詞庫語句類別,先分別按照人物類別建立政治人物,科學(xué)家,影視明星三種人物類別;
B2.在各個人物類別中逐個按照性別、民族、出生時間、出生地、黨派、現(xiàn)任職務(wù)、學(xué)習(xí)經(jīng)歷建立語句類別;
B3.如果人物類別為科學(xué)家,則額外建立發(fā)表文章、參與項目兩類類別;
B4.?將已標注語句類別的文本按照人物類別讀取;
B5.?分辨其中語句所標注的類別;
B6.?將已標注的語句分詞;
B7.?逐個讀取分詞后得到的詞語,每讀取一個詞語,就將此詞語按照其所屬語句所標注的類別存放于詞庫中對應(yīng)的詞語類別當中;
B8.?逐條語句分類直至所有語料分類完畢。
4.根據(jù)權(quán)利要求1所述的面向人物傳記的事件分類方法,其特征在于,所述步驟C人物事件分類,具體操作步驟如下:
C1.獲取需要分類的文本以及此文本所描述的相關(guān)人物的類別;
C2.將文本按照句子逐句分離;
C3.將分離后的句子進行分詞,并逐詞讀取所得的分詞結(jié)果;
C4.將詞語按照詞庫中的詞語進行匹配,若僅一個類別中有此詞語,則此詞語屬于此類別,記錄其在該類別中的權(quán)重;若有多個類別中都有此詞語,則獲取這些類別中該詞語的權(quán)重,逐個記錄;
C5.一條語句中所有詞語的權(quán)重都分類完畢后,將該條語句中所有詞語的各類權(quán)重累加,所得的各個類別的權(quán)重記為該語句的權(quán)重;然后依據(jù)該語句的類別,將其置于所屬人物的相關(guān)語句類別中,并且記錄其權(quán)重。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海大學(xué),未經(jīng)上海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110095809.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:電動壓縮機
- 下一篇:一種版面信息提取和加工的方法





