[發(fā)明專(zhuān)利]一種癌癥相關(guān)信息自動(dòng)收集方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201410584231.1 | 申請(qǐng)日: | 2014-10-27 |
| 公開(kāi)(公告)號(hào): | CN104361033A | 公開(kāi)(公告)日: | 2015-02-18 |
| 發(fā)明(設(shè)計(jì))人: | 楊歐 | 申請(qǐng)(專(zhuān)利權(quán))人: | 深圳職業(yè)技術(shù)學(xué)院 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30;G06K9/00;G06F19/00 |
| 代理公司: | 武漢東喻專(zhuān)利代理事務(wù)所(普通合伙) 42224 | 代理人: | 紀(jì)元 |
| 地址: | 518055 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 癌癥 相關(guān) 信息 自動(dòng) 收集 方法 系統(tǒng) | ||
1.一種癌癥相關(guān)信息自動(dòng)收集系統(tǒng),其特征在于,包括文獻(xiàn)存儲(chǔ)模塊、已知因素識(shí)別存儲(chǔ)模塊、未知因素存儲(chǔ)模塊、統(tǒng)計(jì)分析模塊和癌癥相關(guān)因素存儲(chǔ)模塊;
所述文獻(xiàn)存儲(chǔ)模塊,用于獲取與特定癌癥相關(guān)文獻(xiàn)數(shù)據(jù),按照癌癥種類(lèi)將獲取的文獻(xiàn)數(shù)據(jù)進(jìn)行分類(lèi)存儲(chǔ),并將文獻(xiàn)數(shù)據(jù)按照分解為單詞,根據(jù)自然語(yǔ)言分類(lèi)保留名詞性詞匯,將所有名詞性詞匯輸出給已知因素識(shí)別存儲(chǔ)模塊;
所述已知因素識(shí)別存儲(chǔ)模塊,用于按照當(dāng)前已知因素類(lèi)別,存儲(chǔ)已知因素類(lèi)別識(shí)別器,獲取所有名詞性詞匯,利用已知因素類(lèi)別識(shí)別器,對(duì)所有名詞性詞匯進(jìn)行識(shí)別并按照已知因素類(lèi)別進(jìn)行存儲(chǔ);無(wú)法識(shí)別為當(dāng)前存儲(chǔ)的已知因素類(lèi)別時(shí),將無(wú)法識(shí)別的名詞輸出給未知因素模塊;
所述未知因素模塊,用于接收所述已知因素識(shí)別存儲(chǔ)模塊無(wú)法識(shí)別的名詞,并存儲(chǔ)為未知因素,當(dāng)出現(xiàn)統(tǒng)計(jì)分析模塊判斷為顯著的未知因素時(shí),將所述未知因素提交用戶(hù)指定為當(dāng)前存儲(chǔ)的已知因素類(lèi)別或新創(chuàng)件的已知因素類(lèi)別,并將新創(chuàng)建的已知因素類(lèi)別及其識(shí)別器提交給所述已知因素識(shí)別存儲(chǔ)模塊,并更新當(dāng)前已知因素類(lèi)別及其識(shí)別器;
所述統(tǒng)計(jì)分析模塊,用于根據(jù)所述文獻(xiàn)存儲(chǔ)模塊,癌癥相關(guān)文獻(xiàn)量及名詞性詞匯出現(xiàn)頻率信息,采用共出現(xiàn)原理,評(píng)價(jià)癌癥和名詞性詞匯的相關(guān)性,并根據(jù)預(yù)先設(shè)定的閾值,判斷所述名詞性詞匯是否為顯著的已知因素或顯著的未知因素;
癌癥相關(guān)因素存儲(chǔ)模塊,用于存儲(chǔ)所有與癌癥相關(guān)性名詞性詞匯、所述名詞性詞匯的已知因素類(lèi)別或未知因素、以及其與癌癥相關(guān)性,并以表的形式進(jìn)行展示及查詢(xún)。
2.如權(quán)利要求1所述的癌癥相關(guān)信息自動(dòng)收集系統(tǒng),其特征在于,所述文獻(xiàn)存儲(chǔ)模塊獲取的與特定癌癥相關(guān)的文獻(xiàn)數(shù)據(jù),為醫(yī)學(xué)主題次系統(tǒng)標(biāo)記的特定癌癥相關(guān)文獻(xiàn)。
3.如權(quán)利要求1所述的癌癥相關(guān)信息自動(dòng)收集系統(tǒng),其特征在于,所述已知因素識(shí)別存儲(chǔ)模塊,其已知因素識(shí)別器為相應(yīng)類(lèi)別名詞性詞匯的正則表達(dá)式。
4.如權(quán)利要求1所述的癌癥相關(guān)信息自動(dòng)收集系統(tǒng),其特征在于,所述已知因素識(shí)別存儲(chǔ)模塊,其類(lèi)別包括基因功能性片段、蛋白質(zhì)和糖類(lèi)分類(lèi);所述基因功能性片段包括操縱子、增強(qiáng)子、蛋白質(zhì)編碼基因、miRNA、piRNA。
5.如權(quán)利要求1所述的癌癥相關(guān)信息自動(dòng)收集系統(tǒng),其特征在于,所述統(tǒng)計(jì)分析模塊,采用費(fèi)舍爾檢驗(yàn),獲得p值,按照p值越大,相關(guān)性越小的原則,評(píng)價(jià)癌癥和名詞性詞匯的相關(guān)性。
6.一種應(yīng)用如權(quán)利要求1至5所述系統(tǒng)的癌癥相關(guān)信息自動(dòng)收集方法,其特征在于,包括以下步驟:
(1)文獻(xiàn)存儲(chǔ)模塊獲取與特定癌癥相關(guān)的文獻(xiàn)數(shù)據(jù);
(2)文獻(xiàn)存儲(chǔ)模塊對(duì)于步驟(1)中獲取的每一篇文獻(xiàn),將文件內(nèi)容分解成詞匯,利用自然語(yǔ)言分析對(duì)詞匯進(jìn)行詞性分類(lèi),保留名詞性詞匯;
(3)已知因素識(shí)別存儲(chǔ)模塊將步驟(2)中的詞匯識(shí)別為已知因素和未知因素,分別存儲(chǔ)在已知因素識(shí)別存儲(chǔ)模塊和未知因素存儲(chǔ)模塊,已知因素按照基因功能性片段、蛋白質(zhì)和糖類(lèi)分類(lèi);
(4)統(tǒng)計(jì)分析模塊將步驟(3)中獲得的已知因素,根據(jù)費(fèi)舍爾檢驗(yàn),判斷所述已知因素與癌癥關(guān)聯(lián)的顯著程度,對(duì)于顯著程度超過(guò)預(yù)先設(shè)定的閾值的已知因素,保留所述已知因素為癌癥相關(guān)因素;
(5)統(tǒng)計(jì)分析模塊將步驟(3)中獲得的未知因素,根據(jù)費(fèi)舍爾檢驗(yàn),判斷所述未知因素與癌癥關(guān)聯(lián)的顯著程度,對(duì)于顯著程度超過(guò)預(yù)先設(shè)定的閾值的未知因素,指定所述未知因素的為已知因素的某一類(lèi)別或新增的類(lèi)別,使所述未知因素為已知因素并保留為癌癥相關(guān)因素。
7.如權(quán)利要求6所述的癌癥相關(guān)信息自動(dòng)收集方法,其特征在于,步驟(1)所述的與特定癌癥相關(guān)的文獻(xiàn)數(shù)據(jù),為醫(yī)學(xué)主題詞系統(tǒng)標(biāo)記的特定癌癥相關(guān)的文獻(xiàn)。
8.如權(quán)利要求6所述的癌癥相關(guān)信息自動(dòng)收集方法,其特征在于,步驟(3)所述基因功能性片段為操縱子、增強(qiáng)子、蛋白質(zhì)編碼基因、miRNA、piRNA。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于深圳職業(yè)技術(shù)學(xué)院,未經(jīng)深圳職業(yè)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410584231.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





