[發明專利]一種癌癥相關信息自動收集方法及系統有效
| 申請號: | 201410584231.1 | 申請日: | 2014-10-27 |
| 公開(公告)號: | CN104361033A | 公開(公告)日: | 2015-02-18 |
| 發明(設計)人: | 楊歐 | 申請(專利權)人: | 深圳職業技術學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/00;G06F19/00 |
| 代理公司: | 武漢東喻專利代理事務所(普通合伙) 42224 | 代理人: | 紀元 |
| 地址: | 518055 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 癌癥 相關 信息 自動 收集 方法 系統 | ||
技術領域
本發明屬于模式識別領域,更具體地,涉及一種癌癥相關信息自動收集系統及方法。
背景技術
癌癥是一大類惡性腫瘤的統稱。癌細胞的特點是無限制、無止境地增生,使患者體內的營養物質被大量消耗;癌細胞釋放出多種毒素,使人體產生一系列癥狀;癌細胞還可轉移到全身各處生長繁殖,導致人體消瘦、無力、貧血、食欲不振、發熱以及嚴重的臟器功能受損等等。與之相對的有良性腫瘤,良性腫瘤則容易清除干凈,一般不轉移、不復發,對器官、組織只有擠壓和阻塞作用,但癌癥還可破壞組織、器官的結構和功能,引起壞死出血合并感染,患者最終由于器官功能衰竭而死亡。目前,癌癥已成為人類健康的頭號殺手。
現代醫學研究認為,癌癥與諸多因素相關聯,是一種典型的多因素疾病。完整的收集和整理癌癥相關信息,對于癌癥的診斷治療以及機理研究都有巨大的意義。然而,目前的癌癥相關信息收集方法以及收集系統,都是針對某一類因素,如基因、蛋白質或者miRNA建立的,對象單一,并不能綜合癌癥相關信息,另外擴展性不佳。另外,現有的癌癥相關信息收集方法,多為人工整理,較為費時費力。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種癌癥相關信息自動收集系統及方法,其目的在于采用模式識別的方式,自動收集并整理癌癥相關信息,并將與癌癥顯著相關的因素進行分類,由此解決現有的癌癥相關信息收集技術對象單一、擴展性不佳或人工收集費時費力的技術問題。
為實現上述目的,按照本發明的一個方面,提供了一種癌癥相關信息自動收集系統,包括文獻存儲模塊、已知因素識別存儲模塊、未知因素存儲模塊、統計分析模塊和癌癥相關因素存儲模塊;
所述文獻存儲模塊,用于獲取與特定癌癥相關文獻數據,按照癌癥種類將獲取的文獻數據進行分類存儲,并將文獻數據按照分解為單詞,根據自然語言分類保留名詞性詞匯,將所有名詞性詞匯輸出給已知因素識別存儲模塊;
所述已知因素識別存儲模塊,用于按照當前已知因素類別,存儲已知因素類別識別器,獲取所有名詞性詞匯,利用已知因素類別識別器,對所有名詞性詞匯進行識別并按照已知因素類別進行存儲;無法識別為當前存儲的已知因素類別時,將無法識別的名詞輸出給未知因素模塊;
所述未知因素模塊,用于接收所述已知因素識別存儲模塊無法識別的名詞,并存儲為未知因素,當出現統計分析模塊判斷為顯著的未知因素時,將所述未知因素提交用戶指定為當前存儲的已知因素類別或新創件的已知因素類別,并將新創建的已知因素類別及其識別器提交給所述已知因素識別存儲模塊,并更新當前已知因素類別及其識別器;
所述統計分析模塊,用于根據所述文獻存儲模塊,癌癥相關文獻量及名詞性詞匯出現頻率信息,采用共出現原理,評價癌癥和名詞性詞匯的相關性,并根據預先設定的閾值,判斷所述名詞性詞匯是否為顯著的已知因素或顯著的未知因素;
癌癥相關因素存儲模塊,用于存儲所有與癌癥相關性名詞性詞匯、所述名詞性詞匯的已知因素類別或未知因素、以及其與癌癥相關性,并以表的形式進行展示及查詢。
優選地,所述癌癥相關信息自動收集系統,其文獻存儲模塊獲取的與特定癌癥相關的文獻數據,為醫學主題次系統標記的特定癌癥相關文獻。
優選地,所述癌癥相關信息自動收集系統,其已知因素識別存儲模塊,其已知因素識別器為相應類別名詞性詞匯的正則表達式。
優選地,所述癌癥相關信息自動收集系統,其已知因素識別存儲模塊,其類別包括操縱子、增強子、蛋白質編碼基因、miRNA、piRNA。
優選地,所述癌癥相關信息自動收集系統,其統計分析模塊,采用費舍爾檢驗,獲得p值,按照p值越大,相關性越小的原則,評價癌癥和名詞性詞匯的相關性。
按照本發明的另一個方面,提供了癌癥相關信息自動收集方法,包括以下步驟:
(1)文獻存儲模塊獲取與特定癌癥相關的文獻數據;
(2)文獻存儲模塊對于步驟(1)中獲取的每一篇文獻,將文件內容分解成詞匯,利用自然語言分析對詞匯進行詞性分類,保留名詞性詞匯;
(3)已知因素識別存儲模塊將步驟(2)中的詞匯識別為已知因素和未知因素,已知因素按照基因功能性片段、蛋白質和糖類分類;
(4)統計分析模塊將步驟(3)中獲得的已知因素,根據費舍爾檢驗,判斷所述已知因素與癌癥關聯的顯著程度,對于顯著程度超過預先設定的閾值的已知因素,保留所述已知因素為癌癥相關因素;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳職業技術學院,未經深圳職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410584231.1/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





