[發(fā)明專利]一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法在審
| 申請?zhí)枺?/td> | 201810432237.5 | 申請日: | 2018-05-08 |
| 公開(公告)號(hào): | CN108681575A | 公開(公告)日: | 2018-10-19 |
| 發(fā)明(設(shè)計(jì))人: | 懷化 | 申請(專利權(quán))人: | 亳州中藥材商品交易中心有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京酷愛智慧知識(shí)產(chǎn)權(quán)代理有限公司 11514 | 代理人: | 安娜 |
| 地址: | 236800 安徽省亳*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 枸杞 構(gòu)建 數(shù)據(jù)庫構(gòu)建 信息數(shù)據(jù)庫 摘要內(nèi)容 全網(wǎng) 數(shù)據(jù)庫 分類處理步驟 文本挖掘算法 文獻(xiàn)數(shù)據(jù)庫 獲取數(shù)據(jù) 技術(shù)構(gòu)建 建立信息 快速更新 數(shù)據(jù)信息 提取信息 文本挖掘 詳細(xì)信息 信息相關(guān) 后處理 詞語義 前處理 分解 挖掘 分類 網(wǎng)絡(luò) | ||
1.一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:
獲取數(shù)據(jù)步驟:根據(jù)枸杞的對應(yīng)信息列表,從網(wǎng)絡(luò)中獲取與枸杞對應(yīng)信息相關(guān)的摘要資源;
前處理步驟:對所述摘要資源中的每一段信息進(jìn)行分解以獲取包括摘要內(nèi)容的數(shù)據(jù)信息;
分類處理步驟:根據(jù)枸杞的對應(yīng)信息列表,對所述摘要內(nèi)容進(jìn)行提取和分類;
后處理步驟:針對枸杞的對應(yīng)信息列表每一條信息,構(gòu)建對應(yīng)于該信息的相關(guān)詞語義庫;
庫構(gòu)建步驟:建立信息數(shù)據(jù)庫,所述信息數(shù)據(jù)庫包括所述對應(yīng)信息列表和對應(yīng)的文獻(xiàn)摘要。
2.根據(jù)權(quán)利要求1所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:對應(yīng)信息列表包括:資源類信息、質(zhì)量類信息、流通類信息、知識(shí)類信息。
3.根據(jù)權(quán)利要求2所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述資源類信息包括:產(chǎn)地、品種、規(guī)模、產(chǎn)量、生產(chǎn)經(jīng)營對象、成本。
4.根據(jù)權(quán)利要求2所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述質(zhì)量類信息包括:參照藥典指標(biāo),包括等級、規(guī)格、檢測指標(biāo)、查詢信息。
5.根據(jù)權(quán)利要求2所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述流通類信息包括:趁鮮加工主體、數(shù)量、規(guī)格;倉儲(chǔ)地點(diǎn)、方式、數(shù)量;市場主體、分布、交易量、價(jià)格、年度分布;制藥的主體、品類、數(shù)量、分布、價(jià)格。
6.根據(jù)權(quán)利要求2所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述知識(shí)類信息包括:政策、法規(guī)、發(fā)展規(guī)劃、新研究、網(wǎng)絡(luò)評價(jià)、新聞報(bào)道。
7.根據(jù)權(quán)利要求1所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述獲取摘要資源步驟包括:以枸杞名為搜索詞,采用網(wǎng)絡(luò)爬蟲技術(shù)獲取與所述枸杞名相關(guān)的文獻(xiàn)摘要。
8.如權(quán)利要求1所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述前處理步驟還包括:在獲取所述摘要資源后,根據(jù)所述枸杞名的同音詞對所述文獻(xiàn)摘要資源進(jìn)行過濾,保留摘要內(nèi)容中包含所述同音詞的文獻(xiàn)摘要。
9.根據(jù)權(quán)利要求1所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:在所述后處理步驟中,所述構(gòu)建相關(guān)詞語義庫包括:確定主詞與相關(guān)詞的共現(xiàn)次數(shù)、二者之間的平均距離以及所述相關(guān)詞的信息熵,其中所述主詞為所述枸杞名,所述相關(guān)詞為與所述枸杞名相關(guān)的所有文獻(xiàn)摘要中出現(xiàn)的其它詞語;根據(jù)所述共現(xiàn)次數(shù)、平均距離和信息熵確定所述相關(guān)詞相對于所述主詞的相關(guān)度;根據(jù)所述相關(guān)度得到所述相關(guān)詞語義庫,所述相關(guān)詞語義庫包括相關(guān)詞以及該相關(guān)詞相對于主詞的相關(guān)度。
10.根據(jù)權(quán)利要求1所述的一種基于枸杞質(zhì)量的枸杞全網(wǎng)數(shù)據(jù)庫構(gòu)建方法,其特征在于:所述相關(guān)度的計(jì)算公式為:r=(c×α)÷(α+d)÷η,其中,r表示一個(gè)相關(guān)詞與所述主詞的相關(guān)度,c表示所述相關(guān)詞與所述主詞在所有文獻(xiàn)摘要中共同出現(xiàn)的次數(shù),d表示所述相關(guān)詞與所述主詞之間的平均距離,η表示所述相關(guān)詞的信息熵,α為距離系數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于亳州中藥材商品交易中心有限公司,未經(jīng)亳州中藥材商品交易中心有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810432237.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法
- 數(shù)據(jù)庫切換方法和數(shù)據(jù)庫切換系統(tǒng)
- 模擬瀕危松科植物潛在分布的方法
- 數(shù)據(jù)庫構(gòu)建裝置、數(shù)據(jù)庫構(gòu)建方法以及數(shù)據(jù)庫構(gòu)建程序
- 一種疾病基因組數(shù)據(jù)庫的構(gòu)建方法和疾病基因組數(shù)據(jù)庫
- 一種數(shù)據(jù)庫檢索機(jī)制的構(gòu)建方法及系統(tǒng)
- 圖數(shù)據(jù)庫構(gòu)建方法、關(guān)聯(lián)信息查詢方法、裝置及計(jì)算設(shè)備
- 一種司法輔助案件管理數(shù)據(jù)庫的構(gòu)建方法和應(yīng)用方法
- 一種低碳經(jīng)濟(jì)關(guān)鍵發(fā)展要素平衡促進(jìn)方法
- 一種跨平臺(tái)多維數(shù)據(jù)庫架構(gòu)設(shè)計(jì)方法及系統(tǒng)
- 分布式數(shù)據(jù)庫集群的數(shù)據(jù)一致性檢驗(yàn)方法及裝置
- 數(shù)據(jù)庫的結(jié)構(gòu)比較方法和裝置
- 一種信息數(shù)據(jù)庫的異常處理方法和裝置
- 一種MongoDB數(shù)據(jù)庫對象復(fù)制延遲監(jiān)控方法和裝置
- 一種數(shù)據(jù)庫的路由方法、裝置及數(shù)據(jù)庫系統(tǒng)
- 一種數(shù)據(jù)庫的生成方法及生成裝置
- 一種云平臺(tái)網(wǎng)絡(luò)監(jiān)控系統(tǒng)
- 一種銷售主導(dǎo)型工廠信息管理系統(tǒng)
- 數(shù)據(jù)庫同步方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 多任務(wù)并行開發(fā)下的數(shù)據(jù)庫同步方法及裝置
- 一種藥物疾病匹配數(shù)據(jù)庫





