[發(fā)明專利]一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法在審
| 申請?zhí)枺?/td> | 201910318616.6 | 申請日: | 2019-04-19 |
| 公開(公告)號: | CN110321471A | 公開(公告)日: | 2019-10-11 |
| 發(fā)明(設(shè)計(jì))人: | 涂小東;李凱;黃麗;陳偉;王軍;李毅光 | 申請(專利權(quán))人: | 四川政資匯智能科技有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/35;G06F16/335 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 李英 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 有效文本 質(zhì)檢 抓取 分類 目標(biāo)關(guān)鍵詞 關(guān)鍵詞庫 目標(biāo)網(wǎng)頁 人工分類 網(wǎng)絡(luò)爬蟲 智能匹配 文本 互聯(lián)網(wǎng) 篩選 匯聚 分類處理 分類結(jié)果 匹配客戶 智能分類 預(yù)分析 客戶 過濾 金融 網(wǎng)頁 發(fā)送 應(yīng)用 | ||
1.一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,包括以下步驟:
S1、建立關(guān)鍵詞庫,在關(guān)鍵詞庫中導(dǎo)入設(shè)定的目標(biāo)關(guān)鍵詞;
S2、設(shè)立網(wǎng)絡(luò)爬蟲,將其與關(guān)鍵詞庫關(guān)聯(lián),并放入網(wǎng)絡(luò)中根據(jù)關(guān)鍵詞庫中的目標(biāo)關(guān)鍵詞進(jìn)行網(wǎng)頁目標(biāo)抓取,獲得目標(biāo)網(wǎng)頁文本;
S3、對網(wǎng)絡(luò)爬蟲抓取的目標(biāo)網(wǎng)頁文本進(jìn)行文本預(yù)分析和過濾,篩選出有效文本;
S4、對篩選出的有效文本進(jìn)行分類處理,然后傳至質(zhì)檢單元進(jìn)行分類質(zhì)檢;
S5、將分類質(zhì)檢通過的有效文本按照其分類發(fā)送給對應(yīng)的客戶,將分類質(zhì)檢不通過的有效文本進(jìn)行人工分類,再發(fā)送至人工分類后對應(yīng)的客戶。
2.根據(jù)權(quán)利要求1所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在步驟S1中,關(guān)鍵詞庫包括主詞庫和目標(biāo)詞庫,主詞庫用于存儲歷史關(guān)鍵詞數(shù)據(jù),目標(biāo)詞庫用于導(dǎo)入目標(biāo)關(guān)鍵詞,步驟S2中的網(wǎng)絡(luò)爬蟲與目標(biāo)詞庫進(jìn)行關(guān)聯(lián)。
3.根據(jù)權(quán)利要求2所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在步驟S1中,目標(biāo)詞庫中的目標(biāo)關(guān)鍵詞由客戶提供或/和從主詞庫中選取,其包括但不僅限于政府組織機(jī)構(gòu)名稱、領(lǐng)域人物名稱、領(lǐng)域協(xié)會商會名稱、互聯(lián)網(wǎng)科技金融行業(yè)名詞。
4.根據(jù)權(quán)利要求1所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在步驟S2中,目標(biāo)網(wǎng)頁文本抓取的步驟包括:
S21、將目標(biāo)關(guān)鍵詞設(shè)定為網(wǎng)絡(luò)爬蟲的抓取種子;
S22、采用基于目標(biāo)網(wǎng)頁特征、基于目標(biāo)數(shù)據(jù)模式和基于領(lǐng)域概念并行的方式根據(jù)抓取種子抓取互聯(lián)網(wǎng)目標(biāo)網(wǎng)頁文本;
S23、將抓取的目標(biāo)網(wǎng)頁文本進(jìn)行反饋,并集中存儲。
5.根據(jù)權(quán)利要求1所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在步驟S2中,所述網(wǎng)絡(luò)爬蟲包括通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲和深層網(wǎng)絡(luò)爬蟲。
6.根據(jù)權(quán)利要求1所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在步驟S3中,篩選有效文本的步驟包括:
S31、對所有目標(biāo)網(wǎng)頁文本進(jìn)行重復(fù)率檢索,對內(nèi)容重復(fù)率達(dá)到設(shè)定閾值的多個目標(biāo)網(wǎng)頁文本進(jìn)行提?。?/p>
S32、將提取出的多個目標(biāo)網(wǎng)頁文本進(jìn)行字?jǐn)?shù)比對,留下字?jǐn)?shù)最多的一個,其余丟棄;
S33、建立敏感詞庫,利用敏感詞庫對未提取和提取比對留下的目標(biāo)網(wǎng)頁文本進(jìn)行敏感詞句檢索;
S34、將檢索到含有敏感詞句的目標(biāo)網(wǎng)頁文本清除,剩余的目標(biāo)網(wǎng)頁文本為有效文本。
7.根據(jù)權(quán)利要求1所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在步驟S4中,有效文本的分類處理過程包括:
S41、對有效文本的目標(biāo)關(guān)鍵詞進(jìn)行分詞提取,然后對目標(biāo)關(guān)鍵詞的詞頻、詞序和語義進(jìn)行設(shè)定評分統(tǒng)計(jì);
S42、根據(jù)詞頻、詞序和語義的綜合評分進(jìn)行排序,選取前N個綜合評分最高的目標(biāo)關(guān)鍵詞作為詞向量,其中N為大于0的整數(shù);
S43、將詞向量導(dǎo)入預(yù)先建立的文本分類訓(xùn)練模型,進(jìn)行自動分類,得到有效文本的自動分類結(jié)果;
S44、根據(jù)分類結(jié)果對有效文本進(jìn)行分類標(biāo)記,然后傳送至質(zhì)檢單元。
8.根據(jù)權(quán)利要求7所述的一種基于政策性資源匯聚的互聯(lián)網(wǎng)科技金融智能匹配方法,其特征在于,在質(zhì)檢單元設(shè)人工質(zhì)檢員來對有效文本進(jìn)行分類質(zhì)檢,然后對質(zhì)檢通過的有效文本按其分類標(biāo)記發(fā)送給對應(yīng)客戶,對質(zhì)檢不通過的有效文本進(jìn)行人工分類并標(biāo)記,將人工分類標(biāo)記后的有效文本按人工分類標(biāo)記發(fā)送給對應(yīng)客戶,并反饋對應(yīng)質(zhì)檢不通過信息,用于分類訓(xùn)練模型的改進(jìn)參照。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川政資匯智能科技有限公司,未經(jīng)四川政資匯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910318616.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 質(zhì)檢方法、質(zhì)檢設(shè)備及質(zhì)檢系統(tǒng)
- 一種話務(wù)錄音的質(zhì)檢方法及裝置
- 一種智能凈水機(jī)線上質(zhì)檢方法、系統(tǒng)
- 質(zhì)檢方法、裝置、設(shè)備及存儲介質(zhì)
- 產(chǎn)品質(zhì)檢方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種視頻質(zhì)檢方法、系統(tǒng)及終端設(shè)備
- 智能質(zhì)檢方法、系統(tǒng)、介質(zhì)以及設(shè)備
- 一種語音質(zhì)檢方法、裝置、質(zhì)檢設(shè)備及可讀存儲介質(zhì)
- AI質(zhì)檢方法,裝置,系統(tǒng),電子設(shè)備及存儲介質(zhì)
- 基于知識階層的數(shù)據(jù)質(zhì)檢的方法、裝置及計(jì)算機(jī)設(shè)備





