[發(fā)明專利]網(wǎng)頁客服知識抽取方法及裝置在審
| 申請?zhí)枺?/td> | 202010735444.5 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN111858963A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計)人: | 申亞坤 | 申請(專利權(quán))人: | 中國銀行股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 谷敬麗;周曉飛 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)頁 客服 知識 抽取 方法 裝置 | ||
1.一種網(wǎng)頁客服知識抽取方法,其特征在于,包括:
獲取所述網(wǎng)頁的客服數(shù)據(jù);
計算所述客服數(shù)據(jù)與模板庫中各模板的匹配度;所述模板是用于進行知識篩選的組件;
根據(jù)所述匹配度確定目標模板;
利用所述目標模板對所述網(wǎng)頁進行知識抽取。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取所述網(wǎng)頁的客服數(shù)據(jù)之前,還包括:
利用網(wǎng)頁爬取組件,獲取所述網(wǎng)頁的業(yè)務(wù)數(shù)據(jù);
對所述業(yè)務(wù)數(shù)據(jù)進行清洗處理,得到客服數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述匹配度確定目標模板,包括:
若第一模板對應(yīng)的匹配度大于預(yù)設(shè)匹配度閾值,且所述第一模板對應(yīng)的匹配度大于所述模板庫中任意模板對應(yīng)的匹配度,則將所述第一模板作為目標模板。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,利用所述目標模板對所述網(wǎng)頁進行知識抽取,包括:
接收網(wǎng)頁標注信息;
根據(jù)所述網(wǎng)頁標注信息,利用所述目標模板對所述網(wǎng)頁進行知識抽取。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括:
若不存在目標模板,則生成知識抽取提醒信息,并將所述知識抽取提醒信息發(fā)送至顯示模塊,以使所述顯示模塊顯示所述抽取提醒信息。
6.一種網(wǎng)頁客服知識抽取裝置,其特征在于,包括:
獲取模塊,用于獲取所述網(wǎng)頁的客服數(shù)據(jù);
匹配模塊,用于計算所述客服數(shù)據(jù)與模板庫中各模板的匹配度;所述模板是用于進行知識篩選的組件;
確定模塊,用于根據(jù)所述匹配度確定目標模板;
抽取模塊,用于利用所述目標模板對所述網(wǎng)頁進行知識抽取。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括預(yù)處理模塊,用于:
獲取所述網(wǎng)頁的業(yè)務(wù)數(shù)據(jù);
對所述業(yè)務(wù)數(shù)據(jù)進行清洗處理,得到客服數(shù)據(jù)。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述確定模塊,具體用于:
若第一模板對應(yīng)的匹配度大于預(yù)設(shè)匹配度閾值,且所述第一模板對應(yīng)的匹配度大于所述模板庫中任意模板對應(yīng)的匹配度,將所述第一模板作為目標模板。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述抽取模塊,具體用于:
接收網(wǎng)頁標注信息;
根據(jù)所述網(wǎng)頁標注信息,利用所述目標模板對所述網(wǎng)頁進行知識抽取。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,還包括生成模塊,用于:
若不存在目標模板,則生成知識抽取提醒信息,并將所述知識抽取提醒信息發(fā)送至顯示模塊,以使所述顯示模塊顯示所述抽取提醒信息。
11.一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權(quán)利要求1至5任一所述方法。
12.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有執(zhí)行權(quán)利要求1至5任一所述方法的計算機程序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國銀行股份有限公司,未經(jīng)中國銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010735444.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





