[發(fā)明專利]基于問答平臺(tái)的數(shù)據(jù)處理方法、裝置及相關(guān)設(shè)備在審
| 申請?zhí)枺?/td> | 202110778011.2 | 申請日: | 2021-07-09 |
| 公開(公告)號: | CN113486203A | 公開(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 陳聰;舒暢;陳又新 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/55 | 分類號: | G06F16/55;G06K9/62 |
| 代理公司: | 深圳市賽恩倍吉知識產(chǎn)權(quán)代理有限公司 44334 | 代理人: | 楊毅玲;陳海云 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 問答 平臺(tái) 數(shù)據(jù)處理 方法 裝置 相關(guān) 設(shè)備 | ||
1.一種基于問答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,所述基于問答平臺(tái)的數(shù)據(jù)處理方法包括:
采集目標(biāo)文本集,并調(diào)用預(yù)先訓(xùn)練好的問題檢測模型檢測所述目標(biāo)文本集中是否包含問題文本;
當(dāng)檢測結(jié)果為所述目標(biāo)文本集中包含問題文本時(shí),獲取所述目標(biāo)文本集中的問題文本,得到問題文本集;
獲取所述問題文本集中每一問題文本對應(yīng)的目標(biāo)文檔內(nèi)容,并將所述問題文本與所述目標(biāo)文檔內(nèi)容的相關(guān)度超過預(yù)設(shè)相關(guān)度閾值的問題文本作為目標(biāo)問題文本,得到目標(biāo)問題文本集;
聚類分析所述目標(biāo)問題文本集中的每一所述目標(biāo)問題文本,得到若干個(gè)問題簇;
計(jì)算每一所述問題簇的目標(biāo)指標(biāo)值,并按照預(yù)設(shè)數(shù)據(jù)格式組合所述目標(biāo)指標(biāo)值,得到每一所述問題簇對應(yīng)的目標(biāo)特征值;
將所述目標(biāo)特征值輸入至預(yù)先訓(xùn)練好的重要程度計(jì)算模型中,得到每一所述問題簇對應(yīng)的重要程度;
按照所述重要程度的順序輸出所述問題簇對應(yīng)的答案。
2.根據(jù)權(quán)利要求1所述的基于問答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,在所述調(diào)用預(yù)先訓(xùn)練好的問題檢測模型檢測所述目標(biāo)文本集中是否包含問題文本之前,所述方法還包括:
獲取攜帶預(yù)設(shè)問題標(biāo)簽的文本樣本集,并拆分所述文本樣本集為文本訓(xùn)練集與文本測試集,其中,所述預(yù)設(shè)問題標(biāo)簽用于標(biāo)記所述文本樣本集中的問題文本;
將所述文本訓(xùn)練集輸入至初始神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,得到問題檢測模型;
將所述文本測試集輸入至所述問題檢測模型中,計(jì)算模型的準(zhǔn)確率,并在所述準(zhǔn)確率超過預(yù)設(shè)準(zhǔn)確率閾值時(shí),確定所述問題檢測模型訓(xùn)練完成。
3.根據(jù)權(quán)利要求1所述的基于問答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,所述獲取所述問題文本集中每一問題文本對應(yīng)的目標(biāo)文檔內(nèi)容包括:
獲取所述問題文本集中每一問題文本攜帶的時(shí)間戳;
確定所述時(shí)間戳對應(yīng)的目標(biāo)時(shí)間段;
根據(jù)所述目標(biāo)時(shí)間段遍歷預(yù)先設(shè)置的時(shí)間段與目標(biāo)文檔內(nèi)容的映射關(guān)系,得到所述目標(biāo)時(shí)間段對應(yīng)的目標(biāo)文檔內(nèi)容。
4.根據(jù)權(quán)利要求1所述的基于問答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,所述將所述問題文本與所述目標(biāo)文檔內(nèi)容的相關(guān)度超過預(yù)設(shè)相關(guān)度閾值的問題文本作為目標(biāo)問題文本,得到目標(biāo)問題文本集包括:
向量化處理所述問題文本,得到問題文本向量;
向量化處理所述目標(biāo)文檔內(nèi)容,得到文檔內(nèi)容向量;
按照預(yù)設(shè)相關(guān)度計(jì)算模型計(jì)算所述問題文本向量與所述文檔內(nèi)容向量的相關(guān)度;
檢測所述相關(guān)度是否超過預(yù)設(shè)相關(guān)度閾值;
當(dāng)檢測結(jié)果為所述相關(guān)度超過所述預(yù)設(shè)相關(guān)度閾值時(shí),確定所述相關(guān)度超過所述預(yù)設(shè)相關(guān)度閾值的問題文本為目標(biāo)問題文本;
組合所述目標(biāo)問題文本,得到目標(biāo)問題文本集。
5.根據(jù)權(quán)利要求1所述的基于問答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,所述聚類分析所述目標(biāo)問題文本集中的每一所述目標(biāo)問題文本,得到若干個(gè)問題簇包括:
從所述目標(biāo)問題文本集中隨機(jī)選取預(yù)設(shè)數(shù)量的第一目標(biāo)問題文本,并將所述第一目標(biāo)問題文本作為初始簇中心;
計(jì)算與所述初始簇中心的距離最近的第二目標(biāo)問題文本,并由所述第一目標(biāo)問題文本與所述第二目標(biāo)問題文本組成所述初始簇中心對應(yīng)的問題簇;
獲取所述問題簇中所述第一目標(biāo)問題文本與所述第二目標(biāo)問題文本的問題文本均值,并將所述問題文本均值作為第一簇中心;
計(jì)算與所述第一簇中心的距離最近的第三目標(biāo)問題文本,并更新所述問題文本均值與所述第三目標(biāo)問題文本組成所述第一簇中心對應(yīng)的問題簇;
重復(fù)上述步驟,得到目標(biāo)問題文本均值作為目標(biāo)簇中心,計(jì)算與所述目標(biāo)簇中心的距離最近的第四目標(biāo)問題文本,并更新所述目標(biāo)問題文本均值與所述第四目標(biāo)問題文本組成所述目標(biāo)簇中心對應(yīng)的目標(biāo)問題簇。
6.根據(jù)權(quán)利要求1所述的基于問答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,所述按照預(yù)設(shè)數(shù)據(jù)格式組合所述目標(biāo)指標(biāo)值,得到每一所述問題簇對應(yīng)的目標(biāo)特征值包括:
向量化處理所述目標(biāo)指標(biāo)值,得到若干指標(biāo)向量;
獲取每一所述指標(biāo)向量的排列順序;
按照所述排列順序拼接所述指標(biāo)向量,得到目標(biāo)特征值向量;
確定所述目標(biāo)特征值向量中的向量元素作為目標(biāo)特征值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110778011.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于生成動(dòng)態(tài)幫助文檔的方法和系統(tǒng)
- 建立問答文本評價(jià)模型與評價(jià)問答文本的方法、裝置
- 基于學(xué)生問答方式的在線教育系統(tǒng)
- 一種問答輸入的智能提示方法、裝置和終端設(shè)備
- 一種通用的智能問答自動(dòng)化運(yùn)維系統(tǒng)及方法
- 自動(dòng)問答方法、裝置、可讀存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于知識圖譜的智能問答引擎及其實(shí)現(xiàn)方法
- 基于人工智能技術(shù)的類腦問答系統(tǒng)
- 一種基于語義分析技術(shù)的專業(yè)制度檔案問答機(jī)器人系統(tǒng)
- 一種視覺問答方法、系統(tǒng)及服務(wù)器
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





