[發明專利]單輪對話中的命名實體識別方法、裝置、設備及介質在審
| 申請號: | 201911338110.8 | 申請日: | 2019-12-23 |
| 公開(公告)號: | CN110969021A | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 簡仁賢;吳文杰;李強;劉影 | 申請(專利權)人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295 |
| 代理公司: | 北京挺立專利事務所(普通合伙) 11265 | 代理人: | 田黎絨 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輪對 中的 命名 實體 識別 方法 裝置 設備 介質 | ||
1.單輪對話中的命名實體識別方法,其特征在于:包括以下步驟:
步驟一、采集單輪對話中發問方的一句問句數據,采集單輪對話中回答方的一句對問句數據進行回答的答句數據;
步驟二、將步驟一中采集的問句數據和答句數據合成為一句單輪對話數據;
步驟三、將步驟二中合成的一句單輪對話數據輸入至命名實體識別模型,識別出答句數據的命名實體識別結果。
2.按照權利要求1所述的單輪對話中的命名實體識別方法,其特征在于:步驟三中命名實體識別模型為經過訓練的序列標注算法模型。
3.按照權利要求2所述的單輪對話中的命名實體識別方法,其特征在于:所述序列標注算法模型為HMM模型、CRF模型或Deep Learning模型。
4.按照權利要求1所述的單輪對話中的命名實體識別方法,其特征在于:步驟三中將步驟二中合成的一句單輪對話數據輸入至命名實體識別模型前,將單輪對話數據轉換為文本數據,然后將該文本數據輸入至命名實體識別模型。
5.單輪對話中的命名實體識別裝置,其特征在于:包括數據采集模塊、數據合成模塊和命名實體識別模塊;
所述數據采集模塊,用于采集單輪對話中發問方的一句問句數據,還用于采集單輪對話中回答方的一句對問句數據進行回答的答句數據;
所述數據合成模塊,用于將數據采集模塊采集的問句數據和答句數據合成為一句單輪對話數據;
所述命名實體識別模塊,用于將數據合成模塊合成的一句單輪對話數據輸入至命名實體識別模型,識別出答句數據的命名實體識別結果。
6.按照權利要求5所述的單輪對話中的命名實體識別裝置,其特征在于:所述命名實體識別模型為經過訓練的序列標注算法模型。
7.按照權利要求6所述的單輪對話中的命名實體識別裝置,其特征在于:所述序列標注算法模型為HMM模型、CRF模型或Deep Learning模型。
8.按照權利要求5所述的單輪對話中的命名實體識別裝置,其特征在于:所述命名實體識別模塊包括數據轉換單元,所述數據轉換單元用于將數據合成模塊合成的一句單輪對話數據轉換為文本數據,然后輸入至命名實體識別模型。
9.一種命名實體識別設備,其中所述設備包括自然語言數據采集裝置、處理器和存儲器,所述存儲器包含一組指令,所述一組指令在由所述處理器執行時使所述命名實體識別設備執行上述權利要求1-4中任意一項權利要求所述的方法。
10.一種計算機可讀存儲介質,其特征在于,其上存儲有計算機可讀的指令,當利用計算機執行所述指令時執行上述權利要求1-4中任意一項權利要求所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于竹間智能科技(上海)有限公司,未經竹間智能科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911338110.8/1.html,轉載請聲明來源鉆瓜專利網。





