[發明專利]低精度問題的歸類方法、智能終端及計算機可讀存儲介質有效
| 申請號: | 201911330731.1 | 申請日: | 2019-12-20 |
| 公開(公告)號: | CN111177379B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 陳棟梁;熊友軍 | 申請(專利權)人: | 深圳市優必選科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 李莉 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 精度 問題 歸類 方法 智能 終端 計算機 可讀 存儲 介質 | ||
本申請公開了一種低精度問題的歸類方法、智能終端及計算機可讀存儲介質,該低精度問題的歸類方法包括:獲取到目標問題匹配到的多個候選主問題;對每一候選主問題對應的主似問題集合表進行數據分析,以放大多個候選主問題之間的差別;獲取到目標問題與放大差別后的每一候選主問題的相似度,以將目標問題歸類為與其相似度最高的候選主問題。通過上述方式,本申請通過放大多個候選主問題的差別,以能夠將低精度問題準確地歸類到多個高精度單獨匹配的候選主問題中與之相似度最高的那一個候選主問題中,從而能夠豐富相應問答系統的語料庫,并增強其差異化識別處理能力。
技術領域
本申請涉及低精度問題歸類的技術領域,尤其涉及一種低精度問題的歸類方法、智能終端及計算機可讀存儲介質。
背景技術
問答系統,簡稱FAQ(Frequently?Asked?Questions)系統,是信息檢索的一種高級形式,能夠更加準確地理解用戶用自然語言提出的問題,并通過檢索問答知識庫返回簡潔、準確的匹配答案。相較于搜索引擎,問答系統能更好地理解用戶提問的真實意圖,且能夠進一步更有效地滿足用戶的信息檢索需求。問答系統是目前人工智能和自然語言處理領域中一個倍受關注并具有廣泛發展前景的研究方向。
FAQ系統為了增強自動應答的健壯性,一是需要給庫中已有的問題增加相似問,增強已有問題的泛化能力,二是對于那些庫中所有問題都不能與之匹配并回答的用戶問題,需要在庫中增加新的問題和答案。
其中,對于那些含有不可舍棄的價值,但需要經過提煉后才能使用的低精度問題,因其可能會與多個高精度單獨匹配的主問題相匹配,而存在匹配錯誤的可能,故而需要準確地將其歸類為其中最為匹配的高精度單獨匹配的主問題,以能夠獲取到準確的答案。
發明內容
本申請提供了一種低精度問題的歸類方法、智能終端及計算機可讀存儲介質,該低精度問題的歸類方法能夠有效解決低精度問題無法準確歸類為多個高精度單獨匹配的主問題中最為匹配的一個的問題。
為解決上述技術問題,本申請采用的一個技術方案是:提供一種低精度問題的歸類方法,其中,該低精度問題的歸類方法包括:獲取到目標問題匹配到的多個候選主問題;對每一候選主問題對應的主似問題集合表進行數據分析,以放大多個候選主問題之間的差別;獲取到目標問題與放大差別后的每一候選主問題的相似度,以將目標問題歸類為與其相似度最高的候選主問題。
其中,獲取到目標問題匹配到的多個候選主問題的步驟之后,對每一候選主問題對應的主似問題集合進行數據分析,以放大多個候選主問題之間的差別的步驟之前,還包括:獲取到每一候選主問題的主似問題集合表。
其中,對每一候選主問題對應的主似問題集合表進行數據分析,以放大多個候選主問題之間的差別的步驟包括:對每一候選主問題對應的主似問題集合表進行切詞,并進行詞頻統計,以放大多個候選主問題之間的差別;獲取到目標問題與放大差別后的每一候選主問題的相似度,以將目標問題歸類為與其相似度最高的候選主問題的步驟包括:根據詞頻統計獲取到每一候選主問題的分詞在其主似問題集合中的平均擊中量,以將目標問題歸類為平均擊中量最高的候選主問題。
其中,根據詞頻統計獲取到每一候選主問題的分詞在其主似問題集合中的平均擊中量,以將目標問題歸類為平均擊中量最高的候選主問題的步驟包括:根據詞頻統計獲取到每一候選主問題的分詞在其主似問題集合中的平均擊中量以及相應的坐標;對目標問題進行切詞,以計算并統計目標問題的分詞在每一候選主問題的主似問題集合上的相對坐標值;如果平均擊中量最高的候選主問題的平均擊中量比平均擊中量第二和第三之和更高,且相對坐標值在預設區間閾值之間時,將目標問題歸類為平均擊中量最高的候選主問題。
其中,根據詞頻統計獲取到每一候選主問題的分詞在其主似問題集合中的平均擊中量以及相應的坐標分布的步驟包括:根據詞頻統計獲取到每一候選主問題的分詞在其主似問題集合中的平均擊中量,以及每一候選主問題的主似問題集合中每一問題的分詞對應的平均擊中量的均值和方差,以進一步計算出每一候選主問題的分詞在其主似問題集合中的坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技股份有限公司,未經深圳市優必選科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911330731.1/2.html,轉載請聲明來源鉆瓜專利網。





