[發明專利]句子分類的測試方法、裝置、服務器及可讀存儲介質有效
| 申請號: | 201811539964.8 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN110032723B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 陳曉軍;崔恒斌;張家興 | 申請(專利權)人: | 創新先進技術有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F16/35 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 劉杰 |
| 地址: | 開曼群島大開曼島*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 句子 分類 測試 方法 裝置 服務器 可讀 存儲 介質 | ||
本說明書實施例公開了一種句子分類的測試方法,對所述句子測試集中的每個句子對進行特征分析,得到每個句子對的特征參數;利用每個句子對的特征參數對所述句子測試集中的所有句子對進行分類,得到所述句子測試集對應的多種句子分類,使得分類后的每種句子分類中包括的所有句子對具有相同的特征參數;在每種句子分類中包括的所有句子對具有相同的特征參數的情況下,利用二分類模型對每種句子分類進行測試,會使得獲取到的二分類模型相對于每種句子分類的適配度的準確度較高。
技術領域
本說明書實施例涉及數據處理技術領域,尤其涉及一種句子分類的測試方法、裝置、服務器及可讀存儲介質。
背景技術
隨著互聯網技術飛速發展,語義匹配在互聯網中的應用場景越來越廣泛。例如,在網頁搜索中,需要度量用戶查詢和網頁標題的語義相關性;在詢問推薦中,需要度量詢問和其他詢問之間的相似度,這些場景都會用到語義匹配。
現有技術中在對語義匹配測試集進行測試時,直接通過模型將語義匹配測試集中的所有句子進行測試,并沒有對語義匹配測試集進行分析,隨著語義匹配測試集中句子的不同,其對應的模型也需要進行大量的訓練才能提高模型與語義匹配測試集的適配度。
發明內容
本說明書實施例提供了一種句子分類的測試方法、裝置、服務器及可讀存儲介質,通過對測試集中的句子對進行分類,從而能夠準確獲取不同句子分類與二分類模型的適配度。
本說明書實施例第一方面提供了一種句子分類的測試方法,包括:
獲取句子測試集,其中,所述句子測試集中包括多個句子對;
對所述句子測試集中的每個句子對進行特征分析,得到每個句子對的特征參數;
利用每個句子對的特征參數對所述句子測試集中的所有句子對進行分類,得到所述句子測試集對應的多種句子分類;
利用預先創建的二分類模型對所述多種句子分類中的每種句子分類進行測試,獲得所述二分類模型相對于每種句子分類的適配度。
本說明書實施例第二方面提供了一種句子分類的測試裝置,包括:
句子測試集獲取單元,用于獲取句子測試集,其中,所述句子測試集中包括多個句子對;
特征參數獲取單元,用于對所述句子測試集中的每個句子對進行特征分析,得到每個句子對的特征參數;
句子分類單元,用于利用每個句子對的特征參數對所述句子測試集中的所有句子對進行分類,得到所述句子測試集對應的多種句子分類;
適配度獲取單元,用于利用預先創建的二分類模型對所述多種句子分類中的每種句子分類進行測試,獲得所述二分類模型相對于每種句子分類的適配度。
本說明書實施例第三方面還提供了一種服務器,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現上述句子分類的測試方法的步驟。
本說明書實施例第四方面還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時上述句子分類的測試方法的步驟。
本說明書實施例的有益效果如下:
基于上述技術方案,對所述句子測試集中的每個句子對進行特征分析,得到每個句子對的特征參數;利用每個句子對的特征參數對所述句子測試集中的所有句子對進行分類,得到所述句子測試集對應的多種句子分類,使得分類后的每種句子分類中包括的所有句子對具有相同的特征參數;在每種句子分類中包括的所有句子對具有相同的特征參數的情況下,利用二分類模型對每種句子分類進行測試,會使得獲取到的二分類模型相對于每種句子分類的適配度的準確度較高。
附圖說明
圖1為本說明書實施例中句子分類的測試方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新先進技術有限公司,未經創新先進技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811539964.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文本糾錯方法和裝置
- 下一篇:用于識別用戶意圖的方法及裝置





