[發明專利]擴展問評價方法及裝置有效
| 申請號: | 201710439654.8 | 申請日: | 2017-06-12 |
| 公開(公告)號: | CN107229733B | 公開(公告)日: | 2020-01-14 |
| 發明(設計)人: | 李陟;朱頻頻 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35 |
| 代理公司: | 31100 上海專利商標事務所有限公司 | 代理人: | 徐偉 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 復雜度 知識庫 對照表 聚類處理 數目確定 質量信息 預設 關聯 | ||
1.一種用于評價知識庫中擴展問的擴展問質量的方法,所述知識庫包括多個標準問,每個標準問具有關聯的多個擴展問,每個擴展問是相應標準問的相似問法,所述方法包括:
對各個標準問下的擴展問執行不預設聚類數量的聚類處理,以將每個標準問下的擴展問聚類為多個聚類;
基于聚類的數目確定擴展問復雜度;以及
將擴展問復雜度與復雜度對照表相對照以獲得擴展問質量信息。
2.如權利要求1所述的方法,其特征在于,所述基于聚類的數目確定擴展問復雜度包括:
統計所有標準問的聚類總數;以及
計算聚類總數與標準問總數的比值以作為整體擴展問復雜度,
所述將擴展問復雜度與復雜度對照表相對照以獲得擴展問質量信息包括將所述整體擴展問復雜度與所述復雜度對照表相對照以獲得所有標準問的整體擴展問質量信息。
3.如權利要求1所述的方法,其特征在于,所述基于聚類的數目確定擴展問復雜度包括:
將每個標準問自身的聚類數目作為該標準問的個體擴展問復雜度,
所述將擴展問復雜度與復雜度對照表相對照以獲得擴展問質量信息包括將每個標準問的個體擴展問復雜度與所述復雜度對照表相對照以獲得每個標準問的個體擴展問質量信息。
4.如權利要求1所述的方法,其特征在于,所述復雜度對照表的復雜度數值包括多個區間,復雜度數值越大的區間指示越優良的擴展問質量信息。
5.如權利要求1所述的方法,其特征在于,所述對各個標準問下的擴展問執行聚類處理的過程包括采用算法中的任一種來執行:BIRCH算法、K-means算法和DBSCAN算法。
6.如權利要求1所述的方法,其特征在于,所述對各個標準問下的擴展問執行聚類處理的過程包括:
數據獲取步驟,針對每個標準問獲得與其多個擴展問相應的多個擴展問分詞結果,其中每個擴展問分詞結果由對應擴展問的各詞類或各單詞所屬的詞類組成;
聚類創建步驟,針對每個標準問,從該標準問的多個擴展問分詞結果的交集中依據詞組出現的頻率選擇詞組以構成該標準問的至少一個聚類,每個詞組由預定數目個詞類組成;
檢測步驟,針對所有標準問的所有擴展問,執行標準問匹配處理,對于為每個標準問創建的每個聚類,判斷該聚類是否被匹配至其標準問的至少一個擴展問,若是,則該聚類被標記為第一狀態,否則被標記為第二狀態;以及
刪除步驟,刪除所有狀態為第二狀態的聚類。
7.如權利要求6所述的方法,其特征在于,在所述聚類創建步驟中,針對每個標準問,從該標準問的多個擴展問分詞結果的交集中選擇出現頻率最高的詞組,將選出的詞組作為該標準問的一個聚類,然后從該標準問的未包括該詞組的擴展問分詞結果的交集中選擇出現頻率最高的詞組,將選出的詞組繼續作為該標準問的一個聚類,重復此過程直至該標準問下沒有其余的擴展問分詞結果或者剩余的擴展問分詞結果之間沒有達到所述預定數目個詞類的交集。
8.如權利要求6所述的方法,其特征在于,在所述檢測步驟中,針對每個擴展問,所述執行標準問匹配處理包括將該擴展問與針對所有標準問生成的所有聚類執行語義相似度計算,并將該擴展問匹配至具有最高語義相似度且該最高語義相似度高于閾值的聚類。
9.如權利要求6所述的方法,其特征在于,所述檢測步驟還包括:
在執行所述標準問匹配處理之后,對于每個標準問的每個擴展問,判斷該擴展問是否被匹配至與之相關聯的標準問所屬的聚類,若是將該擴展問標記為第四狀態,否則將該擴展問標記為第三狀態,
其中,所述方法還包括循環執行所述聚類創建步驟、所述檢測步驟、和所述刪除步驟預定次數,其中,所述聚類創建步驟中組成所述詞組的詞類的所述預定數目隨著循環依次遞增,且在后續循環中只有狀態為第三狀態的擴展問參與聚類創建。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710439654.8/1.html,轉載請聲明來源鉆瓜專利網。





