[發明專利]擴展問評價方法及裝置有效
| 申請號: | 201710439654.8 | 申請日: | 2017-06-12 |
| 公開(公告)號: | CN107229733B | 公開(公告)日: | 2020-01-14 |
| 發明(設計)人: | 李陟;朱頻頻 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35 |
| 代理公司: | 31100 上海專利商標事務所有限公司 | 代理人: | 徐偉 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 復雜度 知識庫 對照表 聚類處理 數目確定 質量信息 預設 關聯 | ||
本發明提供了一種用于評價知識庫中擴展問的擴展問質量的方法,該知識庫包括多個標準問,每個標準問具有關聯的多個擴展問,每個擴展問是相應標準問的相似問法,該方法包括:對各個標準問下的擴展問執行不預設聚類數量的聚類處理,以將每個標準問下的擴展問聚類為多個聚類;基于聚類的數目確定擴展問復雜度;以及將擴展問復雜度與復雜度對照表相對照以獲得擴展問質量信息。
技術領域
本發明涉及人機交互技術領域,尤其涉及用于評價知識庫中擴展問的擴展問質量的方法和裝置。
背景技術
人機交互是研究系統與用戶之間的交互關系的科學。系統可以是各種各樣的機器,也可以是計算機化的系統和軟件。例如,通過人機交互可以實現各種人工智能系統,例如,智能客服系統、語音控制系統等等。人工智能語義識別是人機交互的基礎,其能夠對人類語言進行識別,以轉換成機器能夠理解的語言。
智能問答系統是人機交互的一種典型應用,其中當用戶提出問題后,智能問答系統給出該問題的答案。為此,智能問答系統中有一套知識庫,里面有大量的問題和與每個問題相對應的答案。智能問答系統首先需要識別用戶所提出的問題,即從知識庫中找到與該用戶問題所對應的問題,然后找出與該問題相匹配的答案。
知識庫中的基本知識點最原始和最簡單的形式就是平時常用的FAQ,一般的形式是“問-答”對。在本發明中,“標準問”是用來表示某個知識點的文字,主要目標是表達清晰,便于維護。例如,“彩鈴的資費”就是表達清晰的標準問描述。這里的“問”不應被狹義地理解為“詢問”,而應廣義地來理解一“輸入”,該“輸入”具有對應的“輸出”。例如,對于用于控制系統的語義識別而言,用戶的一個指令,例如“打開收音機”也應可以被理解為是一個“問”,此時對應的“答”可以是用于執行相應控制的控制程序的調用。
用戶在向機器輸入時,最理想的情況是使用標準問,則機器的智能語義識別系統馬上能夠理解用戶的意思。然而,用戶往往并非使用的是標準問,而是標準問的一些變形的形式。例如,若對于收音機的電臺切換的標準問形式是“換一個電臺”,那么用戶可能使用的命令是“切換一個電臺”,機器也需要能夠識別用戶表達的是同一個意思。
因此,對于智能語義識別而言,知識庫里需要有標準問的擴展問,該擴展問與標準問表達形式有略微差異,但是表達相同的含義。在用戶輸入用戶問句后,主要依靠擴展問來實現用戶問句與標準問的匹配。
作為示例,可以將用戶問句與知識庫中所有標準問的所有擴展問執行語義相似度計算,找出與該用戶問句具有最高語義相似度的擴展問,若該最高語義相似度高出系統所設的閾值,則該擴展問所對應的標準問被認為是與該用戶問句相匹配的標準問,進而將該標準問所對應的知識點中的答案反饋給用戶。另一方面,若計算出的該最高語義相似度低于系統所設的該閾值,則認為標準問匹配失敗。此時,可向用戶反饋語義識別失敗,提示用戶可再次輸入。
由此,擴展問的質量至關重要。目前人工智能領域主要還是依靠人工整理擴展問的方式,因為整理的內容多,測試中一直存在效率和效果不能兼得的問題。即如果抽測的內容少,結果的隨機性就大,如果抽測的內容多,則相當于測試人員重做知識庫。
因此,一種高效地評價擴展問質量的方案是本領域所希望的。
發明內容
以下給出一個或多個方面的簡要概述以提供對這些方面的基本理解。此概述不是所有構想到的方面的詳盡綜覽,并且既非旨在指認出所有方面的關鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是要以簡化形式給出一個或多個方面的一些概念以為稍后給出的更加詳細的描述之序。
根據本發明的一方面,提供了一種用于評價知識庫中擴展問的擴展問質量的方法,該知識庫包括多個標準問,每個標準問具有關聯的多個擴展問,每個擴展問是相應標準問的相似問法,該方法包括:對各個標準問下的擴展問執行不預設聚類數量的聚類處理,以將每個標準問下的擴展問聚類為多個聚類;基于聚類的數目確定擴展問復雜度;以及將擴展問復雜度與復雜度對照表相對照以獲得擴展問質量信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710439654.8/2.html,轉載請聲明來源鉆瓜專利網。





