[發明專利]一種基于眾包的新型問答系統有效
| 申請號: | 201510076574.1 | 申請日: | 2015-02-12 |
| 公開(公告)號: | CN104615755B | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | 孫海龍;張日崇;劉馨怡;孫富民;劉旭東 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司11205 | 代理人: | 馬爽,黃健 |
| 地址: | 100191 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 新型 問答 系統 | ||
技術領域
本發明涉及一種互聯網數據處理技術,尤其涉及一種基于眾包的新型問答系統。
背景技術
隨著互聯網的快速發展,用戶獲取的信息越來越多,在Web2.0時期,用戶能夠通過互聯網分享信息,其分享的內容包括文字、圖片、視頻、網站和移動應用,因此,信息數量不斷增多的同時種類也不斷多元化。互聯網逐漸成為了信息數據的巨大載體,而大量的信息數據帶來了一項挑戰——如何使用戶獲得真正需要的信息。
搜索引擎作為一項信息檢索工具,能夠在指數增長級的大數據中,利用關鍵詞匹配來過濾掉一定量的無用信息篩選出結果,但返回結果仍為上百萬的網頁鏈接,數量眾多且形式單一,增大了篩選有效信息的難度。再者,搜索引擎采用的基于關鍵詞語義檢索的方式對用戶輸入關鍵詞的要求高,若用戶不能輸入有效關鍵詞,查詢語句則無法準確表達用戶搜索需求,導致檢索結果不佳。
問答系統彌補了搜索引擎的缺陷,能夠通過自然語言表達信息需求并獲得相對直接的信息結果。早期的自動問答系統,以人工智能技術對自然語言問題進行分析,再檢索文獻知識庫快速推理獲得高可信度答案。隨著問答領域研究的深入,發現自動問答系統能夠較好解決事實性問題,但因為語義的復雜性無法良好地處理一類復雜問題,事實性問題是能夠得到一個客觀事實作為答案的問題,如“《哈利波特》的作者是誰?”,問題的答案為J.K.羅琳,是一個實體人名,而目前提取實體答案的技術已經很成熟,復雜類問題通常是沒有標準答案的問題,如“北京哪家餐廳味道好?”,這類問題的答案主觀性強,依賴于傳統文獻知識庫很難得出一個成體系的答案,最后,用戶不僅可能不滿意生成的答案,甚至還可能無法獲取答案。而通過社區問答系統與自動問答系統不同的是,其研究內容不僅與機器算法相關,也融入了人計算的相關技術,能夠利用人群的語義理解能力和廣泛的背景知識儲備給出答案解決復雜類問題。社區問答系統以一種一問多答服務平臺的方式,提供了用戶以自然語言提出問題并作答的功能,通過簡單直接的方式滿足人們表達信息和獲取信息的需求。社區問答系統中的問題通常都有多個回答,傳統的最佳答案篩選方式是由提問者只采納一個回答作為最佳答案的方式,但受制于各個用戶之間的知識背景差異及局限性,致使單個回答的最佳答案的質量較為片面。綜上所述,問答系統以比搜索引擎更為自然的方式服務用戶的信息需求,自動問答系統雖能夠快速獲取答案,但受制于語義分析技術難度大、成本高;社區問答系統解決了自動問答系統的語義難點,卻無法保證即時作答,而且社區問答系統給出的單一回答較為片面。
發明內容
本發明提供一種基于眾包的新型問答系統,解決了現有的自動問答系統受制于語義分析技術難度大、成本高的技術問題以及現有的社區問答系統無法保證即時的技術問題。
本發明提供一種基于眾包的新型問答系統,所述系統包括:
客戶端和服務器,所述客戶端包括問答模塊和智答模塊,所述服務器包括問答分析模塊、中介模式決策模塊、數據源查詢模塊、優化模塊,其中
所述問答模塊與所述問答分析模塊相連,所述問答模塊用于獲取問答數據并將所述問答數據發送給所述問答分析模塊,其中所述問答數據包括問題數據和回答數據;
所述問答分析模塊用于根據所述問答數據獲取關鍵詞組;
所述中介模式決策模塊分別與所述問答分析模塊和所述數據源查詢模塊相連,所述中介模式決策模塊用于根據所述問答分析模塊發送的關鍵詞組與預設的屬性候選集映射生成中介模式;
所述數據源查詢模塊用于根據所述中介模式生成數據源查詢語句,并根據所述數據源查詢語句在多個數據源中檢索獲得實體數據;
所述優化模塊分別與所述數據源查詢模塊和所述智答模塊相連,所述優化模塊用于將所述實體數據封裝為眾包任務并將所述眾包任務發送給所述智答模塊以使所述智答模塊根據所述眾包任務獲得眾包反饋數據,且所述優化模塊還用于根據所述智答模塊反饋的所述眾包反饋數據生成智答數據;
所述智答模塊用于根據所述眾包任務獲取所述眾包反饋數據,并將所述眾包反饋數據發送給所述優化模塊以使所述優化模塊生成智答數據。
本發明的實施方案中,所述問答分析模塊具體用于:
將所述問答數據進行分詞處理,并在所述分詞處理中過濾停用詞;;
將過濾后的詞語基于本體的概念樹進行分類標注,并記錄所述詞語在所述概念樹中的頻率;
根據所述詞語在所述概念樹中的分類生成關鍵詞組,所述關鍵詞組包括實體組、概念組和關系組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510076574.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種不同業務系統平臺間的數據同步方法
- 下一篇:鈴音推薦方法及裝置





