[發(fā)明專利]旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法無效
| 申請?zhí)枺?/td> | 200810058660.X | 申請日: | 2008-07-10 |
| 公開(公告)號: | CN101373532A | 公開(公告)日: | 2009-02-25 |
| 發(fā)明(設(shè)計)人: | 余正濤;毛存禮;韓露;孟祥燕;郭劍毅;車文剛;張志坤 | 申請(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06F17/30 |
| 代理公司: | 昆明正原專利代理有限責(zé)任公司 | 代理人: | 徐玲菊 |
| 地址: | 650093云南*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 旅游 領(lǐng)域 faq 中文 問答 系統(tǒng) 實現(xiàn) 方法 | ||
1.一種旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于包括:
(1)FAQ收集與組織:結(jié)合人工或半自動方式從互聯(lián)網(wǎng)上提取旅游問答對,并整理進入旅游問答庫,形成旅游FAQ庫;
(2)旅游領(lǐng)域知識庫構(gòu)建:構(gòu)建并維護旅游領(lǐng)域知識結(jié)構(gòu)及關(guān)系,形成旅游領(lǐng)域知識庫;
(3)用戶查詢:在互聯(lián)網(wǎng)上,用戶通過自然語言問題進行旅游信息查詢;
(4)問題分析:對用戶輸入的問題進行分析,提取表征問題的關(guān)鍵詞、擴展詞、句法依存對、問題類型等信息;
(5)答案提取:根據(jù)問題分析結(jié)果,從常問問題庫FAQ中提檢索侯選問題,采用領(lǐng)域問題相似度計算方法,計算用戶問題與侯選問題相似度,提取相似度最大的問題答案作為侯選答案,并提供給用戶,返回最終用戶查詢答案。
2.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,用戶可以提供面向文本的自然語言問題,系統(tǒng)直接返回答案,而不是和問題相關(guān)的大量網(wǎng)頁。
3.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,所述步驟(1)FAQ收集與組織方法具體為:第一種通過網(wǎng)絡(luò)爬蟲從互聯(lián)網(wǎng)上自動爬取,并通過人工篩選進入FAQ庫;第二種是通過人工收集與整理獲得,針對旅游領(lǐng)域,專門收集地方、景點、風(fēng)土人情、酒店等相關(guān)介紹、門票、交通等相關(guān)問題,分類整理和組織FAQ問答對并進入FAQ庫;第三種則是由系統(tǒng)自動記錄用戶輸入但在問句庫中不存在的新問句,并把這類問句統(tǒng)一保存到問答歷史庫中,定期由人工審核整理,把對應(yīng)的答案和問句一起入FAQ庫。
4.根據(jù)權(quán)利要求3所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,F(xiàn)AQ的問答對的存儲通過建立問題question和答案answer兩個關(guān)系表,分別通過主鍵Questionid,Answerid進行答案索引;問題表的存儲,為了便于快速檢索,采用倒排索引方式進行存儲,建立詞與問句之間的倒排索引文檔,候選問題集的選擇從索引文檔中提取,而最終答案則根據(jù)問題表中存放的答案answerid從數(shù)據(jù)庫中直接輸出。
5.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,所述步驟(2)主要利用了本體論的思想,借助現(xiàn)有的中科院院語言信息中心董振東先生的“知網(wǎng)”進行領(lǐng)域術(shù)語的擴展。
6.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,所述步驟(2)具體為:借助本體論的思想對云南旅游領(lǐng)域資源的概念進行精確描述,以“知網(wǎng)”為基礎(chǔ),采用“知網(wǎng)”的概念描述語言KDML規(guī)則,建立了專門的云南旅游領(lǐng)域本體,形成云南旅游領(lǐng)域資源本體庫領(lǐng)域知網(wǎng)體系,并實現(xiàn)了云南旅游知識庫“領(lǐng)域知網(wǎng)”與常識知識庫“知網(wǎng)”的融合。目前共對云南旅游景點介紹、風(fēng)土民情、旅游交通等旅游相關(guān)2012個概念進行了定義和描述,形成了云南旅游領(lǐng)域“知網(wǎng)”。
7.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,所述步驟(3)具體為:用戶查詢提供用戶與自然語言方式進行提問,用戶可以通過互聯(lián)網(wǎng)進行相關(guān)旅游領(lǐng)域問題查詢。
8.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,所述步驟(4)具體為:通過問句分析模塊對用戶輸入的問題進行分析,主要包括詞法分析、句法分析及語義分析,詞法分析主要對問題進行分詞,過濾停用詞,提取查詢核心詞及借助“知網(wǎng)”進行關(guān)鍵詞擴展;句法分析主要對提取問句的核心詞干,借助哈工大句法分析器,提取問句句法依存對;語義分析主要分析問句語義信息,根據(jù)旅游領(lǐng)域特點,定義并提取旅游領(lǐng)域問題類型特征句模規(guī)則,并通過規(guī)則匹配方式實現(xiàn)問句類型的識別。
9.根據(jù)權(quán)利要求1所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于,所述步驟(5)答案提取方法具體為:根據(jù)問題分獲取的問題類型、問題關(guān)鍵詞、問題擴展詞等問句關(guān)系信息,采用lucene從常問問題庫FAQ中檢索侯選問題集,借助領(lǐng)域問題相似度計算方法,提取相似度最大的侯選問題答案作為答案,并返回給用戶。
10.根據(jù)權(quán)利要求9所述的旅游領(lǐng)域FAQ中文問答系統(tǒng)實現(xiàn)方法,其特征在于答案提取方法依據(jù)領(lǐng)域問句相似度計算方法提取用戶最相關(guān)問題,領(lǐng)域問句相似度計算方法融合了領(lǐng)域知識概念及關(guān)系即旅游領(lǐng)域術(shù)語及關(guān)系、句法結(jié)構(gòu)即句法依存對及關(guān)系及語義即問題類型等多特征進行句子相似度計算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810058660.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





