日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于WMD的中文問答匹配方法在審

專利信息
申請號: 201710539034.1 申請日: 2017-07-04
公開(公告)號: CN107391614A 公開(公告)日: 2017-11-24
發明(設計)人: 杜云貴;杜若;李智星;侯聰;晏世凱;劉科 申請(專利權)人: 重慶智慧思特大數據有限公司;重慶明斯基數據科技有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 重慶市恒信知識產權代理有限公司50102 代理人: 劉小紅
地址: 400065 重慶市*** 國省代碼: 重慶;85
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 wmd 中文 問答 匹配 方法
【說明書】:

技術領域

發明涉及問答系統以及自然語言處理領域,特別是涉及一種基于WMD的中文問答匹配方法。

背景技術

隨著信息技術的迅猛發展,互聯網上的數據呈海量增長,與此同時,網絡上的冗余數據也越來越多,對于需要在網絡上檢索自己所需信息的用戶來說,其檢索任務也變得愈加困難,如何簡潔方便又有效的獲取用戶想了解的信息已成為一個難題擺到人們面前。

因此,以Google、百度為代表的搜索引擎得到了迅猛的發展,用戶只要向搜索引擎輸入一些關鍵詞組合,搜索引擎就可以返回大量包含相應關鍵詞的網頁,再通過對返回結果進行篩選,即可得到自己所需的信息。但搜索引擎存在很多的不足,一方面返回的結果太多,導致用戶很難快速的定位到所需信息;另一方面,搜索引擎技術的基礎——關鍵字匹配,只關注了語法形式,并沒有涉及語言的語義信息,用戶僅采用簡單的查詢詞很難表達其真實的檢索需求,導致檢索效果一般。

獲取需求信息的方式除搜索引擎外,還有另外一種方式,即問答系統(QA,Question Answering)。問答系統是目前自然語言處理領域的一個研究熱點,區別于搜索引擎系統,問答系統既能夠讓用戶使用自然語言句子提問,又能夠為用戶直接返回所需的答案,而不是一些相關的網頁,這使得問答系統能讓人們在雜亂無章的網絡世界中快速、準確地獲得自己想要的信息。然而,在問答系統中,對問題的正確理解是整個問題處理過程的前提,句子相似度的計算又是正確理解用戶提出問題的基礎。因此,需要針對問答系統開發一種精度更高的問句匹配方法以提升問答系統的準確率。

WMD(Word Mover’s Distance)距離是一種基于Word2vec的文檔間相似度度量算法。對于兩篇文檔,該算法首先將文檔使用BOW模型(Bag of Words)向量化表示,得到文檔對應的特征向量;同時求取兩篇文檔中的所有詞語之間的距離,進一步得到距離矩陣,將兩篇文檔所對應的特征向量和距離矩陣作為輸入代入EMD(Earth Mover’s Distance)距離算法即可求得WMD距離。在文檔分類中,當使用WMD距離替代原始kNN算法(k-Nearest Neighbors)中的歐式距離時,可以有效的降低分類的誤差。

發明內容

本發明旨在解決以上現有技術的問題。提出了一種提高搜索問答準確度、提高效率的基于WMD的中文問答匹配方法。本發明的技術方案如下:

一種基于WMD的中文問答匹配方法,其包括:

目標領域的知識庫的建立步驟:對知識庫的數據預處理步驟:常用同義詞詞典的建立步驟:詞語距離字典的建立步驟:用戶提問信息的預處理步驟:文檔向量化表示步驟:問句檢索及問句匹配步驟:答案返回。

進一步的,所述目標領域的知識庫的建立步驟包括:收集某一目標領域的知識,并將其整理為問答對的形式。

進一步的,所述對知識庫的數據預處理步驟包括:通過無監督算法從知識庫中發現新詞(新詞是指詞庫里面沒有出現過的詞,比如某些機構的名字,網絡新詞匯等),將新詞和目標領域的專業詞匯作為詞庫,使用中文分詞算法將知識庫中的問句和答案進行分詞操作,并過濾分詞結果中出現的標點符號。

進一步的,所述常用同義詞詞典的建立步驟包括:將現有同義詞詞林、百科詞條整理轉換得到常用同義詞詞典,再使用爬蟲抓取互聯網上的詞條并整理成中文常用同義詞詞典,并使用正則表達式將知識庫中的英文單詞找出并翻譯,得到中英常用同義詞詞典,將這兩者更新至常用同義詞詞典。

進一步的,所述詞語距離字典的建立步驟包括:使用分詞并過濾后的知識庫作為訓練語料,為出現過的每個詞語訓練一個d維的word2vec向量,通過每個詞語的word2vec向量計算出每個詞語的前k個近鄰詞語及對應的距離,得到詞語距離字典,同時,為得到的常用同義詞詞典中的同義詞兩兩之間啟發式的設置一個距離值,使用該距離值更新詞語距離字典。

進一步的,所述用戶提問信息的預處理步驟包括:將發現的新詞和目標領域的專業詞匯作為詞庫使用中文分詞算法將用戶提出的問句進行分詞操作,并過濾分詞結果中的標點符號。

進一步的,所述文檔向量化表示步驟包括:根據詞頻、文檔頻、詞性、詞語位置將知識庫中的問句和用戶提出的問句向量化表示。

進一步的,文檔向量化表示使用的是加權后的TF-IDF值,權值設置的依據為詞語的詞性以及詞語的長度信息。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶智慧思特大數據有限公司;重慶明斯基數據科技有限公司,未經重慶智慧思特大數據有限公司;重慶明斯基數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710539034.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 中日韩欧美一级毛片| 亚洲欧美一二三| 精品国产乱码久久久久久软件影片| 在线播放国产一区| 久久精品手机视频| 日韩av在线免费电影| 欧美午夜精品一区二区三区| 99久久久国产精品免费无卡顿| xoxoxo亚洲国产精品| 亚洲午夜精品一区二区三区电影院| 欧美日韩亚洲三区| 午夜天堂在线| 日本一区二区三区免费在线| 2020国产精品自拍| 一色桃子av大全在线播放| 中文字幕日韩一区二区| 欧美日韩一区不卡| 久久久久久国产一区二区三区| 综合久久国产九一剧情麻豆| 亚洲精品一区二区三区98年| 中文字幕一区二区三区不卡| 国产精品亚洲一区二区三区| 97人人澡人人爽91综合色| 日本久久不卡| 国产性猛交xx乱视频| 日本一区欧美| 日韩精品一区二区三区在线| 黄色91在线观看| 日本精品一区在线| 麻豆国产一区二区| 日韩av在线资源| 国产一区午夜| 精品一区二区三区视频?| 欧美在线播放一区| 国产一区二区电影在线观看| 国产视频一区二区视频| 91久久久爱一区二区三区| 大桥未久黑人强制中出| 99久久精品免费看国产交换| 国产精品19乱码一区二区三区| 中文乱码字幕永久永久电影| 国产激情二区| 国产69精品久久久久777糖心| 国产电影精品一区二区三区| 欧美精品一区久久| 国产伦精品一区二区三区照片91| 亚洲1区2区3区4区| 人人玩人人添人人澡97| 日韩av中文字幕在线免费观看| 亚洲国产精品日本| 激情久久综合| 99精品视频一区二区| 欧美激情视频一区二区三区免费 | 狠狠色狠狠色综合日日五| 日本大码bbw肉感高潮| 国产精品久久久麻豆| 国产一级一片免费播放| 国产一区二区综合| 好吊妞国产欧美日韩免费观看网站 | 国产日本欧美一区二区三区| 狠狠色噜噜狠狠狠狠黑人| 国产综合久久精品| freexxxxxxx| 日本一二三不卡| 精品国产乱码一区二区三区在线| 久久精品爱爱视频| 国产精品一区二区av日韩在线| 亚洲精品国产一区| 视频二区狠狠色视频| 97久久国产精品| 日本高清一二区| 久久99精品国产麻豆婷婷洗澡| 免费久久99精品国产婷婷六月| 国产原创一区二区 | 中文乱幕日产无线码1区| 少妇久久免费视频| 在线观看国产91| 精品一区二区三区视频?| 午夜a电影| 91精品久久久久久| 国产精品网站一区| 午夜av网址| 精品国产免费一区二区三区| 亚洲精品www久久久| 国产高清在线观看一区| 少妇高潮大叫喷水| 99久久精品免费看国产免费粉嫩| 欧美一区二区综合| 国产在线观看免费麻豆| 99精品区| 销魂美女一区二区| 日韩一区免费| 91精品啪在线观看国产线免费| 亚洲乱亚洲乱妇50p| 一级女性全黄久久生活片免费 | 精品国精品国产自在久不卡| 国产欧美精品一区二区三区小说| 国产精欧美一区二区三区久久| 一区二区在线国产| 女人被爽到高潮呻吟免费看| 狠狠色丁香久久综合频道日韩| 国产乱码一区二区| 日本一区二区欧美| 99久久国产免费,99久久国产免费大片| 91性高湖久久久久久久久_久久99| 午夜av免费观看| 狠狠色狠狠色88综合日日91| 亚洲欧美日韩国产综合精品二区| 欧美一级片一区| 国产激情视频一区二区| 国产午夜亚洲精品午夜鲁丝片| 久久精品男人的天堂| 又色又爽又大免费区欧美| 日韩精品免费一区| 国产香蕉97碰碰久久人人| 精品一区二区三区视频?| 亚洲精品97久久久babes| 热99re久久免费视精品频软件| 日韩电影在线一区二区三区| 日韩欧美高清一区二区| 国产精品高潮呻吟久| 亚洲国产一区二区精品| 亚洲福利视频一区二区| 国产一区二区精品在线| 欧美高清视频一区二区三区| 自偷自拍亚洲| 午夜性电影| 精品国产鲁一鲁一区二区三区| 97国产精品久久久| 日本一二三区视频在线| 香港三日本三级三级三级| 中文字幕日韩一区二区| 片毛片免费看| 国内精品在线免费| 91波多野结衣| 亚洲精品456| 欧美日韩一级在线观看| 一区二区三区在线影院| 性欧美一区二区三区| 中文字幕国内精品| 国产区二区| 午夜免费av电影| 久久国产视屏| 国产精品99999999| 国产69精品久久久久久野外| 国产一区二区三区小说| 午夜伦全在线观看| 亚洲精品乱码久久久久久按摩| 农村妇女精品一二区| 91精品国产综合久久婷婷香| 久久精品视频一区二区| 欧美三区二区一区| 欧美日韩精品在线播放| 国产精品99一区二区三区| 欧美激情在线免费| 国产精品对白刺激久久久| 免费午夜在线视频| 午夜精品一区二区三区三上悠亚 | 私人影院av| 欧美精品日韩| 自拍偷在线精品自拍偷写真图片| 玖玖精品国产| 亚洲乱视频| 亚洲欧洲日韩av| 欧美日韩久久精品| 首页亚洲欧美制服丝腿| 午夜爱爱电影| 色乱码一区二区三在线看| 91视频国产九色| 国产精品18久久久久久白浆动漫| 日本精品一区视频| 日本一区二区免费电影| 69久久夜色精品国产69乱青草| 欧美精品第一区| 国产在线一区不卡| 国产精品视频一区二区在线观看 | 91免费视频国产| 狠狠色丁香久久综合频道| 国产精品亚州| 国产69精品久久久久孕妇不能看| 91超碰caoporm国产香蕉| 午夜伦理片在线观看| 亚洲国产精品第一区二区| 国产精品久久久久久久久久不蜜臀| 国产一区第一页| 久久国产激情视频| 国产一区二区手机在线观看| 日韩精品一区二区三区中文字幕| 波多野结衣女教师30分钟| 日韩国产精品久久| 性色av香蕉一区二区| 欧美精品免费看| 国产日产精品一区二区| 在线精品视频一区| 久久网站精品| 国产日韩一区二区三区| 欧美亚洲精品一区二区三区| 国产999久久久| 97精品超碰一区二区三区| 欧美大成色www永久网站婷| 国产精品久久久久久久久久嫩草| 日本精品三区| 国产午夜伦理片| 性欧美激情日韩精品七区| 日本高清h色视频在线观看| 国产69精品久久久| 玖玖玖国产精品| 欧美精品在线视频观看| 国产一区亚洲一区| 欧美日韩激情在线| 国产亚洲精品久久久456| 国产女性无套免费看网站| 亚洲va欧美va国产综合先锋| 欧美网站一区二区三区| 欧美在线一级va免费观看| 久草精品一区| 国产一区日韩精品| 亚洲影院久久| 亚洲乱码一区二区| 91精品国产91热久久久做人人| 91精品黄色| 欧美日韩卡一卡二| 日本精品99| 国产精品亚洲欧美日韩一区在线| 一区二区在线精品| 99久久国产综合精品麻豆| 国产真实一区二区三区| 黄色av中文字幕| 国产精品高潮呻吟三区四区 | 国产女人好紧好爽| 久久婷婷国产综合一区二区| 国产精品高潮在线| 亚洲欧洲日韩av| 99精品黄色| 欧美69精品久久久久久不卡| 国产伦精品一区二区三区无广告| 91国内精品白嫩初高生| 精品国产一二区| 欧洲在线一区| 国产一区二区高潮| 亚洲精品一区二区三区香蕉| 午夜毛片在线| 性欧美一区二区三区| 青苹果av| 99久久精品国产国产毛片小说| 欧美一级片一区|