日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種面向用戶查詢意圖的漢語句子相似度分層計算方法及裝置有效

專利信息
申請號: 201410341855.0 申請日: 2014-07-17
公開(公告)號: CN104133812B 公開(公告)日: 2017-03-08
發明(設計)人: 張仰森;李景玉 申請(專利權)人: 北京信息科技大學;張仰森
主分類號: G06F17/27 分類號: G06F17/27;G06F17/30
代理公司: 北京科億知識產權代理事務所(普通合伙)11350 代理人: 湯東鳳
地址: 100101 北*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 面向 用戶 查詢 意圖 漢語 句子 相似 分層 計算方法 裝置
【權利要求書】:

1.一種面向用戶查詢意圖的漢語句子相似度分層計算方法,其特征在于包括以下步驟:

S1、采用去除句末標點的編輯距離句子相似度算法對數據集進行相似度計算,確定一部分滿足閾值的句子為相似句子;

S2、采用基于關鍵詞特征和語義特征的句子相似度算法,對數據集中的非相似句子進行相似度計算,從而再次確定一部分滿足閾值的句子為相似句子;

S3、采用面向用戶意圖的句子相似度算法,對數據集中的非相似句子進行句子相似度計算,確定一部分滿足閾值的句子為相似句子,至此得到數據集中的所有相似句子。

2.如權利要求1所述的面向用戶查詢意圖的漢語句子相似度分層計算方法,其特征在于,在步驟S1中,所述去除句末標點的編輯距離句子相似度算法具體包括:計算兩個句子的相似度時,忽略其句末的標點符號,將去除句末標點的句子按照基于字符的編輯距離句子相似度算法計算其句子的編輯距離,再根據設定的閾值判定相似句子;

在步驟S2中,所述基于關鍵詞特征和語義特征的句子相似度算法具體包括:采用關鍵詞特征,將句子轉換成關鍵詞列表形式,再兼顧同義詞特征、否定詞特征,總結分析經過對比消解后的剩余關鍵詞詞數與已標注的相似句子對之間呈現的規律,最后判定符合規律的句子是否句子相似;

在步驟S3中,所述面向用戶意圖的句子相似度算法具體包括:

根據標點符號切分用戶提問,利用用戶提問中的標點符號,將用戶提問轉換成用戶提問子句集;

對用戶提問子句集中每一個元素計算其與問題集中某問題的剩余列表,計算子句集中每一個元素與計算機存儲的問題集中問題的句子相似度;

使用子句集中元素與問題集中某個問題的最大相似度代替用戶提問與這個問題的句子相似度。

3.如權利要求2所述的面向用戶查詢意圖的漢語句子相似度分層計算方法,其特征在于,在步驟S2中,所述剩余關鍵詞是指一個句子經過分詞、去除停用詞、修改錯別字、大寫字母轉換成小寫字母、中文數字轉換成阿拉伯數字、關鍵詞對比消減、同義詞對比消減和否定詞對比消減后余留的關鍵詞集合。

4.如權利要求3所述的面向用戶查詢意圖的漢語句子相似度分層計算方法,其特征在于,在步驟S2中,所述剩余關鍵詞詞數與已標注的相似句子對之間的關系具體包括以下規則:

規則1:經過剩余關鍵詞列表計算后,若用戶提問句子與問題集中某一句子的剩余關鍵詞詞數之和小于等于1,且剩余關鍵詞中不包含否定詞時,則用戶提問句子與問題集中的某一個句子是相似的;

規則2:經過剩余關鍵詞列表計算后,若用戶提問句子的剩余關鍵詞詞數等于0,問題集中某一句子的剩余關鍵詞詞數等于2,且剩余關鍵詞中不包含否定詞,則用戶提問句子與問題集中某一句子是相似的;

規則3:經過剩余關鍵詞列表計算后,若用戶提問句子的剩余關鍵詞詞數等于2,問題集中某一句子的剩余關鍵詞詞數等于0,且剩余關鍵詞中不包含否定詞,則用戶提問句子與問題集中某一句子是相似的;

規則4:經過剩余關鍵詞列表計算后,若用戶提問句子和問題集中某一句子的剩余關鍵詞中含有的否定詞為奇數時,則用戶提問句子與問題集中某一句子是不相似的。

5.如權利要求2所述的面向用戶查詢意圖的漢語句子相似度分層計算方法,其特征在于,在步驟S3中,所述用戶提問子句集的構建方法具體包括:初始子句集為空,首先根據標點符號將用戶提問拆分成若干個子句,將這些子句并入子句集中;再將任意長度的連續的若干子句構成一個子句,并入子句集中;最后將用戶提問的整句并入子句集中,至此構建成一個完整的用戶提問子句集;

在步驟S3中,所述子句和問題集中問題的相似性的判斷具體為:

規則5:將用戶提問子句集中某一子句與問題集中某一問題進行剩余關鍵詞列表計算,若子句的剩余關鍵詞詞數等于0,問題的剩余關鍵詞詞數小于等于1,則用戶提問與問題集中該問題是相似的。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學;張仰森,未經北京信息科技大學;張仰森許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410341855.0/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日本精品一二三区| 亚洲乱亚洲乱妇50p| 国产一级大片| 亚洲乱亚洲乱妇50p| 色吊丝av中文字幕| 精品国产一区二区在线| 精品国产一区二区三区四区四| 国产88久久久国产精品免费二区| 色一情一乱一乱一区免费网站| 国产精品视频免费一区二区| 素人av在线| 欧美日韩激情一区| 日韩免费一级视频| 国产在线精品一区二区在线播放| 国产日韩一区在线| 91日韩一区二区三区| 国产一区二区资源| 国产午夜亚洲精品| 91精品久久久久久久久久| 国产日韩欧美亚洲| 国产极品美女高潮无套久久久| 激情久久影院| 久久99国产视频| 国产在线观看免费麻豆| 美女直播一区二区三区| 日韩三区三区一区区欧69国产| 中文丰满岳乱妇在线观看| 2023国产精品自产拍在线观看| 精品国产乱码久久久久久虫虫| 欧美精品中文字幕亚洲专区| 国产清纯白嫩初高生在线观看性色| 国产精品一二三区免费| 亚洲精品色婷婷| 国产在线一卡二卡| 国产免费第一区| 精品国产乱码一区二区三区在线| 高清国产一区二区 | 欧美日韩一区二区三区69堂| 欧美日本一二三区| 国产一级自拍| 日韩欧美一区精品| 欧美老肥婆性猛交视频| 国产精品一区二区6| 国产一区在线免费观看| 国产资源一区二区| 国产91在线拍偷自揄拍| 偷拍区另类欧美激情日韩91| 日韩精品午夜视频| 亚洲欧美一区二区三区1000| 欧美一区二区三区中文字幕| 日韩中文字幕一区二区在线视频 | 国产日韩一区二区三区| 亚洲国产欧美一区| 国产午夜一区二区三区| 久久夜色精品国产亚洲| 国产69精品久久| 国产精品区一区二区三| 中文文精品字幕一区二区| 久久影视一区二区| 日本一区二区电影在线观看| 久久中文一区| 亚洲第一天堂无码专区| 国产精品久久久久久久龚玥菲| 国产91热爆ts人妖系列| 91久久免费| 欧美精品免费一区二区三区 | 国产午夜精品一区理论片飘花 | 精品久久久影院| 国产真实乱偷精品视频免| 日韩av在线电影网| 精品国产精品亚洲一本大道| 午夜看片网址| 国产一区二区手机在线观看| 一区二区三区四区中文字幕 | 亚洲一卡二卡在线| 国产乱人激情h在线观看| 国产日韩精品久久| 国产欧美一区二区三区免费看| 精品婷婷伊人一区三区三| 色偷偷一区二区三区| 欧美精品在线观看视频| 日韩一区免费|