[發(fā)明專(zhuān)利]一種文檔排序方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110601081.0 | 申請(qǐng)日: | 2021-05-31 |
| 公開(kāi)(公告)號(hào): | CN113032549B | 公開(kāi)(公告)日: | 2021-09-10 |
| 發(fā)明(設(shè)計(jì))人: | 曹夢(mèng)娣;曹雷;尤旸 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京明略昭輝科技有限公司 |
| 主分類(lèi)號(hào): | G06F16/338 | 分類(lèi)號(hào): | G06F16/338;G06F16/38;G06N20/00 |
| 代理公司: | 北京超成律師事務(wù)所 11646 | 代理人: | 裴素英 |
| 地址: | 100082 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文檔 排序 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)?zhí)峁┝艘环N文檔排序方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),獲取查詢(xún)用戶(hù)的查詢(xún)文本和用戶(hù)信息;獲取與查詢(xún)文本相匹配的多個(gè)候選文檔;分別從用戶(hù)信息、查詢(xún)文本以及多個(gè)候選文檔中,確定出查詢(xún)用戶(hù)的關(guān)聯(lián)特征、查詢(xún)文本的關(guān)聯(lián)特征、每個(gè)候選文檔的關(guān)聯(lián)特征、以及查詢(xún)用戶(hù)、查詢(xún)文本以及每個(gè)候選文檔之間的交叉類(lèi)別特征,并輸入至預(yù)先訓(xùn)練好的文檔相關(guān)度模型中,確定每個(gè)候選文檔的相關(guān)度得分;按照確定出的多個(gè)相關(guān)度得分,確定多個(gè)候選文檔的排序結(jié)果,通過(guò)查詢(xún)用戶(hù)的客戶(hù)端按照排序結(jié)果顯示多個(gè)候選文檔。這樣,本申請(qǐng)利用用戶(hù)特征、查詢(xún)特征、文檔特征以及三者的交叉特征進(jìn)行文檔排序,可以更符合企業(yè)用戶(hù)的搜索需求。
技術(shù)領(lǐng)域
本申請(qǐng)涉及搜索引擎技術(shù)領(lǐng)域,尤其是涉及一種文檔排序方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
排序主要用于搜索引擎、推薦系統(tǒng)等領(lǐng)域。在互聯(lián)網(wǎng)信息爆炸的背景下,越來(lái)越多的用戶(hù)都會(huì)通過(guò)搜索獲取自己想要的信息。搜索排序是指在一次會(huì)話(huà)中,用戶(hù)在交互界面輸入需要查詢(xún)的query,系統(tǒng)給返回排好序的列表的過(guò)程。
現(xiàn)有的面向互聯(lián)網(wǎng)用戶(hù)的搜索引擎,在進(jìn)行搜索文檔排序時(shí),是基于用戶(hù)輸入的關(guān)鍵字與搜索文檔的文本相似度進(jìn)行排序。但是按照這種排序方式排序后的搜索文檔,可能將企業(yè)用戶(hù)需要查看的文檔排在末位,不能很好的滿(mǎn)足企業(yè)用戶(hù)的搜索需求。因此,在企業(yè)員工進(jìn)行文檔搜索時(shí),如何將企業(yè)員工所需要的文檔優(yōu)先進(jìn)行展示是亟待解決的技術(shù)問(wèn)題。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)的目的在于提供一種文檔排序方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),在對(duì)企業(yè)員工搜索文檔進(jìn)行排序時(shí),利用了用戶(hù)特征、查詢(xún)特征、文檔特征以及三者的交叉特征進(jìn)行排序,從而使排序結(jié)果更加貼近企業(yè)用戶(hù)的搜索意圖,進(jìn)而提高用戶(hù)的使用體驗(yàn)。
本申請(qǐng)實(shí)施例提供了一種文檔排序方法,所述文檔排序方法包括:
獲取查詢(xún)用戶(hù)的查詢(xún)文本和用戶(hù)信息;
基于所述查詢(xún)文本中的至少一個(gè)查詢(xún)關(guān)鍵字,獲取與所述查詢(xún)文本相匹配的多個(gè)候選文檔;
分別從所述用戶(hù)信息、所述查詢(xún)文本以及所述多個(gè)候選文檔中,提取出所述查詢(xún)用戶(hù)的關(guān)聯(lián)特征、所述查詢(xún)文本的關(guān)聯(lián)特征、每個(gè)候選文檔的關(guān)聯(lián)特征;
基于所述查詢(xún)用戶(hù)的關(guān)聯(lián)特征、所述查詢(xún)文本的關(guān)聯(lián)特征以及所述每個(gè)候選文檔的關(guān)聯(lián)特征,確定所述查詢(xún)用戶(hù)、所述查詢(xún)文本以及所述每個(gè)候選文檔之間的交叉類(lèi)別特征;
將所述查詢(xún)用戶(hù)的關(guān)聯(lián)特征、所述查詢(xún)文本的關(guān)聯(lián)特征、所述每個(gè)候選文檔的關(guān)聯(lián)特征以及所述交叉類(lèi)別特征輸入至預(yù)先訓(xùn)練好的文檔相關(guān)度模型中,確定每個(gè)候選文檔的相關(guān)度得分;
按照確定出的多個(gè)相關(guān)度得分,確定所述多個(gè)候選文檔的排序結(jié)果,將所述排序結(jié)果以及所述多個(gè)候選文檔發(fā)送至所述查詢(xún)用戶(hù)所使用的客戶(hù)端,以使所述客戶(hù)端按照所述排序結(jié)果顯示所述多個(gè)候選文檔。
進(jìn)一步的,所述交叉類(lèi)別特征包括所述查詢(xún)用戶(hù)與所述查詢(xún)文本的交叉特征、所述查詢(xún)用戶(hù)與所述候選文檔的交叉特征、所述查詢(xún)文本與所述候選文檔的交叉特征、所述查詢(xún)用戶(hù)與所述查詢(xún)文本與所述候選文檔三者的交叉特征中的至少一種。
進(jìn)一步的,通過(guò)以下步驟構(gòu)建文檔相關(guān)度模型:
獲取歷史埋點(diǎn)日志;
從所述歷史埋點(diǎn)日志中提取出每個(gè)樣本用戶(hù)以及每個(gè)樣本用戶(hù)的第一行為信息、每個(gè)歷史查詢(xún)文本以及每個(gè)歷史查詢(xún)文本的第二行為信息、每個(gè)樣本文檔以及每個(gè)樣本文檔的第三行為信息;
基于從所述歷史埋點(diǎn)日志中提取出的每個(gè)樣本用戶(hù)、每個(gè)歷史查詢(xún)文本以及每個(gè)樣本文檔,獲取每個(gè)樣本用戶(hù)的基本屬性信息、每個(gè)歷史查詢(xún)文本的基本屬性信息、以及每個(gè)樣本文檔的基本屬性信息;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京明略昭輝科技有限公司,未經(jīng)北京明略昭輝科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110601081.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類(lèi)型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫(huà)生成方法、裝置及設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





