[發明專利]搜索方法、裝置、電子設備和可讀存儲介質在審
| 申請號: | 202210480051.3 | 申請日: | 2022-05-05 |
| 公開(公告)號: | CN114840754A | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 張正楠 | 申請(專利權)人: | 維沃移動通信有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9538 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 喬珊珊 |
| 地址: | 523863 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種搜索方法,其特征在于,所述方法包括:
根據目標信息,獲取與所述目標信息匹配的N1條第一搜索結果,N1為正整數;
根據所述N1條第一搜索結果的內容,確定與所述目標信息對應的N2個片段,N2為正整數,N1≧N2;
按照N3種排列方式對所述N2個片段進行排列組合,獲得N3個對應文件,N3為正整數;
確定至少一個文件作為第二搜索結果,并輸出所述第二搜索結果。
2.根據權利要求1所述的方法,其特征在于,所述根據所述N1條第一搜索結果的內容,確定與所述目標信息對應的N2個片段,包括:
在一條所述第一搜索結果對應的內容中,提取與所述目標信息匹配的目標內容,所述目標內容用于生成一個片段,得到N1個片段;
在至少兩個片段之間的相似度大于第一閾值的情況下,根據所述至少兩個片段的特征信息,保留所述至少兩個片段中的一個片段,得到所述N2個片段;
其中,所述至少兩個片段的特征信息包括:語義匹配信息、來源頁面地址信息、作者信息。
3.根據權利要求1所述的方法,其特征在于,所述按照N3種排列方式對所述N2個片段進行排列組合,包括:
分別將所述N2個片段排列在第一個位置,得到N2個第一個位置;
基于所述N2個第一個位置,分別獲取所述N2個片段中除所述第一個位置上的片段以外的其它片段排列在第二個位置的匹配值,得到N2*(N2-1)個匹配值;
在N2*(N2-1)個匹配值中,保留最大的前N3個匹配值對應的排列方式;
在N3種排列方式的任一種排列方式中,獲取所述N2個片段中除前M個位置上的片段以外的其它片段排列在第M+1個位置的匹配值,得到N3*(N2-M)個匹配值;
在N3*(N2-M)個匹配值中,保留最大的前N3個匹配值對應的排列方式;
其中,M為正整數,在重復的步驟中,M依次等于2、3……(N2-1)。
4.根據權利要求1所述的方法,其特征在于,所述確定至少一個文件作為第二搜索結果之前,所述方法還包括:
在任一文件中,在第一片段排列在第一位置的情況下,若第二片段排列在第二位置的概率滿足預設條件,則刪除所述第二片段以及排列在之后的片段,所述第二位置為所述第一位置的下一個位置,所述N2個片段包括所述第一片段和所述第二片段;
其中,所述預設條件包括以下至少一項:
在所述第一片段排列在所述第一位置的情況下,所述第二片段排列在所述第二位置的概率小于第二閾值;
在所述第一片段排列在所述第一位置的情況下,所述第二片段排列在所述第二位置的概率波動幅度大于第三閾值。
5.根據權利要求1所述的方法,其特征在于,所述確定至少一個文件作為第二搜索結果,包括:
根據N3個文件的特征信息,確定至少一個文件作為第二搜索結果;
其中,所述文件的特征信息包括:文件中相鄰兩個片段之間的相關信息、文件中各個片段的特征信息、文件中各個片段與所述目標信息之間的匹配信息。
6.一種搜索裝置,其特征在于,所述裝置包括:
獲取模塊,用于根據目標信息,獲取與所述目標信息匹配的N1條第一搜索結果,N1為正整數;
第一確定模塊,用于根據所述N1條第一搜索結果的內容,確定與所述目標信息對應的N2個片段,N2為正整數,N1≧N2;
排列模塊,用于按照N3種排列方式對所述N2個片段進行排列組合,獲得N3個對應文件,N3為正整數;
第二確定模塊,用于確定至少一個文件作為第二搜索結果,并輸出所述第二搜索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于維沃移動通信有限公司,未經維沃移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210480051.3/1.html,轉載請聲明來源鉆瓜專利網。





