[發(fā)明專利]構(gòu)建索引的方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010562441.6 | 申請日: | 2020-06-18 |
| 公開(公告)號: | CN113821704A | 公開(公告)日: | 2021-12-21 |
| 發(fā)明(設(shè)計)人: | 顧明 | 申請(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/953;G06F16/31;G06F16/33 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 孫靜;劉芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 構(gòu)建 索引 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種構(gòu)建索引的方法,其特征在于,包括:
接收來自第一終端設(shè)備的文檔;
根據(jù)所述文檔,生成第一索引和第二索引,所述第一索引表征向量和所述文檔的映射關(guān)系,所述第二索引表征文本與所述文檔的映射關(guān)系;
將所述第一索引存儲至第一類型的文件集合中,所述第一索引處于可用狀態(tài),處于可用狀態(tài)的第一索引用于通過向量搜索與搜索內(nèi)容關(guān)聯(lián)的所述文檔;
將所述第二索引存儲至第二類型的文件集合中,且建立所述第一索引、所述第二索引和所述文檔的映射關(guān)系。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一類型的文件集合中包括至少一個第一文件,所述第一文件用于存儲第一索引,所述將所述第一索引存儲至第一類型的文件集合中,包括:
將所述第一索引寫入一個第一文件中。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述第二類型的文件集合中包括至少一個第二文件,所述第二文件用于存儲第二索引,所述將所述第二索引存儲至第二類型的文件集合中,包括:
將所述第二索引寫入一個第二文件中。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述建立所述第一索引、所述第二索引和所述文檔的映射關(guān)系,包括:
建立第一文件中的所述第一索引、第二文件中的所述第二索引和所述文檔的映射關(guān)系。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將所述第一索引寫入一個第一文件中,包括:
若所述第一類型的文件集合中的第i個第一文件中已寫入的索引的數(shù)量小于第一閾值,則將所述第一索引寫入所述第i個第一文件中,所述i為大于或等于1的整數(shù);
若所述第i個第一文件中已寫入的索引的數(shù)量等于所述第一閾值,則新建第i+1個第一文件,且將所述第一索引寫入所述第i+1個第一文件中。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述第二索引寫入一個第二文件中,包括:
若所述第二類型的文件集合中的第j個第二文件中已寫入的索引的數(shù)量小于第二閾值,則將所述第二索引寫入所述第j個第二文件中,所述j為大于或等于1的整數(shù);
若所述第j個第二文件中已寫入的索引的數(shù)量等于所述第二閾值,則新建第j+1個第二文件,且將所述第二索引寫入所述第j+1個第二文件中。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
若所述第j個第二文件中已寫入的索引的數(shù)量等于所述第二閾值,則將所述第j個第二文件從寫入模式轉(zhuǎn)換為只讀模式,轉(zhuǎn)換為所述只讀模式的所述第j個第二文件中的第二索引處于可用狀態(tài),處于可用狀態(tài)的第二索引用于通過文本搜索與搜索內(nèi)容關(guān)聯(lián)的所述文檔。
8.根據(jù)權(quán)利要求6或7所述的方法,其特征在于,所述方法還包括:
接收來自所述第一終端設(shè)備的第二文件的轉(zhuǎn)換時長,所述轉(zhuǎn)換時長為第二文件從寫入模式轉(zhuǎn)換為只讀模式的時長;
根據(jù)所述轉(zhuǎn)換時長,確定所述第二閾值。
9.根據(jù)權(quán)利要求6-8中任一項所述的方法,其特征在于,所述方法還包括:
若轉(zhuǎn)換為只讀模式的第二文件的占用內(nèi)存達(dá)到預(yù)設(shè)內(nèi)存,則將所述轉(zhuǎn)換為只讀模式的第二文件合并;或者,
若當(dāng)前可用負(fù)載大于預(yù)設(shè)負(fù)載,則將所述轉(zhuǎn)換為只讀模式的第二文件合并。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述將所述已寫入的索引的數(shù)量等于所述第二閾值的第二文件合并之后,還包括:
建立合并后的第二文件中的所述第二索引、第一文件中的所述第一索引和所述文檔的映射關(guān)系。
11.根據(jù)權(quán)利要求1-10中任一項所述的方法,其特征在于,所述第二類型的文件集合中包括所述文檔;所述方法還包括:
接收所述第一終端設(shè)備發(fā)送的刪除指令,所述刪除指令指示刪除所述文檔;
將所述文檔標(biāo)記為刪除狀態(tài)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010562441.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





