[發(fā)明專利]基于代碼文件的搜索系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010138219.3 | 申請(qǐng)日: | 2020-03-03 |
| 公開(kāi)(公告)號(hào): | CN113342919A | 公開(kāi)(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 張娜;黃威;蔡學(xué)文 | 申請(qǐng)(專利權(quán))人: | 北京奇虎科技有限公司 |
| 主分類號(hào): | G06F16/31 | 分類號(hào): | G06F16/31;G06F16/33;G06F8/71 |
| 代理公司: | 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國(guó) |
| 地址: | 100088 北京市西城區(qū)新*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 代碼 文件 搜索 系統(tǒng) 方法 | ||
本發(fā)明公開(kāi)了一種基于代碼文件的搜索系統(tǒng)及方法,其中,系統(tǒng)包括:包括:代碼數(shù)據(jù)庫(kù)、代碼索引裝置、后臺(tái)更新裝置、以及搜索服務(wù)端;其中,后臺(tái)更新裝置與代碼數(shù)據(jù)庫(kù)以及代碼索引裝置分別相連,用于更新代碼數(shù)據(jù)庫(kù)中存儲(chǔ)的代碼文件,并根據(jù)代碼文件的更新結(jié)果通知代碼索引裝置適應(yīng)性更新代碼索引文件;搜索服務(wù)端與代碼數(shù)據(jù)庫(kù)以及代碼索引裝置分別相連,用于根據(jù)接收到的代碼搜索請(qǐng)求,向代碼索引裝置發(fā)送代碼索引請(qǐng)求,并根據(jù)接收到的代碼索引結(jié)果從代碼數(shù)據(jù)庫(kù)中查詢與代碼搜索請(qǐng)求相對(duì)應(yīng)的代碼搜索結(jié)果。該方式能夠可靠保留重要的代碼文件,并基于代碼索引文件提供代碼文件的入庫(kù)存儲(chǔ)以及快速搜索功能。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種基于代碼文件的搜索系統(tǒng)及方法。
背景技術(shù)
目前,隨著互聯(lián)網(wǎng)的日益普及,很多業(yè)務(wù)項(xiàng)目都需要通過(guò)線上編程方式實(shí)現(xiàn),相應(yīng)的,各個(gè)業(yè)務(wù)項(xiàng)目都會(huì)產(chǎn)生大量的代碼文件。其中,代碼文件的類型多樣,且數(shù)據(jù)量龐大,如何針對(duì)海量的代碼文件進(jìn)行高效管理成為困擾項(xiàng)目開(kāi)發(fā)人員的首要問(wèn)題。
在此業(yè)務(wù)背景下,版本控制系統(tǒng)應(yīng)運(yùn)而生。通過(guò)版本控制系統(tǒng)能夠針對(duì)業(yè)務(wù)項(xiàng)目中包含的源代碼進(jìn)行協(xié)同管理。例如,能夠記錄一個(gè)項(xiàng)目從開(kāi)始到結(jié)束的整個(gè)過(guò)程,還能夠追蹤項(xiàng)目中所有內(nèi)容的變化情況,并且,還能夠?qū)崿F(xiàn)版本管理以及權(quán)限控制。通過(guò)版本控制系統(tǒng),能夠針對(duì)代碼執(zhí)行回退處理并實(shí)現(xiàn)沖突解決。
但是,發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn),現(xiàn)有技術(shù)中的版本控制系統(tǒng)至少存在如下缺陷:版本控制系統(tǒng)本身并未提供代碼文件的入庫(kù)存儲(chǔ)功能,因而無(wú)法直接利用版本控制系統(tǒng)實(shí)現(xiàn)代碼文件的入庫(kù)存儲(chǔ),從而容易導(dǎo)致代碼文件的缺失,無(wú)法可靠保留重要的代碼文件。在此基礎(chǔ)上,無(wú)法針對(duì)代碼文件進(jìn)行快速搜索。由此可見(jiàn),現(xiàn)有技術(shù)無(wú)法提供代碼文件的入庫(kù)存儲(chǔ)以及快速搜索功能。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的基于代碼文件的搜索系統(tǒng)及方法。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于代碼文件的搜索系統(tǒng),包括:代碼數(shù)據(jù)庫(kù)、代碼索引裝置、后臺(tái)更新裝置、以及搜索服務(wù)端;其中,
所述后臺(tái)更新裝置與所述代碼數(shù)據(jù)庫(kù)以及所述代碼索引裝置分別相連,用于更新所述代碼數(shù)據(jù)庫(kù)中存儲(chǔ)的代碼文件,并根據(jù)代碼文件的更新結(jié)果通知所述代碼索引裝置適應(yīng)性更新代碼索引文件;
所述搜索服務(wù)端與所述代碼數(shù)據(jù)庫(kù)以及所述代碼索引裝置分別相連,用于根據(jù)接收到的代碼搜索請(qǐng)求,向所述代碼索引裝置發(fā)送代碼索引請(qǐng)求,并根據(jù)接收到的代碼索引結(jié)果從所述代碼數(shù)據(jù)庫(kù)中查詢與所述代碼搜索請(qǐng)求相對(duì)應(yīng)的代碼搜索結(jié)果。
可選地,所述后臺(tái)更新裝置具體用于:
針對(duì)更新后的各個(gè)代碼文件,提取該代碼文件的關(guān)鍵字信息;
將各個(gè)代碼文件的關(guān)鍵字信息以及各個(gè)代碼文件在所述代碼數(shù)據(jù)庫(kù)中的存儲(chǔ)位置發(fā)送給所述代碼索引裝置,以供所述代碼索引裝置適應(yīng)性更新代碼索引文件。
可選地,所述代碼文件的關(guān)鍵字信息通過(guò)文本相似度算法確定;其中,所述文本相似度算法包括:BM25算法和/或TFIDF算法;并且,所述代碼索引文件為分布式倒排索引文件。
可選地,所述代碼文件的關(guān)鍵字信息包括:代碼漏洞信息、和/或代碼特征詞信息。
可選地,所述代碼索引裝置具體用于:針對(duì)預(yù)設(shè)的索引服務(wù)端執(zhí)行實(shí)時(shí)配置處理以及分布式配置處理,通過(guò)配置后的索引服務(wù)端建立所述代碼索引文件。
可選地,所述索引服務(wù)端具有第一端口以及第二端口;
其中,所述第一端口用于提供索引搜索功能,所述第二端口用于提供索引入庫(kù)功能。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇虎科技有限公司,未經(jīng)北京奇虎科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010138219.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 遙控器代碼格式結(jié)構(gòu)及其收發(fā)信方法及裝置
- 在虛擬機(jī)中驗(yàn)證代碼模塊的方法及裝置
- 一種用于代碼的管理方法及裝置
- 虛擬代碼提供系統(tǒng)、生成裝置、驗(yàn)證裝置、提供方法
- 一種自動(dòng)化代碼質(zhì)量檢查方法及系統(tǒng)
- 代碼掃描方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于更新代碼的方法和裝置
- 前端代碼打包方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種代碼審查服務(wù)同步方法、裝置及計(jì)算機(jī)設(shè)備
- 一種高效智能源代碼安全管理平臺(tái)





