[發(fā)明專利]文本信息庫建立方法和裝置、以及搜索方法、裝置和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201611257156.3 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106649849A | 公開(公告)日: | 2017-05-10 |
| 發(fā)明(設(shè)計)人: | 張昊;王洪遠;朱頻頻 | 申請(專利權(quán))人: | 上海智臻智能網(wǎng)絡(luò)科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京布瑞知識產(chǎn)權(quán)代理有限公司11505 | 代理人: | 孟潭 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 信息庫 建立 方法 裝置 以及 搜索 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體涉及一種文本信息庫建立方法和裝置、文本信息庫、以及搜索方法、裝置以及系統(tǒng)。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的不斷發(fā)展,很多文本數(shù)據(jù)都已經(jīng)上網(wǎng)公開,可供民眾自由查詢。例如,隨著裁判文書的上網(wǎng)公開,民眾也可以很方便的在線查閱歷史裁判文書。對于法院內(nèi)部來說,法官在判案的過程中,和當前案件相似的已有裁判案例往往有著極高的參考價值,可以基本避免同案不同判的情況的發(fā)生。類似案件的裁判查詢對于律師、法官、檢察官、法學(xué)教師、學(xué)者、學(xué)生以及從事法律相關(guān)的工作人員等都有重要的參考學(xué)習(xí)價值。
現(xiàn)有的裁判文書網(wǎng)在線提供了一些搜索方式,但這些搜索方式僅支持案由和關(guān)鍵詞等有限的搜索條件,搜索條件有限且簡單,難于進行精準搜索。同時,由于仍需要人工基于個人經(jīng)驗去尋找判斷搜索結(jié)果,搜索效率低下,僅能滿足一般查詢使用,難于滿足律師、法官、檢察官、法學(xué)教師、學(xué)者、學(xué)生以及從事法律相關(guān)的工作人員等相對專業(yè)的人士的使用要求。由此可見,急需一種可實現(xiàn)智能、高效且精準的搜索的文本信息庫及其建立方式,以及基于這種文本信息庫的搜索方式。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供了一種文本信息庫建立方法和裝置、文本信息庫、搜索方法、裝置和系統(tǒng),解決了現(xiàn)有技術(shù)中的文本信息難以實現(xiàn)精準搜索以及搜索效率低的問題。
本發(fā)明一實施例提供的一種文本信息庫建立方法包括:
提取多個文本數(shù)據(jù)中的每個所述文本數(shù)據(jù)所包括的特征因素以及對應(yīng)的特征因素取值;以及
存儲每個所述文本數(shù)據(jù)所包括的特征因素和特征因素取值與該文本數(shù)據(jù)之間的對應(yīng)關(guān)系。
本發(fā)明一實施例提供的一種文本信息庫建立裝置包括:
特征提取模塊,配置為提取多個文本數(shù)據(jù)中的每個所述文本數(shù)據(jù)所包括的特征因素以及對應(yīng)的特征因素取值;以及
存儲模塊,配置為存儲每個所述文本數(shù)據(jù)所包括的特征因素和特征因素取值與該文本數(shù)據(jù)之間的對應(yīng)關(guān)系。
本發(fā)明一實施例提供的一種文本信息庫包括:
特征因素信息子庫,配置為存儲多個文本數(shù)據(jù)中的每個文本數(shù)據(jù)所包括的特征因素和特征因素取值與該文本數(shù)據(jù)之間的對應(yīng)關(guān)系。
本發(fā)明一實施例提供的一種基于如前所述的文本信息庫的搜索方法包括:
識別用戶輸入的搜索信息中的特征信息,其中所述特征信息包括N1個特征因素和N2個特征因素取值,其中N1+N2=N;以及
基于所述特征因素信息子庫,獲取與所識別出的特征信息相對應(yīng)的文本數(shù)據(jù);
其中,N、N1和N2均為大于等于0的整數(shù)。
本發(fā)明一實施例提供的一種基于如前所述的文本信息庫的搜索裝置包括:
特征識別模塊,配置為識別用戶輸入的搜索信息中的特征信息,其中所述特征信息包括N1個特征因素和N2個特征因素取值,其中N1+N2=N;以及
文本獲取模塊,配置為基于所述特征因素信息子庫,獲取與所識別出的特征信息相對應(yīng)的文本數(shù)據(jù);
其中,N、N1和N2均為大于等于0的整數(shù)。
本發(fā)明一實施例提供的一種搜索系統(tǒng)包括:
如前所述的文本信息庫以及如前所述的搜索裝置;
其中,所述搜索裝置接受用戶輸入的搜索信息,基于所述文本信息庫獲取與所述用戶輸入的搜索信息相對應(yīng)的文本數(shù)據(jù)。
本發(fā)明實施例提供的一種文本信息庫建立方法和裝置、文本信息庫、搜索方法、裝置和系統(tǒng),通過提取文本數(shù)據(jù)中的特征因素以及特征因素取值,建立起了特征因素和特征因素取值與文本數(shù)據(jù)之間的對應(yīng)關(guān)系。這樣當用戶輸入搜索信息后,通過識別搜索信息中的特征因素和特征因素取值即可直接確定所對應(yīng)的文本數(shù)據(jù),不需要對所有文本數(shù)據(jù)的完整文本內(nèi)容進行搜索,可智能高效的自動完成整個搜索過程,且搜索結(jié)果精準,提高了用戶體驗。
附圖說明
圖1所示為本發(fā)明一實施例提供的一種文本信息庫建立方法的流程示意圖。
圖2所示為本發(fā)明一實施例所提供的文本信息庫建立方法中設(shè)置特征因素的權(quán)重的流程示意圖。
圖3所示為本發(fā)明一實施例所提供的文本信息庫建立方法中提取每個領(lǐng)域分類的文本數(shù)據(jù)中的領(lǐng)域詞的流程示意圖。
圖4所示為本發(fā)明一實施例所提供的文本信息庫的結(jié)構(gòu)示意圖。
圖5所示為基于本發(fā)明一實施例所提供的文本信息庫的搜索方法的流程示意圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海智臻智能網(wǎng)絡(luò)科技股份有限公司,未經(jīng)上海智臻智能網(wǎng)絡(luò)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611257156.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:茶幾(6030)
- 下一篇:一種數(shù)據(jù)自動刪除方法及裝置





