[發(fā)明專利]電子商務(wù)搜索引擎同義詞的處理方法在審
| 申請?zhí)枺?/td> | 201410132973.0 | 申請日: | 2014-04-03 |
| 公開(公告)號: | CN103886093A | 公開(公告)日: | 2014-06-25 |
| 發(fā)明(設(shè)計)人: | 唐亮 | 申請(專利權(quán))人: | 江蘇物聯(lián)網(wǎng)研究發(fā)展中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/00 |
| 代理公司: | 無錫市大為專利商標(biāo)事務(wù)所(普通合伙) 32104 | 代理人: | 曹祖良;韓鳳 |
| 地址: | 214135 江蘇省無錫市新*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 電子商務(wù) 搜索引擎 同義詞 處理 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及電子商務(wù)搜索引擎的優(yōu)化,具體是一種電子商務(wù)搜索引擎同義詞的處理方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,電子商務(wù)已經(jīng)極大的改變了人們的生活習(xí)慣。國內(nèi)知名電子商務(wù)網(wǎng)站的銷售額也呈現(xiàn)快速的增長。所以電子商務(wù)網(wǎng)站相關(guān)的技術(shù)顯得越來越重要。電子商務(wù)的搜索引擎可以幫助用戶快速找到所需要的相關(guān)商品。
傳統(tǒng)的電子商務(wù)搜索引擎都是采用布爾查詢,其搜索流程都是按預(yù)設(shè)好的算法模型展開。但是在實際使用中,商品名稱存在大量的同義詞,簡單采用布爾查詢并不能處理這些商品名稱同義詞的問題。
商品名稱中存在數(shù)量單位,比如搜索牛肉七百克,一般僅僅返回的是牛肉相關(guān)的商品,并不處理七百克這個數(shù)量單位,普通的搜索引擎并不能處理這些帶單位的商品。
發(fā)明內(nèi)容
本發(fā)明的目的是克服商品名稱中的同義問題以及單位量化問題,提供一種快速的解決方案,即一種電子商務(wù)搜索引擎同義詞的處理方法,其使用方便、易于操作、效率高。
按照本發(fā)明提供的技術(shù)方案,所述的電子商務(wù)搜索引擎同義詞的處理方法為:(1)首先對于商品名稱建立同義詞詞表;(2)索引端建立商品名稱的索引,索引的關(guān)鍵字包括商品名稱的同義詞以及單位歸一量化結(jié)果;(3)在查詢端對用戶輸入的查詢詞進(jìn)行字符處理和單位的歸一量化;(4)最后將查詢端處理好的輸入交給索引端進(jìn)行檢索,并且返回結(jié)果。
所述同義詞詞表的建立可以通過網(wǎng)絡(luò)抓取商品名稱的相關(guān)搜索加上人工整理。
所述同義詞詞表采用單獨文件存儲,在有新的商品添加進(jìn)來的時候,將商品相關(guān)的同義詞同步加入同義詞詞表。
在建立索引的時候,首先對商品名稱進(jìn)行分詞處理,然后查詢同義詞詞表,將查詢到的相關(guān)同義詞添加入商品名稱中,與最初的商品名稱一起建立索引;同時對商品名稱中的單位進(jìn)行歸一量化,對于歸一量化的結(jié)果同時也建立索引。
本發(fā)明的優(yōu)點是:對電子商務(wù)搜索引擎進(jìn)行優(yōu)化,改善用戶的體驗,提高商品的召回率,提高查詢檢索的準(zhǔn)確性。
附圖說明
圖1是本發(fā)明的初始化模塊功能示意圖。
圖2是本發(fā)明索引模塊功能示意圖。
圖3是本發(fā)明索引模塊處理流程圖。
圖4是查詢模塊處理流程圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明作進(jìn)一步說明。
為了解決現(xiàn)有技術(shù)中搜索引擎返回的搜索結(jié)果不一定符合用戶需要而對所有用戶都造成用戶的使用體驗感差的問題,本發(fā)明提出了一種電子商務(wù)搜索引擎的修正方法。
1.本發(fā)明首先解決商品名稱的多個稱謂問題:同一個東西往往有多種稱謂,這種指代同一個東西稱謂我們稱之為同義詞。比如,中國人說的“蓋世3”,而老外稱之為“galaxy?siii”或“galaxy?s3”,那么我們就認(rèn)為“蓋世3”、“?galaxy?siii”、“?galaxy?s3”互為同義詞。
假設(shè)某個商品的warename為“三星?Galaxy?SIII?I939?3G手機(jī)”(分詞及詞性標(biāo)注結(jié)果為:三星/NR?Galaxy/NN?SIII/AD?I/VV?939/CD?3G/CD?手機(jī)/NN),而用戶的搜索詞為“三星蓋世3”(分詞及詞性標(biāo)注結(jié)果為:?三星/NR?蓋世/VV?3/CD)。雖然該商品能滿足用戶找“三星蓋世3”手機(jī)的需求,但是,該商品的warename壓根就沒有“蓋世”這樣的詞項,所以該商品并不會被召回(檢索到)。如果有同義詞模塊,可以認(rèn)為商品的warename由“三星?Galaxy?SIII?I939?3G手機(jī)”變成了“三星?Galaxy?SIII?I939?3G手機(jī)?蓋世3?galaxy?s3”,在這種情況下,用戶搜索“三星蓋世3”肯定會把該商品召回。
2.?本發(fā)明也解決商品名稱中的單位問題:同樣地,單位也存在同義詞問題,比如,某商品的warename為“健康香臘牛肉500g”,而用戶搜索詞為“牛肉1斤”等等。對于帶單位的搜索詞,可以采取同義詞解決召回問題嗎?答案是否定的,因為每個單位往往有多種換算關(guān)系,比如說,重量單位“千克”可以換算成“克”、“斤”、“公斤”、“錢”、“兩”、“毫克”、“kg”、“mg”等多達(dá)十多種,如果采取構(gòu)建同義詞表的方法,無疑會提高同義詞表的維護(hù)成本,此法行不通。為此,采用單位歸一及量化來解決帶單位的用戶搜索詞的召回問題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇物聯(lián)網(wǎng)研究發(fā)展中心,未經(jīng)江蘇物聯(lián)網(wǎng)研究發(fā)展中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410132973.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





