[發明專利]谷歌趨勢的熱詞族的地域搜索指數的生成方法有效
| 申請號: | 202010629679.6 | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN111814078B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 陸成剛 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537;G06F16/9532 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 趨勢 熱詞族 地域 搜索 指數 生成 方法 | ||
1.一種谷歌趨勢的熱詞族的地域搜索指數的生成方法,其特征在于,所述方法包括以下步驟:
第一步,利用谷歌趨勢搜索該詞族的趨勢比較曲線,限定在業務主題調查需求的時段內,詞族有數量與曲線數量一致,一次最多只能比較五個詞,然后下載趨勢比較的數據表,名字為timeline.csv;
第二步,對timeline.csv的每個關鍵詞所在的列的數據求和,得到該詞族的每一個詞的搜索強度總和,這個數值的物理單位并不是直接的搜索次數,而是谷歌系統正則化處理后的反映搜索頻次的指標;
第三步,遍歷詞族的每一個詞,將該詞輸入谷歌趨勢,在輸出的第二功能的有關該詞的地域搜索分布中下載該分布的數據,為geoMap.csv文件;
第四步,對geoMap.csv文件的數據列進行求和,然后對每行的數據除以該和值,這樣得到每一個地域的搜索強度的權重;
第五步,對每一個詞的搜索強度總和乘以各地域搜索強度的權重,得到該詞的各地域的搜索強度分布;
第六步,對每一個地域的各個詞的搜索強度分布值按該詞族的各詞組進行求和,這樣得到該地域的對該詞族的搜索強度值;如果只有一個詞族,那么地域的搜索強度的分布已經生成好;
在詞族生成階段,即用戶針對業務主題提煉的根詞輸入到谷歌趨勢時輸出的第四功能的相關詞清單有多于4個詞,這時候有兩種處理模式:一、舍棄第五及以后的詞,取前四和根詞組成唯一的一個詞族;二、先取前四和根詞組成一個詞族,再取第五及以后組成第二詞族,依次類推直到相關詞取用完畢;
第一種模式采用的依據是根據上面第二步里的當前詞族的最小強度總和的詞占當前詞族各詞強度總和的和的比重小于5%,則舍棄后面的關鍵詞只采用一個關鍵詞詞族即可;
第二種模式采用2個及以上的詞族,那么第二個詞族的構造為采用前一個詞族的強度總和的最后一名的詞和后面四個詞,即第一次輔助生成詞族時的輸出的第四功能里相關詞排在第五至第八名的詞,這樣再對新的詞族重復上面第一步到第六步的過程,只不過此時的強度已經把第四名的詞的峰值規一化為100了,所以計算的第六步的結果得按比例縮小,該比例由第四名的詞在第一個詞族的強度總和的和中所占比例來決定;這樣就得到了正式的第二個詞族的各地域的強度分布,以此類推,得到第三個、第四個,……;最后把所有詞族的各地域的搜索強度按詞族求和相加,得到總的各地域的搜索強度的分布。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010629679.6/1.html,轉載請聲明來源鉆瓜專利網。





