[發明專利]一種文案的優化方法和系統有效
| 申請號: | 201710698292.4 | 申請日: | 2017-08-15 |
| 公開(公告)號: | CN107688621B | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 劉月明;梁嵐;李艦 | 申請(專利權)人: | 皚沐(上海)文化傳媒有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/289 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司 11514 | 代理人: | 安娜 |
| 地址: | 200120 上海市浦東新區自由貿*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文案 優化 方法 系統 | ||
1.一種文案的優化方法,其特征在于,包括以下步驟:
對文案中的文本進行抓取,獲取原始文本;
對所述原始文本進行處理,得出多個第一目標文本,即,首先對所述原始文本進行分詞處理,將滿足指定詞性的詞作為候選詞;然后計算每個候選詞的TF-IDF值,根據每個候選詞的TF-IDF值降序排列,并輸出指定個數的詞匯作為關鍵詞,將所述關鍵詞作為第一目標文本;
接收用戶從多個第一目標文本中選擇的第二目標文本,用戶選擇相應需要優化的詞語;
根據牛頓冷卻定律計算出各第一目標文本中的各熱詞相應的熱度;
根據預設的word2vec模型計算剩余第一目標文本與所述第二目標文本之間的相似度;具體包括:對剩余第一目標文本進行預處理后輸入到word2vec模型中訓練得到多維的詞向量;
對所述多維的詞向量進行特征項提取,得出相應的特征數據;
將所述特征數據與用戶選擇的第二目標文本輸入到所述word2vec模型中進行相似度計算;
根據所述相似度的高低,向用戶顯示相應的熱詞推薦文本。
2.根據權利要求1所述的一種文案的優化方法,其特征在于,采用爬蟲技術對文案中的文本進行抓取。
3.根據權利要求1所述的一種文案的優化方法,其特征在于,采用jieba的方式對所述原始文本進行分詞處理。
4.根據權利要求1所述的一種文案的優化方法,其特征在于,采用公式:
T'(t)=-k(T(t)-H),計算出各目標文本中的各熱詞相應的熱度,其中T'(t)表示溫度變化的速率,負號表示降溫,k表示冷卻系數且k0,T(t)表示溫度T的時間t函數,H表示室溫。
5.根據權利要求4所述的一種文案的優化方法,其特征在于,所述預處理具體包括停用詞的過濾、標點符號的過濾和表情符號的過濾。
6.一種文案的優化系統,其特征在于,包括提取單元、預處理單元、接收單元、處理單元和顯示單元;
所述提取單元用于對文案中的文本進行抓取,獲取原始文本;
所述預處理單元用于對所述原始文本進行處理,得出多個第一目標文本,即,首先對所述原始文本進行分詞處理,將滿足指定詞性的詞作為候選詞;然后計算每個候選詞的TF-IDF值,根據每個候選詞的TF-IDF值降序排列,并輸出指定個數的詞匯作為關鍵詞,將所述關鍵詞作為第一目標文本;
所述接收單元用于接收用戶從多個第一目標文本中選擇的第二目標文本;
所述處理單元包括第一計算單元和第二計算單元,所述第一計算單元用于根據牛頓冷卻定律計算出各第一目標文本中的各熱詞相應的熱度,所述第二計算單元用于根據預設的word2vec模型計算剩余第一目標文本與所述第二目標文本之間的相似度;
所述顯示單元用于根據所述相似度的高低,向用戶顯示相應的熱詞推薦文本;
所述第二計算單元具體包括:
對剩余第一目標文本進行預處理后輸入到word2vec模型中訓練得到多維的詞向量;
對所述多維的詞向量進行特征項提取,得出相應的特征數據;
將所述特征數據與用戶選擇的第二目標文本輸入到所述word2vec模型中進行相似度計算。
7.根據權利要求6所述的一種文案的優化系統,其特征在于,所述預處理具體包括停用詞的過濾、標點符號的過濾和表情符號的過濾。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于皚沐(上海)文化傳媒有限公司,未經皚沐(上海)文化傳媒有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710698292.4/1.html,轉載請聲明來源鉆瓜專利網。





