[發明專利]文章內容轉換方法和裝置在審
| 申請號: | 201811366388.1 | 申請日: | 2018-11-16 |
| 公開(公告)號: | CN111274767A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 張之碩;王亞波 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151;G06F16/9535 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張曉霞;劉芳 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文章內容 轉換 方法 裝置 | ||
本發明提供一種文章內容轉換方法和裝置。該方法包括:獲取用戶觸發的文章讀取請求,所述文章讀取請求中攜帶有所述用戶的用戶標識和請求讀取的文章的文章標識;根據所述用戶標識,調取所述用戶的用戶向量,所述用戶向量是根據所述用戶的個人信息生成的;根據所述用戶向量、所述文章標識和轉換模型,對所述文章的內容進行轉換。由于用戶向量是根據用戶的個人信息生成的,結合該用戶向量和轉換模型轉換得到的文章更加符合不同用戶的需求,提升了不同用戶對該篇文章的認同感。
技術領域
本發明涉及數據處理技術,尤其涉及一種文章內容轉換方法和裝置。
背景技術
隨著互聯網技術的不斷發展,人們每天接觸到的新聞信息、娛樂信息、廣告信息以及科技信息等急劇攀升。如何根據用戶自身情況,比如:文化程度、個人喜好以及收入水平等向用戶推送符合用戶需求的信息,是目前亟待解決的問題。
目前,對購物平臺來說,可根據用戶瀏覽及購買商品的記錄,向不同用戶個性化推薦其需要的商品,還可在廣告位個性化顯示相應的廣告。使得每個人看到的推薦商品和廣告位上的廣告都不盡相同。然而,在通過軟文廣告及資訊等文章向用戶推薦商品時,文章內容卻無法做到千人千面。
發明內容
本發明提供一種文章內容轉換方法和裝置,用于根據用戶個體情況對文章內容進行轉換,提高用戶對閱讀認同感。
第一方面,本發明提供一種文章內容轉換方法,包括:
獲取用戶觸發的文章讀取請求,所述文章讀取請求中攜帶有所述用戶的用戶標識和請求讀取的文章的文章標識;
根據所述用戶標識,調取所述用戶的用戶向量,所述用戶向量是根據所述用戶的個人信息生成的;
根據所述用戶向量、所述文章標識和轉換模型,對所述文章的內容進行轉換。
可選的,所述根據所述用戶標識,調取所述用戶的用戶向量之前,所述方法還包括:
根據所述用戶的個人信息,采用詞嵌入技術生成所述用戶向量。
可選的,所述根據所述用戶向量、所述文章標識和轉換模型,對所述文章的內容進行轉換,包括:
根據所述文章標識,調取所述文章;
根據所述用戶向量和轉換模型,對所述文章的內容進行轉換。
可選的,所述根據所述用戶向量和轉換模型,對所述文章的內容進行轉換之前,所述方法還包括:
獲取所述文章中帶有標記信息的內容;
相應的,所述根據所述用戶向量和轉換模型,對所述文章的內容進行轉換,包括:
根據所述用戶向量和轉換模型,對所述帶有標記信息的內容進行轉換。
可選的,所述根據所述用戶向量和轉換模型,對所述帶有標記信息的內容進行轉換,包括:
判斷所述帶有標記信息的內容是詞語還是語句;
若所述帶有標記信息的內容是詞語,則根據所述用戶向量和詞袋模型 CBOW,確定所述帶有標記信息的內容被轉換后的目標詞語;
將所述帶有標記信息的內容替換為目標詞語;
若所述帶有標記信息的內容是語句,則根據所述用戶向量和序列轉換模型Seq2Seq,確定所述帶有標記信息的內容被轉換后的目標語句;
將所述帶有標記信息的內容替換為目標語句。
可選的,所述根據所述用戶向量和詞袋模型CBOW,確定所述帶有標記信息的內容被轉換后的目標詞語,包括:
根據所述帶有標記信息的內容的上下文所包含的詞語,預測至少一個候選詞語;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811366388.1/2.html,轉載請聲明來源鉆瓜專利網。





