[發明專利]一種基于詞移距離結合詞向量的音樂文案生成方法有效
| 申請號: | 201811525805.2 | 申請日: | 2018-12-13 |
| 公開(公告)號: | CN109657212B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 彭敏;王維川;胡剛;金志歡;高望 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/284;G06F16/63;G06F16/951 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 距離 結合 向量 音樂 文案 生成 方法 | ||
本發明公開了一種基于詞移距離結合詞向量的音樂文案生成方法,首先從音樂軟件網站爬取歌曲的歌詞文本、評論文本;然后對歌詞文本、評論文本進行分詞處理;接著對分詞中得到的詞語進一步使用向量化表示,獲取詞語的向量分布表示;計算歌曲中歌詞文本向量與所有評論文本向量之間的詞移距離,獲得各個歌曲評論文本的詞移距離排序;設定詞移距離的邊界值閾值N,將詞移距離小于邊界值閾值N的歌曲評論文本按詞移距離的大小進行排序,作為篩選后的評論文本;最后將備選的評論文本進行去重處理,刪除其中不符合自然語法規則的句子,添加上歌曲的屬性信息作為推薦給用戶的歌曲音樂文案。本發明生成的音樂文案篇幅較小,提高了人們挑選歌曲的效率。
技術領域
本發明屬于信息技術領域,涉及一種自然語言處理的文本摘要生成方法,具體涉及一種結合文本的詞向量嵌入表示和基于詞移距離的文本相似度計算兩方面優勢的基于歌曲評論文本的個性化音樂文案生成方法。
背景技術
互聯網時代的不斷發展幫助人們可以通過更多便捷的工具獲取到音樂,人們不必再購買MP3類設備專門進行音樂的聽取,同時也打破了音樂傳播地域的限制。但是音樂的數量與此同時飛速增長,每天都有數以百計的新歌增加到全球曲庫當中,人們挑選想要聽的歌曲成為當前的一大難題。
歌曲廠商為了推廣歌曲時,通常會附加音樂的個性化描述或背景簡介,也即音樂文案,以達到取悅聽眾的目的。但這些傳統文案主要往往由人工編輯或篩選完成,計算機起輔助作用,來幫助文案中進行糾錯及排版。同時傳統編輯歌曲文案的方式費時費力,人工成本較大。對于聽歌群體來講,傳統人工文案一是無法滿足聽歌的多元化需求,二是編輯起來耗費時間較多,且效率較低。傳統聽歌軟件一般針對聽歌多元化和效率問題選擇歌單推薦,利用從眾心理將熱度較大的歌曲推薦給聽歌群體,但是忽視了聽歌群體本身的感受以及選擇權。
發明內容
本發明旨在提高音樂文案生成的效率,幫助人們在更短的時間內了解歌曲、挑選歌曲,提高傳統人工生成歌曲文案的時效性,改變傳統人工音樂文案生成過程中的文案生成來源單一性特點,增加生成后音樂文案的篇幅可控性以及音樂文案與歌曲本身的相關性和聽取歌曲人群對歌曲理解的共通性,讓人們更好地選擇歌曲同時享受歌曲。本發明同時克服了傳統音樂文案生成耗時長、人工成本投入大、文案輻射歌曲范圍小的缺陷,提出了一種以相對代價較小可以對所有歌曲進行歌曲文案生成的方法。
本發明所采用的技術方案是:一種基于詞移距離結合詞向量的音樂文案生成方法,其特征在于,包括以下步驟:
步驟1:從音樂軟件網站爬取歌曲的歌詞文本和評論文本;
步驟2:對歌曲的歌詞文本和評論文本進行分詞處理;
步驟3:對步驟2分詞中得到的詞語進一步使用向量化表示,獲取詞語的向量分布表示;
步驟4:計算步驟3中歌曲的歌詞文本向量與所有評論文本向量之間的詞移距離,獲得這首歌的歌詞文本和所有評論文本的詞移距離排序;
步驟5:設定詞移距離的邊界值閾值N,將步驟4中詞移距離小于邊界值閾值N的歌曲文本、評論文本按詞移距離大小進行排序,作為篩選后的評論文本,用于下一步音樂文本的生成工作;
步驟6:將步驟5中的篩選的評論文本進行去重處理,刪除不符合語法規則的句子,添加上歌曲的基本信息作為推薦給用戶的歌曲音樂文案。
本發明基于詞移距離和結合詞向量的音樂文案生成算法,從歌曲評論中選擇出與歌曲相關的評論,相關性表現在與歌曲內容相關、與歌手相關、與歌曲主題相關上,再將評論使用句法分析處理生成歌曲文案。歌曲文案的生成在保證速度的同時也保證了文案的質量。同時生成的文案篇幅較小,提高了人們挑選歌曲的效率,方便人們增加聽歌的多元化選擇。
附圖說明
圖1為本發明實施例的流程圖;
圖2為本發明實施例的詞移距離邊界比較的效果圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811525805.2/2.html,轉載請聲明來源鉆瓜專利網。





