[發(fā)明專利]一種基于向量相似性計(jì)算的短視頻演員同類客戶相斥方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110237808.1 | 申請(qǐng)日: | 2021-03-03 |
| 公開(kāi)(公告)號(hào): | CN112948632A | 公開(kāi)(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 王梓鑒;孫偉 | 申請(qǐng)(專利權(quán))人: | 秒影工場(chǎng)(北京)科技有限公司 |
| 主分類號(hào): | G06F16/75 | 分類號(hào): | G06F16/75;G06F16/78;G06F16/783;G06F16/787;G06K9/00 |
| 代理公司: | 南京鼎傲知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32327 | 代理人: | 劉藹民 |
| 地址: | 100085 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 向量 相似性 計(jì)算 視頻 演員 同類 客戶 相斥 方法 | ||
本發(fā)明公開(kāi)了一種基于向量相似性計(jì)算的短視頻演員同類客戶相斥方法,包括如下步驟:S1、客戶數(shù)據(jù)庫(kù)的基礎(chǔ):客戶行業(yè)、地域、體量和產(chǎn)品信息庫(kù)的建立,以及整個(gè)庫(kù)的持續(xù)優(yōu)化與迭代,對(duì)商業(yè)短視頻相關(guān)的全行業(yè)客戶有相對(duì)全局的覆蓋;S2、客戶數(shù)據(jù)經(jīng)過(guò)了清洗,特征工程,對(duì)枚舉維度、數(shù)值維度做預(yù)處理;S3、基于S2產(chǎn)生的歸一化過(guò)的維度數(shù)量適中的數(shù)據(jù),然后計(jì)算所有客戶之間的向量余弦距離;S4、設(shè)定相似角度余弦值,計(jì)算相斥結(jié)果,在商業(yè)短視頻現(xiàn)有拍攝團(tuán)隊(duì)眾多,兼職演員使用頻繁的情況下,自動(dòng)化的同類客戶演員相斥避免了相似品牌出現(xiàn)同一個(gè)演員的尷尬,并且這個(gè)過(guò)程在平臺(tái)上的過(guò)程做到了自動(dòng)化和實(shí)時(shí)化,適合更好的推廣使用。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)技術(shù)領(lǐng)域,具體為一種基于向量相似性計(jì)算的短視頻演員同類客戶相斥方法。
背景技術(shù)
演員,指在表演藝術(shù)中扮演某個(gè)角色的表演者,或參加戲曲、戲劇、電影、電視劇、舞蹈、曲藝等表演的專業(yè)人員,現(xiàn)有各行業(yè)的代理商或者商業(yè)短視頻團(tuán)隊(duì)演員的復(fù)用和共享是很普遍的,這樣可以降低演員的使用成本,和拍攝安排周期的可靠性,但帶來(lái)的問(wèn)題是同樣的演員被用在了同行業(yè)的競(jìng)品公司那里就會(huì)出現(xiàn)很大的問(wèn)題,比如同一個(gè)演員β,扮演了教育行業(yè)公司A的線上課的物理老師,轉(zhuǎn)眼又扮演了教育行業(yè)公司B的線上課數(shù)學(xué)老師,對(duì)雙方公司的品牌都會(huì)造成各種困擾,所以為了避免這種尷尬的情況,目前對(duì)各個(gè)行業(yè)的商業(yè)短視頻演員匹配和綁定帶來(lái)了更高的要求,而實(shí)現(xiàn)方式只有業(yè)內(nèi)人士的經(jīng)驗(yàn)處理或者合同約定,這既不高效,也降低整體短視頻拍攝的效率,大幅度提高了演員的使用成本。
發(fā)明內(nèi)容
本發(fā)明提供一種基于向量相似性計(jì)算的短視頻演員同類客戶相斥方法,可以有效解決上述背景技術(shù)中提出目前對(duì)各個(gè)行業(yè)的商業(yè)短視頻演員匹配和綁定帶來(lái)了更高的要求,而實(shí)現(xiàn)方式只有業(yè)內(nèi)人士的經(jīng)驗(yàn)處理或者合同約定,這既不高效,也降低整體短視頻拍攝的效率,大幅度提高了演員的使用成本的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于向量相似性計(jì)算的短視頻演員同類客戶相斥方法,包括如下步驟:
S1、客戶數(shù)據(jù)庫(kù)的基礎(chǔ):客戶行業(yè)、地域、體量和產(chǎn)品信息庫(kù)的建立,以及整個(gè)庫(kù)的持續(xù)優(yōu)化與迭代,對(duì)商業(yè)短視頻相關(guān)的全行業(yè)客戶有相對(duì)全局的覆蓋;
S2、客戶數(shù)據(jù)經(jīng)過(guò)了清洗,特征工程,對(duì)枚舉維度、數(shù)值維度做預(yù)處理;
S3、基于S2產(chǎn)生的歸一化過(guò)的維度數(shù)量適中的數(shù)據(jù),然后計(jì)算所有客戶之間的向量余弦距離;
S4、設(shè)定相似角度余弦值,計(jì)算相斥結(jié)果。
根據(jù)上述技術(shù)方案,所述S1中客戶數(shù)據(jù)的是平臺(tái)的一部分,在制作流程中已經(jīng)由用戶自行錄入了包括產(chǎn)品在內(nèi)的結(jié)構(gòu)化數(shù)據(jù),除了用戶的錄入外,會(huì)根據(jù)其訂單的情況抽取進(jìn)一步的分類;
所述錄入信息包括行業(yè)、地域、目標(biāo)人群維度組;
所述分類包括核心產(chǎn)品品類、服務(wù)規(guī)模、常用演員類型、素材類型。
根據(jù)上述技術(shù)方案,所述S2中行業(yè)類型枚舉維度,單一維度內(nèi)的離散值維度(行業(yè):在線教育/線下教育/保險(xiǎn)),被拆成N個(gè){0,1}的二值維度,原來(lái)單一維度擴(kuò)大到∑Ni個(gè)二值維度,表示行業(yè)是否是“在線教育”,行業(yè)是否是“線下教育”,地域是否是“上海”的;
體量相關(guān)數(shù)值類維度,按照自然對(duì)數(shù)LogX計(jì)算方法,切成N個(gè)離散區(qū)間,N個(gè)離散區(qū)間,再按照枚舉維度的方法歸一化化為N個(gè)獨(dú)立二值維度,最終將所有維度的值都對(duì)齊到[0,1]區(qū)間的。
根據(jù)上述技術(shù)方案,所述S3中沒(méi)有使用實(shí)時(shí)KNN(K最近鄰,K-NearestNeighbor)算法獲得與該客戶最相似的TOPK個(gè)客戶的原因是客戶數(shù)量并沒(méi)有達(dá)到海量的程度,并且屬性相對(duì)固定,所以計(jì)算的方法是預(yù)先計(jì)算所有客戶之間的向量余弦距離,每增加一個(gè)客戶,與其他所有向量再做一次預(yù)計(jì)算,將余弦距離存入數(shù)據(jù)庫(kù)中,這樣擁有N個(gè)客戶全庫(kù)的余弦值庫(kù)有N^個(gè)數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于秒影工場(chǎng)(北京)科技有限公司,未經(jīng)秒影工場(chǎng)(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110237808.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類別向量的方法和裝置
- 基于異類關(guān)系確定目標(biāo)相似性的方法和系統(tǒng)
- 相似性匹配系統(tǒng)和方法
- 相似性匹配系統(tǒng)和方法
- 興趣點(diǎn)預(yù)測(cè)和推薦中的用戶時(shí)空相似性度量方法
- 一種基于相似性和邏輯矩陣分解的miRNA?疾病關(guān)聯(lián)關(guān)系預(yù)測(cè)方法
- 一種結(jié)合二分網(wǎng)絡(luò)和文本的醫(yī)院科室相似性分析方法
- 一種基于相似性學(xué)習(xí)及其增強(qiáng)的細(xì)胞類型鑒定方法
- 確定企業(yè)屬性相似性、重名對(duì)象判定
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的lncRNA-蛋白質(zhì)相互作用預(yù)測(cè)方法





