经验分享
共同学习

抖音让你上瘾的推荐算法分析

抖音介绍

抖音是字节跳动公司旗下的一款短视频社交应用,发布时间是在2016年9月15日,如今它已经成为世界上一个最有影响力的短视频社交平台,尤其深受年轻人用户喜爱。在2018年9月抖音推出国际版tiktok,开始向全球扩张,凭借相当成功的产品与运营策略迅速发展壮大,尤其是在东南亚,南亚、日本、韩国等地风靡青少年,成为全球最受欢迎的短视频应用之一。

字节跳动旗下产品目前有13个产品:今日头条、抖音、悟空问答、西瓜视频、火山小视频、快马、花熊、激萌、图虫、懂车帝、TopBuzz、News Republic、Flipagram、还有被封禁的内涵段子。

这篇文章主要介绍:为什么让你上瘾以及它的推荐机制算法是什么,由于抖音从未公开过核心的算法,我根据公开的资料以及最新的论文等信息做出推断结论,并不代表它真实的推荐算法。

如果这些数据利用它来运营抖音,对你带来的用处不大,更多是简单了解Ai对我们或以后产生的影响。虽然抖音的Ai的人工智能算法对人性的了解分析如此强大,只要是机器它始终还会被人性欺骗,因为能影响到它的还是那些用户的行为。一个人会骑自行车更多的是靠感觉,而不是那些详细的物理学知识学会的。

刷抖音会上瘾

抖音在2016年9月推出起,其核心推荐算法和视频分类技术就用了Ai深度学习,可以分析理解视频图像、音频、文本等多模态信息,判断视频主题和用户兴趣,实现内容推荐个性化。

在2018年抖音推出“探索模块”又提供了个性化视频推荐,采用的也是深度学习和强化学习技术。

2019年抖音在视频推荐算法中加入了对用户“细粒度兴趣”和视频热度的分析,使结果更佳准确,同时抖音加入了emo模型分析,可以判断当前用户的情绪状态和兴趣偏向。

2020年抖音推出“深度推荐”,采用更佳复杂的深度学习模型,在海量视频和数十亿用户数据的训练下,建立起用户兴趣高度空间的表达,实现极致personalized化的视频推荐。

2021年,抖音继续优化推荐算法和内容理解能力,实现了基于多模态信息的视频分类和推荐技术的升级。

……中间这几年应该还有更新,由于GPT数据只到2021年

2023年,抖音继续优化推荐算法在线培训是Monolith能够快速响应用户偏好变化的关键,它占用内存更小,算法更快。

然而一些和抖音同行的企业,面对抖音强大的算法已经出现马太效应,因为抖音拥有更多用户,能通过Ai算出更加准确的推荐算法。

换句话说就是你爱看什么他就推荐什么,想象一下,打开APP,随便刷几个视频,动动手指就可以获得个性化的内容,下一条视频永远是自己爱看的,你怎么会忍住停下来?

在推荐机制中,如果你最开始点击了跳舞的视频,而且你的停留时间挺长的,还看完了,还评论了,还点赞了,以后还会大概率推荐这类内容,并且给你定位在娱乐领域,在这些娱乐领域中还会细分化很多标签,在后续机制中将继续跟踪你的行为,再进行进一步的分析,最终通过你刷的视频越多它越了解你的兴趣,就会更为精准的推荐给你更爱看的内容。

抖音短视频算法步骤

Duo-Audit系统

在抖音中每天有数百万用户在上传内容,如果单靠机器审核,就很容易让一些含有恶意的内容钻空子,但是如果手动审核也并不现实,因此双重的审核就成了抖音的视频内容主要算法。

机器审核:一般来说,Duo-audit模型(基于计算机视觉)可以识别用户的视频图像和关键字。

它主要有两个主要的功能:

  1. 检查剪辑的视频中是否存在违规内容并检查文案,如果怀疑违反那么内容将被模型拦截并且标记为黄色或者红色,以人工审查或直接驳回。
  2. 通过从视频中提取图片和关键帧,抖音的双重核查算法将使提取的内容与庞大的存档内容库相匹配,如果有类似的内容则会降低所分配的流量以及推荐的权重。

手动审核主要关注三个领域:视频标题、封边缩略图、视频关键帧。对于通过Duo-Audit模型标记为可疑的内容,技术人员将对其进行人工审核,如果确定违规,这个视频将会进行删除、降权、封号处理。

虽然有些视频会被推上热门,但是由于会被很多人投诉举报,那么这个程序还是会被激活重新通过模型进行审核,在不确定的情况下再给人工审核。

冷启动

抖音推荐机制的核心是信息流漏斗,当内容通过双重审核后,它将被放入冷启动(初始)流量池中。例如你制作的新视频通过审核之后,抖音会分配200-300个活跃的初始流量,如果人份群较为准确,用户互动效果不错的话,就可以获得多达几千次的展示。

在这种机制下,创作者可以与社交影响者,或者成千上万的追随者竞争,因为他们的起点是相同的。

指标权重

通过初始流量池后,视频可以获得数千次的观看,而这些数据又会被收集和分析,分析的 考虑的指标包括了:观看、完整观看、评论、点赞、关注、转发、分享、收藏等。

然后根据引擎将这些初始质保和你的账户得分(无视你是否是高素质的创作者)来衡量内容的权重得分。

如果引擎决定对你的内容加大权重,则前10%的内容将带来10000-100000的额外曝光。

标签放大器

来自步骤流量池的反馈将进一步的被分析,来决定是否使用用户标签放大器,在这个步骤的过程中,比较优质的内容将会会特定的用户组中(例如、健身、美女、性感、丝袜、时尚、体育、游戏等等)得到大范围的推送和曝光。

这类似于猜测你喜欢什么的功能概念,推荐引擎将建立用户的个人资料库,以便它可以在内容和用户组之间找到最佳的匹配。

热门趋势

不到1%的内容最终进入热门趋势这个流量池中,内容在其中获得的曝光量要高于比其他的流量池。因为这类内容将被无差别的推荐给所有的用户。

延迟曝光

一些抖音用户可能会注意到这样一种情况,自己的某一个视频作品发布很多天后,其内容突然获得了较大的流量曝光。

主要原因有两个:

抖音有一种算法叫“gravedigger”,可以回顾旧内容并挖掘出高质量的曝光对象,如果你的内容已通过此算法选择,则表明你的账户有足够的垂直视频来获得清晰的标签。这个标签增加在gravedigger中的内容可见性。

“趋势效应”,如果你发布其中一个视频内容获得了百万的观看次数,这将把访问量印象你的主页,从而增加以往发布的就内容的浏览量。通常垂直领域的创作者会遇到这样的情况,比如逗猫视频创作者,由一个热门视频带火了其他的所有高质量视频。

流量高峰

如果内容通过信息流漏斗,双重审核权重迭代和放大,则创作者的账户将获得很多的曝光,点赞留言等互动以及一定数量的粉丝。

但是根据研究,这种高曝光的时间非常的有限,通常将持续一个周左右。在此时间段后,内容的热度会降低,甚至随后的视频也很难获得大范围的曝光。

为什么呢?主要原因是抖音希望在其他平台上发布的视频种类多样,尽可能做到公平的创作环境,所以消除其算法中的意外偏差,通过或这种设置,推荐引擎将不会偏向于特定类型的内容,以确保新内容将有平等的机会成为下一个爆款。

直播间推流权重

抖音短视频的推荐机制和短视频类似,但因为是直播并不存在历史视频数据分析,使用过实时数据模型计算进行推流。因为抖音推流机制为了确保公平,流量能得到公平的分配,在直播的过程中对于粉丝观看的行为加权重是非常低的,也就是你的粉丝来你直播间的互动效果,没有一个新来直播间的用户给你增加权重高。

以上是经过个人对很多直播间的流量粉丝监控和流量上浮下浮得出的结论,具体可以自行观察。

抖音直播间的推荐机制主要基于以下算法和因素,权重从高到低排列:

1. 用户兴趣和偏好(权重最高)

推荐算法会追踪用户在直播间的观看历史和互动,分析用户的兴趣偏好,然后推荐相关的直播间。如果用户对某个主播或话题表现出较高观看热度,会被推荐排列在首页较高位置。推荐权重= 用户对直播间i的观看时长*0.5 + 用户对直播间i的互动次数*0.3 + 用户对主播i的关注状态*0.2

2. 直播间热度和人气(权重其次)

直播间的热度取决于主播的人气和直播间内其他观众的参与度。抖音会计算直播间内观看用户数、送礼用户数、弹幕消息数量等来判断直播间的热度,热度高的直播间会被推荐。热度权重= 直播间i的观看人数*0.4 + 直播间i的送礼用户数*0.3 + 直播间i的弹幕量*0.3

3. 主播人气和影响力(其次)

人气主播所在的直播间也会被推荐排名更高,因为人气主播的直播内容和效果会更加出色,更能吸引用户观看。主播的人气取决于粉丝数、获赞数量、直播次数等。
人气权重= 主播i的粉丝数*0.5 + 主播i的获赞数量*0.3 + 主播i的直播频率*0.2

4. 新上线直播间(最后)

新上线的直播间为了增加曝光率,也会被temporarily推荐在首页较高位置,但如果排名过低和热度不高则会很快降低推荐权重。
新上线权重= 1(temporarily)

综上,抖音直播间的推荐顺序决定于多个因素,主要还是依靠用户数据和互动来判断兴趣和推荐权重,其次是直播间和主播自身的数据指标,新的直播间也会有一定曝光机会,但权重较低。推荐算法需要综合判断各维度的数据,动态计算每个直播间的推荐权重和排序。

 

Monolith在线培训论文
免费下载
-=||=-收藏赞 (0)

评论 抢沙发

评论前必须登录!

立即登录   注册

登录

找回密码

注册