本文作者:V5IfhMOK8g

我把流程拆开后发现:新91视频的“顺畅感”从哪来?背后是推荐逻辑在起作用

V5IfhMOK8g 今天 119
我把流程拆开后发现:新91视频的“顺畅感”从哪来?背后是推荐逻辑在起作用摘要: 我把流程拆开后发现:新91视频的“顺畅感”从哪来?背后是推荐逻辑在起作用导语 近期在使用新91视频时,很多人会有“看起来很顺”的感觉:视频衔接自然、停顿少、内容节奏稳。把...

我把流程拆开后发现:新91视频的“顺畅感”从哪来?背后是推荐逻辑在起作用

我把流程拆开后发现:新91视频的“顺畅感”从哪来?背后是推荐逻辑在起作用

导语 近期在使用新91视频时,很多人会有“看起来很顺”的感觉:视频衔接自然、停顿少、内容节奏稳。把整个推荐与播放链路拆开分析后能看到,这种“顺畅感”并非单一功能或界面效果,而是多个系统级与模型级决策叠加的结果。下面把流程逐步拆解,讲清楚每一步如何贡献这种体验,并给出可验证的实验与改进建议。

一、把流程拆成若干可观察的阶段

  • 内容采集与预处理:稿件入库、特征抽取(时长、主题标签、视觉/音频向量等)。
  • 候选生成(召回):基于用户画像、历史行为、热门池、相似内容检索等,生成大规模候选集合。
  • 粗排(过滤/初筛):快速模型或规则做初步打分,去重、时效性过滤、基本安全检查。
  • 精排(排序):更昂贵的模型做多目标优化(点击率、完播率、停留、长期留存等)。
  • 重排/多样化:对列表进行主题连贯性、去雷同、插入探索内容、人工策划位替换等。
  • 播放与交互:自动播放策略、预取/缓存、跳转动画与缓冲逻辑。
  • 反馈闭环:用户滑动、点赞、评论、完播等信号回流,用于在线/离线训练。

二、“顺畅感”的主要来源(逐项剖析) 1) Session-aware 召回与序列模型 短视频顺畅的根本是“上下文相关的下一步预测”。用基于会话的模型(RNN/Transformer、session-based embedding)去生成候选,使得后续视频与前一条的主题、节奏、时长倾向自然衔接。短期偏好权重被抬高后,内容连贯性明显提升。

2) 多阶段排序的目标设计 粗排保性能、精排追长效。把session-level或序列级目标(比如下一个视频的完播概率、会话总时长)纳入损失,会使排序更偏向“整体连贯”而非单条点击最大化,从而减少跳出与断裂感。

3) 自动播放与预取机制 自动下一条、平滑的过渡动画、以及后台预取视频数据,能把网络延迟和缓冲显著隐藏住。实际效果上这是让用户主观感受“连贯”的重要工程手段。

4) 软规则与重排(主题/节奏控制) 通过重排层做主题平滑(例如避免两条完全无关的视频相邻)、节奏控制(短-长交替或保持时长一致)以及相似度阈值控制,增强观看流畅性而非刻意重复。

5) 探索/利用平衡与信号放大 在线学习、Bandit或RL策略把即时反馈放大:当系统判断某类衔接带来高会话回报,就会增加该类顺序出现的频率,逐步形成“看起来顺”的偏好模式。这是一个正反馈环。

6) 性能与系统响应 低延迟、高命中率缓存、智能压缩带来的无缝播放体验同样不可忽视——用户感知联贯常常被几百毫秒的延迟所破坏。

三、如何拆解并验证每一环的作用(可操作实验)

  • 日志层级化:把日志分为候选池日志、粗排日志、精排日志与播放端日志,记录每层的top-k、分数、时间戳与最终曝光结果。
  • 局部A/B试验:只替换召回策略或只替换精排模型,观察session-level指标(会话时长、连续播放条数、次日留存)而非只看CTR。
  • 人为注入断点:在重排层随机插入“主题跳变”样本,检测顺畅感指标下降幅度,量化连贯性的贡献度。
  • 延迟模拟:有控制地增加预取延迟或移除预取,观察用户中断率与跳出位置。
  • 序列对比:用基于序列目标训练的模型与单步点击模型同时上线,比较会话级别的收益。

四、常见误区与权衡

  • 只优化单条CTR会牺牲连贯性,导致短时点击多但会话割裂。
  • 过分追求连贯可能造成回音室效应或重复体验,需与探索机制配合。
  • 工程上把平滑体验完全交给前端动画,会掩盖后端排序的根本问题。

五、落地建议(给产品与ML团队)

  • 指标体系要层级化:单条指标(CTR/CTCVR)和序列指标(session length、avg consecutive plays、session NDCG)并行。
  • 在候选阶段引入session embedding,精排加入序列损失或会话级reward。
  • 保持适度的多样化策略与探索率,避免长期内容单一。
  • 加强播放端的预取与缓存策略,把工程延迟降到可忽略范围。
  • 用可解释性工具观察模型推荐链路,做到线上问题能快速定位到某一层。