dy评论单子是一种在社交媒体平台上通过评论留言、点赞、转发等方式增加某一内容或产品曝光度的业务。它旨在吸引更多用户关注和参与,提升影响力,但需注意保持社交互动的真实性。
一、为什么要进行评论单子优化
评论区对于dy内容有着重要作用,优质评论能引发用户共鸣、加深对内容的理解并激发讨论,而灌水评论价值较低,但目前存在优质评论曝光不足、互动量少的问题,所以需要通过优化评论单子,让优质评论获得更多曝光,提升用户参与度和内容的传播效果。
二、主流评论排序方式及其优缺点
排序方式 | 优点 | 缺点 |
按点赞数量排序 | 能直观反映用户对评论内容的态度,最直观易懂,可让高点赞数的优质评论优先展示 | 时间越长,新评论获得的曝光越差,不利于最新评论的展示 |
按时间排序 | 能保证评论内容的流动性,即时性强,让用户及时看到最新的评论 | 无法突出优质评论,难以让有深度、有价值的评论获得更多关注 |
基于算法排序 | 一定程度上结合了上述两种方式的优点,既能保证优质评论获得更多曝光,又能让评论流动更新 | 算法设计和调整较为复杂,需要不断优化和测试以达到最佳效果 |
三、Hacker News算法及其在评论排序中的应用
Hacker News算法源于Y Combinator旗下的新闻频道Hacker News,其公式为:其中P代表得票数,T代表内容发表至今的时间(单位为小时),(P-1)、(T+2)、1.8这些数值有特定含义,该算法综合考虑了用户投票情况与时间等因素对内容展示进行排序。
在dy评论单子优化中,可以借鉴Hacker News算法的思路,衍生出适合dy平台的计算方式,如:
原始:Score=(P-1)/(T+2)^1.8
衍生1:Score= (P)/(T+2)^1.8
衍生2:Score= (P+R)/2*[(T+2)^1.8]
衍生3:Score= (P+3R)/4*[(T+2)^1.8]
衍生4:Score= [P+R+N/AVERAGE(N)]/3*[(T+2)^1.8]
衍生5:Score= [2P+5R+N/AVERAGE(N)]/8*[(T+2)^1.8]
(Score=排序分;P=点赞数;R=回复数;N=字数;AVERAGE(N)=当前文章评论字数平均值;T=评论发布距今天小时数)。
四、文章样本离线研究与算法实验
以《武汉市中心医院:李医生去世》这篇文章为例,该文章约有5000条评论,将其所有评论按以上6种算法进行排序后发现:
- 点赞和回复数较多的评论不太受算法影响,受时间衰减影响也较小,能够一直排在最前的位置。
- 仅计算点赞与回复数时,无点赞与回复的评论仅以时间倒序进行排序,质量较高的评论会被沉底,需要加入字数维度进行调整。
- 加入字数维度能够有效将质量较低(字数少,无意义,无点赞回复)的评论排在后面。
- 加入字数和回复数维度后较多较高质量评论的排序会更靠前。
- 有效字数需进行限制,如遇灌水帖本身质量不高却因字数较多排名靠前的情况,且字数无法完全证明该评论质量,需削弱其影响占比。
五、线上ABtest开发方案确认
根据上面的案例研究,需要在算法中加入有效字数的限制逻辑,按67个字进行限制(受测产品在标准屏幕下一级评论收起状态最多展示字数67字),计算字数时小于67字按实际字数计算,大于等于67字时按67字计算,为了控制开发成本和增大各个分组的样本量,可在衍生算法中选择合适的方式进行调整。
六、FAQs
Q1:如何确定合适的算法参数?
A1:需要通过大量的数据分析和实验来确定,可以先收集平台上不同类型文章的评论数据,包括热门文章、普通文章等,然后使用不同的参数组合进行排序实验,观察每种参数组合下优质评论的排名情况、灌水评论的过滤效果等,根据实验结果不断调整参数,找到最适合平台特点和用户需求的参数设置。
Q2:除了点赞数、回复数和字数,还有哪些因素可以纳入评论排序算法?
A2:还可以考虑评论的发布时间、评论者的影响力(如是否为认证用户、粉丝数量等)、评论的情感倾向(积极、消极或中性)等因素,对于一些重要的事件或话题,较新的评论可能更具有时效性和参考价值;而来自有影响力的用户的评论可能会吸引更多的关注和互动;积极情感的评论也可能更受欢迎,将这些因素综合起来,可以使评论排序更加全面和准确。