新媒体人工智能算法浅析
房产
果修机科技资讯维修网
admin
2019-06-22 22:03

回顾2017年,无论是从杂志还是市场,人工智能总是不断地出现在我的视野范围中,新媒体界里也开始进行了大洗牌。今日头条携其亲儿子抖音的出现,利用了深度数据挖掘迅速占领了短视频的半壁江山。而后是新浪微博也趁势而上,采用了facebook所应用的定制化受众功能的lookalike算法,一举坐稳了“自媒体”行业中的宝座,阿里文娱和腾讯文娱也来势汹汹,新媒体行业的表面看似风平浪静,实则波涛汹涌。

最近开始学习了一些关于人工智能的算法,尤其是新媒体这一块,旨在了解其背后的运行模式天津苹果维修店,对一些常见的算法技术进行了总结合肥苹果维修店,其中运用于新浪微博的标签传播和垃圾用户计算是在此篇文章中需要提及的。

标签传播算法:

微博是一个用户量极其庞大的手机软件,其中聚集了不同的人,便会有不同的爱好。挖掘每一位用户的爱好有助于对广告的精准投放以及内容推荐,为了得到每个用户的兴趣爱好,微博通常采用的是为每一位用户打上标签成都苹果维修预约。其中标签代表了用户,一个用户可以拥有一个或者多个标签。假如每个用户的好友中与该用户具有相同兴趣的人占多数,此时就需要用到标签传播算法。在该算法中,用户的的标签会取他的朋友或者粉丝最多的一个或者多个,然后分出哪一类标签所占的权重较大。算法会进行循环整理,分类,直至用户的标签不会再发生更大的变化为止。

垃圾用户计算:

众所周知,在微博的新闻和事件中,一件事情如果用户互动程度越高,那就意味着该时间的影响力越大。近几年来的新闻大事无一不是出自与此。因此在影响力计算中,就需要避免僵尸用户对于影响力的干扰。在算法中,如果可以识别这样的用户,在计算影响力时将其排除在外,不仅仅可以提高效果,还可以降低计算量。

垃圾用户一般发文具有一定的时间规律性,可以使用熵值来进行衡量,熵值是衡量随机性的一种量度,随机性越大,熵值越小。具体做法为将一定的粒度进行时间切片统计,得到每个时间片内的博文概率。

有些垃圾用户的微文中为了进行广告的推广,添加大量的URL。可以通过微文中的URL比例进行衡量,查看其出现的频度,如果频度较高也可以判定为垃圾用户。

(原创文章,转载请注明来源,谢谢)