caoz的心得与分享,只此一家,别无分号.

推荐算法,机器学习,会将我们带向何方?

发布日期:2016-10-04 14:51:00 +0000

今天引子比较长,先说点和主题无关的,但即便无关,相关内容也是有意义的。


前几天文章里说,我的用户新增断崖式下跌,嗯,有评论说,因为干货越来越少,那个,其实我要说一个观点,公众号获取订阅用户的能力,和你提供的文章质量价值,其实并无直接关联。


我们先说一个话题,公众号的订阅从哪里来。我们数数看啊


朋友圈,微信群,基于用户的自发转发和推荐。

同类知名个人公众号的友情推荐。

行业内知名公众号的转载推荐,比如36氪,虎嗅传媒等。

今日头条,网易,百度百家,凤凰传媒 等其他媒体作家直接入驻引流。

微博个人号,及大V引流。

知乎开设专栏,回答问题引流。豆瓣引流,分答,值乎引流。

贴吧,百度知道参与讨论引流。

腾讯广点通买广告引流。

大型自媒体联盟采购广告,发布软文引流。


其他一些灰色的,如微信小号加群群发,QQ小号加群群发,淘宝买僵尸粉等等,就不一一列出了。


以上种种,都是导入用户,增加订阅的方法,当然,和内容也有关系,后面我会再说,先说如上途径,我用到的,有效果的。


1、知名个人号的友情推荐


冯大辉的小道消息推荐效果最好,后来女网红angela zhu的推荐效果也非常好。此外也有一些其他朋友推荐过,都有不错的效果,但毕竟是一次性行为,很难具有持续的用户引流效果。


以上均为友情推荐,非商业行为。


2、知名行业公众号转载推荐

36氪和虎嗅均做过多次推荐,刚开始效果很好,后来基本不再有效果,我的理解是,该关注的基本都关注了。


3、朋友圈,微信群,订阅者自发推荐和转载

这是目前一直仍然获得新增的途径。也是目前几乎唯一获得订阅的途径。

但实际上,也存在该关注的基本关注,覆盖面的进一步提升已经很难。


4、知乎,微博引流

最开始我试过知乎引流,稍微把知乎账户搞活跃一些,还是可以带来稳定的用户订阅,实际上直到现在,我知乎上的订阅用户依然比微信公众号高接近一倍。 但后来自己怄气,知乎账户不再更新,所以这条路被我自己断了。


这里稍微解释一下,知乎官方并未封禁,删除,屏蔽我的内容,一切都是我自己做的决定;此外,我既不否认知乎的价值,也不看衰知乎的前景,只是单纯个人问题,希望读者不要过度联想。


微博,因为几年前就不活跃了,而且微博官方对微信导流的限制还是蛮多,所以导流效果也不好。


其他的途径一概没有试过,其实包括今日头条,网易,百度百家,还有其他很多媒体平台,都有不同的人给我发过邀请邮件,希望我加入他们的媒体平台,但最后我一个都没加入,当然,核心原因还是自己懒,但也存在一个对媒体平台的认知和个人价值观的问题,我总觉得自己没办法说服自己,去试图以媒体运营的方式迎合读者的口味。


基于如上,目前基本没有特别的引流途径,单纯依靠用户自发传播,在文章内容没有明显的方向转变,以及没有明显的热点事件追随的前提下,已经基本达到了一个瓶颈。


这是第二个问题,开始接近我们今天的主题。


内容与用户吸引力的问题。


是的,某些知名大V说,有非常值钱的方法,靠内容爆文,来获得大量用户。


其实这些我还真会,我今天就能教你们。


1、时效性,在热点事件出现时,第一时间发文,并且具有完整内容。

2、观点鲜明,对错不论,挑动争议,煽动情绪。

3、标题,危言耸听,故弄玄虚。

4、内容,基于你所表达的观点,搜集有利于你的案例或者杜撰你的某个朋友,牵强附会,哗众取宠即可。


至于事实如何,对读者的帮助和价值如何,看看那些巨V的热点文章,需要么?


那么现在开始今天的主题。


今日头条 是一个非常成功的移动互联网创业企业,其用户活跃度,营收规模均已经达到了一个惊人的高度。市值也相当了不起,可以认为最近几年除了美团和滴滴以外,大概最有潜力走入巨头领域的互联网公司,很惭愧,后知后觉的我其实最近几年一直没看过今日头条,最近,换了部新手机,才注意到里面预装了今日头条,那么也就随之打开看了看,别说,还挺过瘾的,每天都会刷几遍,读一些奇怪的文章。


今日头条的成功,被认为是算法的成功,基于用户的点击,阅读行为,做出的一种判断,从而形成个性推送。


但很惭愧的是,我相信,在今日头条的算法数据里,我大约是个很低俗,很脑残的人。


我能理解那些作者,为了迎合增加点击率的诉求,他们所做出的种种努力,我所看到的满屏的标题,基本都是故弄玄虚,危言耸听的东西,实话说,我确实也存在好奇心,挨个点过去看看到底是啥东西配的上如此奇幻的标题,然后就是愤怒,我承认我有时候会过于较真,一些明显扯淡,谣言,以及莫名其妙,因果不分的东西,或者是牵强附会的文字,堂而皇之的出现在文章里,然而,因为我点击了,浏览了,系统大约会认为,我就喜欢这样的文字。


是的,有人会说,你可以点叉啊,可以提交不感兴趣啊。我很好奇有多少人会在看完一篇无聊的文字后,还要做这样的事情。


但这个问题,也并非是今日头条才会有的。


之前,很多人会说百度有非常坏的案例,比如某个词汇的搜索结果,会莫名其妙的出现一些色情内容,很多人觉得是百度算法烂,但其实今天我要公平说一句,这一句话对于部分从业者来说,是非常非常值钱的,今天发在这里,我猜有些朋友会嫌我多嘴了。


搜索引擎有一条规则,是基于用户点击率提权,算法认为,哪个结果的点击率越高,就越趋近于用户的搜索目标,这个规则适用于非常多的搜索场景,不仅仅是网页搜索,也包括苹果,安卓市场的搜索。


这个事情追溯一下,其最初的理由是这样的,当搜索引擎调整算法的时候,需要评估你调整的效果好,还是不好对不对,请问怎么通过数据评估呢?就是算法调整前,调整后,排名和点击率的关系是怎样的,比如第一名点击率如何,前五名点击率如何,第一页点击率如何,翻页率是多少。理论上,搜索算法越完善,用户的点击行为就应该越趋近于搜索结果的第一名,我们想想,抛开前面的所有铺垫,只从技术和数据角度去想这个逻辑,是不是这回事。所以,既然点击率是评估搜索算法调整优劣的重要数据,那么将它作为调整搜索排名的重要参数,岂不是一劳永逸,简单直接的解决了这个问题!


从技术逻辑,这是一个非常简单有效又清晰的执行方案。


但问题来了,色情内容的点击率,不论在任何关键词,都会占有优势。我做过不十分严谨的比对测试,有一个不十分严谨的个人认识,似乎Google对点击率所带来的搜索权值,没有百度给的高。当然也可能是他们对色情内容在非色情搜索词中的排名,做了额外的降权处理。


回到今日头条,也就是今天的主题,在推荐算法和机器学习的体系里,很多作者也很明白这里的利益和价值关系,为了追求用户的点击,浏览,也就是自己的内容更多的被推荐,他们更倾向于采纳故弄玄虚,危言耸听的标题,而系统,这套算法,在实践运营中,也明显激励了这样的行为。


从数据来说,这是一个多赢,用户的活跃度很高,点击率很好看,广告卖的很好,作者分到了很多钱,而这家公司获得了非常漂亮的财务报告。


但我还是很担心这样的事情,我以前讲过很多次,选择性阅读是互联网时代的一个非常可怕的事情,加剧了偏激,傲慢,族群的分裂。从中国大陆,到宝岛台湾,到香港,到美国,我们已经看到了这种互联网时代里,人们政治观点和诉求严重冲突和对立的情况越来越激烈。互联网没有减少偏见,没有增加彼此的理解和交流,而是相反,加剧了冲突和对立。


推荐算法,则对此推波助澜。


今天,我看到这些以点击率为诉求的文章,我可以当一个笑话看,或者当一个八卦看;但是对于年轻人来说,据我所知,很多人的世界观,价值观,一直被这样的文字所引导,所灌输。


前几天和人喝茶聊天,有个在新加坡国立大学读书的年轻中国留学生,愤愤的说,新加坡是如何干扰和破坏克拉克运河项目的,他的拳拳爱国心是很不错,但我真的很惊诧他平时的阅读习惯和信息来源,这件事情无论是中国政府,还是泰国政府,早就出面辟谣了,双双否认有此意向,从头到尾,根本就没存在过任何政府层面的洽谈和商讨,破坏和干扰一说又从何而来?


当然,我知道,阴谋论者一定不相信这些,点击率和推荐算法喜欢这样的东西。


下面放两篇旧文


偏见的由来-选择性阅读

再谈选择性阅读 - 巴黎惨案的话题


以上旧文内容,其实比今天写的更有价值。

很多今日头条的文章,我也注意到了,为了观点,肆意曲解事实,混淆因果,相当严重,甚至是令人难以容忍。正如第二篇文章中的范例一样。




必须说,让技术去承担太多的责任和义务,是不公平的;让商业公司去承担拯救人类的重任,也是不现实的。


推荐算法,追随用户,从常规来说,是一款好产品的标签,但,在恶趣味上越陷越深,沉溺于追求数据指标,而失去对价值的判定,我个人不喜欢这样的算法逻辑。