亲,欢迎光临25中文网!
错缺断章、加书:站内短信
后台有人,会尽快回复!
25中文网 > 都市言情 > 重生之AI教父 > 第287章 与张一名话推荐
  • 主题模式:

  • 字体大小:

    -

    18

    +
  • 恢复默认

在眼下这个移动互联网平台兴起的时代,各类App相互之间的竞争本质上是一场针对用户的争夺大战。

现在仍旧是移动互联网开疆拓土的阶段,智能手机一年小几个亿地出货,用户的整体规模远远未达到饱和,因而各类新兴平台层出不穷,都能够混到一口饭吃。

但孟繁岐很清楚,好景不长,这样野蛮生长的日子持续不了几年,待到20年左右,智能手机就已经差不多彻底下沉到底了。

移动互联网因而从增量市场转向存量市场,也就是所谓的寒冬,用户人数基本封顶,各类App之间的博弈因而变得越发血腥起来,相互争夺已经定型的蛋糕份额。

对于当时辗转于各大厂的普通打工仔孟繁岐来说,最直观的感触就是工作越来越难找了,岗位变少、待遇变差。

各个头部App的策略逐渐由怎么获得尽可能多的用户,转变为怎么尽可能地让用户多多使用我的App,想尽一切办法要让用户【上瘾】。

背后的逻辑也不难理解,你的时间全都用来看我的App了,留给其他App的时间自然就少了不是?

毕竟打工人一天下来...其实也没有几个小时真的是自己的。

嘴上说着【防沉迷】,但实际上,巴不得你永远沉迷在里面,成为互联网公司利润的一部分。

那么最核心的问题就来了,到底怎么才能够让用户沉迷其中无法自拔呢?

那就得让用户看他想看的,不仅你的平台上要有,你还得让他看到才行。

不仅要让他看到,最好还得让他不用动脑不用搜索就能够看到,否则怎么算得上是【奶头乐】呢?

若想做到这件事,推荐系统的作用就至关重要。

这东西说得冠冕堂皇一点,叫做【提升用户体验】。其能够节省用户搜索和浏览的时间,平台可以借此展示更多的内容,吸引用户停留浏览。合理提供更有价值的广告,进一步提升盈利能力。

说得直白一点呢,就是希望用户看当前视频和看下一个视频之间的间隔时间尽可能的短。

用户看完一个视频转向下一个的时候,需要的操作越简单越好,或者干脆什么操作也不需要,最好连半秒钟的空档期也不要有,如果可以的话连三餐也别去吃,一天一顿够了。

用户们刷完一个视频就刷下一个,刷完这一类就看下一类,不知不觉就刷完了一整天。

早晨起来吃完早饭,八点半想看一个视频放松一下,结果一路刷了上百个,等到回过神来已经下午一点了。

这就是推荐系统希望达成的效果。

不需要用户去搜索寻找自己感兴趣的内容,而是源源不断地喂食给用户。

这样的App使用起来当然是倍感轻松,内容都很有趣,不知不觉就会上瘾,从而在平台的竞争当中轻松取胜。

“如今的短视频用户还算是非常有耐心的,几条不行还愿意多刷个几条看看,等再过个几年,用户打开App,划个两三下,看不到喜欢的内容就会马上关掉应用,再也不会想起。”推荐系统并非孟繁岐的主业,之所以会抽空去做,是因为这东西对已经开始涉足短视频领域的视界公司来说实在太过重要。

这目前还属于是AI视界的内部情报,外界现在的关注点暂时都还是AI视界各种花里胡哨的图像处理技术,还没有注意到隐藏在其后的优质推荐机制。

毕竟孟繁岐从来不发也不写推荐算法相关的论文。

“所以这才是你们为什么只做单屏单视频显示?因为对自己的推荐内容有足够的信心,确信推荐的视频用户大概率会满意。”张一名恍然大悟,手机的屏幕大小有限,如果单个屏幕界面显示的视频数量多了,每一个视频占据的面积势必就会小。

原本就不大的几寸屏幕上再去分六七个,那么小点的图案和文字,用户看都看不大分明,体验非常不好。

“单屏幕单个视频,那就可以省去用户一次选择和点击的操作直接开始播放视频,到了这个阶段,每一步的操作都很难继续省略优化了。但是这样也有一个问题,如果你推的视频连续几次都是用户不喜欢的,其体验感也会大大降低。对比起来的话,单屏N个视频,就能扩大N倍的可能。”张一名抓重点的能力非常之强。

“单屏多个视频对于长视频或许还算合理,放在短视频上是完全不行的。对于长视频来说,每一次都可能需要耗费五到二十分钟,用户一个小时可能也只需要选择三五次,这个频率还可以接受。但短视频的黄金时长是15到45秒,如果不能做到很好的推荐,用户每分钟都要进行两次选择,疲倦感会非常强的。”孟繁岐知道张一名抓住了重点,但他完全不支持单屏N个视频去放大N倍可能的方式。

“要知道我们现在的打工人们,连中午吃什么都是世纪难题,选择其实是非常困难的一件事。”

企鹅系的副总曾公开说短视频是猪食,考虑到那时候企鹅系微视被抖音快手暴打,这话里有不少恼羞成怒,得不到我就骂的成分。但从某种程度上,猪食这话虽然不好听,却也说出了短视频的一部分特性。

那就是很多用户看短视频就是来放松享乐的,你视频这么短,每次都推六七个让用户选,一小时让人选一百多次,谁能受得了啊?短视频就像是小白文,很多时候用户不想带脑子来看。

“单屏单视频自动播放,可以做到每个短视频之间的无缝衔接。不过这样操作的话,推荐质量就相当重要了,因此我才说推荐系统算法的技术是重中之重。若非多次验证了效果,我们也没有那个胆子敢应用这种模式不是。”孟繁岐因为深知短视频平台的体量,在现阶段是做了大量对比测试的。

常见的推荐算法粗分的话大致可以分为三类:基于内容的推荐算法,协同过滤推荐算法和混合推荐算法。

第一种,基于内容的推荐算法,原理是根据用户喜欢的和关注过的内容,推荐类似的视频给用户。比如电影的续集,同一作者的其他作品等。这些视频在内容上有较大的关联,称之为基于内容的办法。

第二种,协同过滤,则是通过不同用户之间的相似性。如果有几十个用户,他们关注和感兴趣的内容特别相似,重合度很高,比如达到8成。那么推荐算法就会把2成不重合的那一部分,抽出来推荐给圈内的其他人看看。

因为兴趣太过相似,一个用户感兴趣的东西,很可能在这个圈子当中其他人也会感兴趣,这是个相当合理的推测,类似于圈内好友推荐。

有时候,大家猛地发现,前几天才和朋友谈论过的东西,怎么今天就出现在我的推荐里面了?细思极恐,我是不是被监听了?

虽然的确有App会恶意使用权限监听,但这样做的成本是很高的,容易得不偿失。更大的可能其实还是你被协同过滤推荐了。

伱的朋友发现了一些好东西,刚跟你聊了几句推荐了一下;但与此同时,他的购买和浏览情况也被统计,作为好友圈中的人,你被协同过滤推荐了。

再加上现在好多个平台之间数据都有所串通,经常会有跨平台推荐的事情发生,就会显得有些推荐结果格外让人背后一凉。

比如你在值乎等地方看了大量耳机相关的测评和推荐,反过来阿狸系的App里就开始给你推同价位的耳机让你消费。

便利了生活的同时,也会很容易让人有被窥视的感觉,觉得自己的隐私被泄露,感到非常不爽。

理性一点去看待,现在人们每天产生的数据量仍在飞速增长,个人是肯定没有那个精力去细究具体到某一个人的隐私内容的。

不过由于许多公司管理自己数据库的方式非常不规范不安全,导致被人拖库的事情时有发生。整个数据库直接被黑客取走,用户的一切敏感信息都被获取,作为商品被反复倒卖。

数次大型信息泄露事件过后,也导致了【人肉】别人变得越发容易,网友们相互开盒,不亦乐乎。

不过这些问题,却也不是孟繁岐现在有什么办法可以改变的了。

至于第三种混合推荐方式,则是将之前两大类通过一些方法综合考量,融合起来。

毕竟单独考虑内容和协同过滤都是不够周全的,前者可以避免冷启动问题,也就是如果用户没有跟一个种类的视频互动过,那么这类视频就会很难被推荐到。不过基于内容的推荐很可能会陷入重复套娃当中,点多了之后就不会推别的内容给用户。看几个萌宠视频就掉进猫窝出不来了。

后者根据用户互动数量的增加,可以非常好地把握用户的喜好。只是如果用户从未看到某些类型的话,系统也难以判断,在初期会遭遇上述的冷启动问题,不知道该不该推某些类别。

当然了,这是非常笼统论述,实际的操作更加复杂。

“现在国内在这方面大部分都是模仿你在谷歌为油管设计的那一套办法。”张一名此前刚刚自学了一套传统办法,结果推荐系统就被AI革新了一轮。

孟繁岐在谷歌的中前期,为了扩大自己的分成比例,做了一些推荐搜索方面的优化,其中就包括替油管准备的一套方法。

针对网页和推荐广告的那部分,谷歌是不可能放出来的,毕竟那是谷歌8成收入来源的一个重大提升。

而油管这方面,虽是世界级的视频网站,但在营收方面占比还是拉胯了一点,加上孟繁岐的做法也比较糙,因而迟些时候谷歌还是选择了公布。

“其实我在那个工作里没有投入太多精力,就只是率先把深度网络的那一套给搬进去了,做了一些专项的适配。”孟繁岐着实也不是谦虚,那段时间太忙了,油管这边属于营收小头,孟繁岐没有当成主要任务在做,各方面都不够细致。

“你这话说得,传出去能把人气死。油管怎么说也是十几亿用户的头部长视频平台,哪有你说得那么好做?”张一名是内行人,他知道以油管的规模,是有几个巨大挑战的。

“油管体量大,我自己测试很多推荐算法,小规模问题都做得非常好,但体量上到千万、亿级别就很容易出问题,更别提油管的十亿级别了。”张一名在头条上推荐的东西测得很多,其中的难点知晓得很清楚。

“用户多了,每秒的新内容上传数量也很庞大,系统不仅要处理好原本十亿级别的视频,还得对最新上传的内容及时更新建模。”张一名摇了摇头,以他自学推荐方法的经历,一时间根本想象不到这个难题得怎么去解决。

“油管当时是用了十亿级别的参数,用了千亿的训练样本。主要是用了两个神经网络,一个生成视频候选,一个用于排序重要性。”谷歌虽然公布了这部分内容,但是多少有点语焉不详,自然不如算法主导人孟繁岐介绍得简明清楚。

“主要是从用户的历史行为获取输入,从视频库检索数百个视频,尽量通过粗粒度的特征去筛选,因为规模上去之后噪声的为是相当夸张的。对于检索出来的百余视频,再根据细粒度特征用排序网络区分召回,分析相对的重要性,最终构成最佳推荐列表。”

这种粗排,精排,深度网络替代传统办法和树方法的模式,已经在国内外广泛流行了起来,可以说孟繁岐年初时分在谷歌做的这一套模式,如今已经成为了视频推荐的基本范式。

只不过孟繁岐自己早已经鸟枪换炮。

“我们现在稳定的一个版本也是遵循这个粗排候选生成,精排最后视频结果的模式,不过我注意到其实大部分厂商标注出来的数据是有很大的系统偏差的。有时候用户点了排在前面的视频,并不是因为喜欢,而是因为...他们只看到了最上面的那些,根本没有去看余下的部分。”

“如果不关注这种偏差的话,那么它就会形成闭环回路,反馈回来的结果只会让模型越来越自信于自己的推荐,然而实际上用户的体验已经是一团糟了。”

孟繁岐前世对推荐系统的了解没有本职图像和大模型那么多,但是对于许多重要更新的要点和思路还是记得清楚的。

只消与一些公司内专业的核心技术人士沟通个几次会议,算法就能基本成型。

与张一名再聊了一些细节,时间越久,张一名越觉得思路开阔,视野渐宽。内心之中不由得深深佩服,这家伙怎么就能做到多个主流领域的AI相关领域个个精通的呢?

老板自己就是第一线的技术人员,怕是他们公司的程序员干活都压力要大上不少啊!

“明天我就去尚海那边了,有个AI峰会,你去不去?”与张一名达成了协议,孟繁岐来到燕京的主要任务算是完成了。

孟繁岐未敢忘记正事,明日便启程尚海,准备参加三天后的AI峰会。

“我听说,现在国内的互联网三巨头,马芸,小马哥还有李彦弘,都会出席?那还是AI峰会吗?不是变互联网峰会了!”张一名也大概了解AI峰会的情况,毕竟AI这个圈子,说到底其实是大半个互联网圈子。

“我就不去了,他们几个都是去看投资机会的,我这还是被投的公司,暂时分不出那个精力。不过我有个关系不错的朋友,王星估计会在那边,你也知道,这两天搞美团搞得风生水起的那位。”