我们的新闻

杭州易桶金电子商务有限公司

  • Chinaso
  • Friday, 18 December 2020
在我前一篇关于 TikTok 的文章中,我们探讨了 TikTok 的个性化推荐算法 FYP 作为连接组织运转的核心原因,它就好像汽车总线一样,控制连接并形成信息传输的闭环。


但多数人还是非常费解,为什么很多公司想要收购 TikTok,另一方面,字节跳动是否应该将 TikTok 这一备受欢迎的 App 卖掉。围绕 TikTok 算法大肆的炒作已经开始变的异化了,这也是如今西方对中国科技领域项目的普遍分析套路。


在这篇文章中,其实我想探讨一下 TikTok 的设计是如何让它的算法如虎添翼的。之前我有写过 FYP 算法作为 TikTok 核心的原因,也讲到,假如这一核心算法不起作用了,那么整个信息传输闭环就会崩溃。即使你对 TikTok 或短视频不感兴趣,了解其算法如何实现准确性匹配对你也很有帮助,因为越来越多的行业公司将会遇到以机器学习算法为武器的竞争对手。


本文我们讨论的主题将是:TikTok 是如何通过设计让它的算法“看见”的。
1
《国家的视角》 VS 算法的视角
给大家推荐一本书,詹姆斯·C·斯科特(James C. Scott)的《国家的视角》(Seeing Like a State),它可以将你的思维转变成硅谷人的思考方式,让你喜欢使用甚至滥用 legibility(读懂)这个术语。我也是在读了一篇卡塔什•拉奥(Venkatesh Rao)对这本书的总结性文章时了解到的,如果你不打算读原书的话,Rao 的这篇文章倒是可以推荐作为这本书的 tldr(Too Long; Didn’t Read,化繁为简的替代方案)。斯科特·亚历山大(Scott Alexander)对本书的书评也很好,而且非常长,比较详细,也可以作为该书的一篇 tldr。不过我还是建议你读下原著。


这本书能让人们清晰的认识到到日常生活中各种意想不到的后果。当我们太过骄傲自大时,都应该保持谦逊的姿态。世界比我们想象的更加丰富和复杂。


举个例子,斯科特研究的很多内容都与我们现在傲慢的社交网络巨头有关。这些占据市场主导地位的应用程序旨在提高用户群的可识别性,从而提高用户参与度,防止用户流失,并最终提供有针对性的广告服务。当然这些反过来也会给它们的母公司带来一些问题。


但这是另一个话题,之后我在别的文章中再探讨。斯科特关注的是国家如何使用简化的抽象概念在概要层次上“看到”其公民,而我想讨论的是 TikTok 的应用程序设计如何让它的算法“看到”所有需要的细节,从而高效、准确地执行其配对分发工作。如果说《国家的视角》研究了常见失败案例模型,这篇文章便是介绍通过程序和服务的设计使机器学习算法发挥最大价值的新模型。


2
TikTok 的算法并没有什么不同
近年来,至少对于像我这样的局外人来说,大家对机器学习的一个普遍认知是,仅仅通过将训练数据量增加几个数量级就可以取得很大的进步。也就是说,即使算法本身与几年前没有什么不同,仅仅通过在更大的数据集上训练算法,人工智能研究人员便能取得像 GPT-3 这样的突破(这给科技巨头 Twitter 带来了短暂的兴奋)。


当大家谈及 TikTok 的算法是其成功的关键时,便会认为该公司的秘密武器是一些神奇的代码。俄罗斯后现代主义作家维克托·佩列温(Viktor Pelevin)曾说过,所有现代电影的主角都是一个装满钱的公文包。从《死吻》(Kiss Me Deadly)的放射性物质公文包,到《低俗小说》(Pulp Fiction)里面的那个类似的里面金光闪闪的、不知道装着什么的公文包,从《魔头对捕头》(The Formula)的创世纪方程,到大卫·马梅特(David Mamet)的《西班牙囚犯》(The Spanish Prisoner)里面的秘密财务流程,我们长期以来一直对有魔力的麦格芬(McGuffin,推动情节发展的对象或事件)感到痴迷。最近几周,我们对 TikTok 算法的讨论已经把它提升到了类似的高度,这个算法就好像是《夺宝奇兵》系列电影(如《法柜奇兵》(the Ark of the Covenant)、《圣战奇兵》(the Holy Grail)、《魔宫传奇》(lingam Shivling))里面的那些神秘考古文物一样。


但该领域的大多数专家持怀疑态度,TikTok 在机器学习推荐算法方面并未取得外界未知的突破性进展。事实上,他们中的大多数人认为,TikTok 很可能就是基于标准方案解决的问题,跟其他方案无异,没有什么特殊性。


不过机器学习算法的有效性并不仅仅取决于算法本身的函数,还取决于数据集训练后的算法函数。GPT-3 并不是新创意,但是通过大量数据训练和大量的参数设置,它的输出结果往往是令人惊讶的。


同样道理,基于自身数据集训练过的 TikTok FYP 算法,在将视频与觉得该视频有趣的人进行匹配方面做的非常精确和高效(而且,反向匹配做的也很精确,对某些视频不感兴趣的人就不会接收到这些视频) 。


对于某些领域,比如文本相关性较大的领域,可以轻松获得大量训练得很好的数据。例如,要训练一个像 GPT-3 这样的人工智能模型,你可以到互联网、书籍等上面找到大量可用的文本集。如果你想训练一个视觉人工智能模型,你可以在网上和各种数据库里面找到大量照片。虽然训练非常费钱,但是至少你可以获得足够的训练数据。


但对于 TikTok(或中国版抖音)来说,他们需要一种能够出色地向观众推荐短视频的算法,而这样庞大的公开可用训练数据集是不存在的。你在哪里可以找到各种各样的恶搞、孩子们跳舞、假唱、有可爱宠物、名人品牌推广、士兵们穿越障碍球场、孩模仿品牌等类型的视频呢?即使你有这样的视频,你从哪里可以找到关于一般民众对这样的视频看法的比对数据?除了 http://Musical.ly 的数据集以外(主要是由美国十几岁的女孩对口型唱歌的视频组成),这样的数据并不存在。


在经典的“先有鸡还是先有蛋”的问题中,如果没有 App 的相机工具和过滤器、授权的音乐剪辑等,TikTok 算法需要训练的视频类型并不容易创建。


这就是 TikTok 设计的神奇之处:它是一个反馈的闭环,这种设计能够激发并实现视频的创作和观看,产生的数据进而通过其算法进行训练,之后再反过来激发创作和观看。


为了让 TikTok 的算法变得像现在这样有效,TikTok 成为了它自己的训练数据来源。


3
算法友好型设计
要理解 TikTok 是如何创造出如此强大的学习飞轮的,我们需要深入研究它的设计。


说到技术领域的 UI 设计,至少在我成长的 20 年里,主流思想始终围绕着如何消除用户在完成他们想做的事情时的阻碍,同时在这个过程中让他们高兴。设计的终极目标是优雅,换个说法是要设计的:直观、巧妙、甚至时尚。


这种设计流派的代表公司便是苹果。巅峰状态下的苹果总能把自己的软硬件做出优雅的感觉——“就是这么好用(it just works)”,但同时又很性感,让用户感觉有品位。在苹果的主题演讲上发布新的 MacBook Pro 机身时,为什么要专门播放一段视频,展示它是如何用一块实心的铝制作而成的?可能是因为看到工业激光把那块铝雕刻成一体化机身会让你感觉很酷?然后,当你在咖啡店里用笔记本电脑发邮件时,那段视频的一些残留记忆又会在潜意识里给你一点点触动?


这种以用户为中心的设计模式占据主导地位如此之久是有原因的,尤其是在消费技术领域。首先,这确实有用。据最新统计,苹果的市值超过了 2 万亿美元。(还记得 Sean Parker 说过有十亿美元很爽吗?那还是十年前,现在十亿美元不再是顶层了。财富的量级在飞速发展。)此外,我们生活在大规模网络效应的时代,科技巨头们运用本·汤普森(Ben Thompson)的聚合理论,获得了庞大的用户基础,可以对他们所参与的市场发挥难以置信的影响力。要做到这一点,最好的方法之一就是设计比竞争对手更好地满足用户需求的产品和服务。


这种设计流派主导了这么长时间,以至于我几乎忘记了之前大家常用的一些拙劣的软件设计方法了。


但是,如果为用户提供最好服务的关键,很大程度上取决于机器学习算法的训练会发生什么呢?如果这个 ML 算法需要大量的训练数据集怎么办?在一个机器学习占据主流的时代,这越来越成为一个关键的设计目标。


在考虑如何设计一个应用程序时,你将越来越多地需要考虑怎么才能最好地帮助算法去“看”。要想更好地服务你的用户,首先需要服务好你的算法。


TikTok 之所以让我着迷,是因为它是一个现代 App 的典范,这就是我所谓的算法友好型设计的范本。(我曾经想过把它叫做以算法为中心的设计,但觉得这种说法有点夸张了。一个帮助算法看见东西的设计到头来仍然是为了给用户提供尽可能好的体验。)


我们仍然可以认为这只是以用户为中心的设计的一种变体,但是对于那些大量采用机器学习算法组件进行产品开发的团队来说,明确地承认这一点可能是有用的。毕竟,当产品经理,设计师和工程师开会讨论 App 设计时,算法是不会出席的。但是,对算法的训练需求必须得到体现。


詹姆斯·斯科特(James Scott)的《国家的视角》谈论了城市设计等领域的巨大变化,比如让土地面积和业主数量对征税者“清晰可见”。TikTok 的设计使它的视频、用户和用户偏好对它的 For You Page 算法清晰可见。该应用程序的设计实现了它的主要职责之一:“像算法一样看事物。”
获取账户

在线留言