fbpx

[限時試閱~9/16] 【案例剖析】今日頭條如何靠推薦系統成為大陸三大流量入口之一

商業思維百科限時試閱~9/16,數據管理的案例剖析
商業思維百科涵蓋 350+ 篇商業知識文章,帶你打底商業邏輯,搞懂老闆在想什麼,更能思考策略背後的意義
➡️ 商業思維學院所有入學方案皆有包含商業思維百科

本篇來跟大家討論靠數據以及演算法起家,在短短幾年間成為中國三大流量入口的公司--「字節跳動」,在剛創立時,它的名字是「今日頭條」,目前今日頭條只是字節跳動旗下的其中一個產品,更廣為人知的產品是「抖音」,或是國際版的「TikTok」。

今日頭條由張一鳴創立於2012年,三月上線「內涵段子」網站,是個包含笑話、短影音、有趣評論和梗圖的平台,八月上線「今日頭條」APP,十二月用戶就破千萬,三年內,今日頭條就在中國國內獲取了超過3.5億用戶,而抖音在隔年2016年推出,成為今日頭條的「第二曲線」,在短短一年內獲取破億用戶,更成為出海的關鍵點,2017年九月,抖音國際版Tiktok推出,至今才三年,就風靡了世界,甚至受到美國政府的注意。

今日頭條是怎麼崛起的呢?發展勢能這麼迅猛的公司,是怎麼做到的?是不是有強大的媒體資源或是內容團隊?還是行銷做得很厲害?

其實創業初期,今日頭條是個純粹的科技公司,創辦人張一鳴是工程師背景,整間公司甚至連編輯團隊都沒有,內容完全由演算法做編輯以及推送,具體做法其實在法律上屬於灰色地帶,甚至可以說在中國以外的地方可能都很難適用--

它是透過爬蟲直接去爬各媒體的新聞,然後再用演算法,根據使用者的偏好以及文章的內容屬性等等資訊,向使用者推送客製化的新聞資訊。藉由這樣的推送,今日頭條幾乎是零成本地把使用者會感興趣的新聞主題聚合在自己網站,也把流量聚合在自己網站,再做進一步的流量與內容「分發」,同時,今日頭條靠流量帶來的廣告收入賺錢。

這種作法當然有道德上以及法律上的疑慮,它其實就是「內容農場」,今日頭條這種轉載法也導致各種官司爭議纏身,也可以想見為什麼今日頭條在抖音紅了之後會改名為字節跳動,淡化今日頭條的影子,但無論如何,本篇我想先專注討論它的發展歷程中,怎麼讓演算法與數據能力,成為公司崛起的核心能力。

2012年8月,今日頭條app上線,如前面提到的,它的基本策略是「爬蟲聚合新聞之後,用演算法推送使用者會感興趣的新聞,吸引使用者停留,然後靠廣告賺錢」,比較細地來探究它的演算法怎麼精準抓到用戶的需求,可以分成幾個角度來看:

  1. 相關性特徵:也就是最直接的對「使用者」和「內容」做相關性配對。首先,要先製作「內容標籤」,針對文章主題、分類、關鍵字、文章來源等,整理出關鍵字標籤。有了這些標籤,才能看使用者點選了什麼內容,為使用者做「使用者標籤」,同時,使用者的興趣標籤也會結合一些使用者的基本資料,例如性別、年齡、登入平台IP、居住地點等等,建出這個使用者的相關特徵,再將更多的內容和使用者標籤做比對,逐漸強化。當然,這個使用者標籤是會隨著時間調整改變的,因為人的興趣和行為會逐漸改變,所以越新的行為,演算法上權重越高,這個「系統上的虛擬使用者」,也就會跟著成長,是不是感覺很像有另外一個你,活在企業演算法的伺服器中呢?
  2. 環境特徵:使用者當下的地理環境、時間,會讓使用者的偏好不同,所以這個條件也會納入推送的考慮,也就是說,在半夜的自己家中,頭條會推送的文章,可能跟在辦公室的大白天不同……,或是高雄的地方新聞,可能台北人比較不感興趣,需要進一步篩選掉
  3. 熱度特徵:「整個網站」上的熱點文章,或是各個主題、分類上的熱點文章,用「熱點」做推薦,永遠對「新用戶,對用戶偏好還不清楚」時最有效,這是所謂的「冷啟動」,對於既有用戶也能維持一定的效果,因為大家還是喜歡「看熱鬧」的,延伸這個概念來看,電商的「熱門商品」、「銷售排行榜」也是類似的概念,總是能吸引夠多眼球
數據化營運課程 - 早鳥只到9/30
數據化營運的概念其實很簡單,他就是「全員增長」的概念,產品經理跨足產品增長,行銷負責打造用戶獲取飛輪,UX則是會用指標證明自己的設計價值,RD不只是交付,更知道自己的交付會驅動什麼關鍵指標。

這樣的一個「全員增長」怎麼建構,就是課程想要帶給大家的。

歡迎報名:數據化營運課程,享受早鳥九折優惠

基本上有以上的條件就足夠且常見了,但是我跟一個做過類似推薦系統的朋友聊過,新聞類產品用這些特徵比對的後果就是--很容易一直推重複的內容給使用者,這也是今日頭條之前收到最多抱怨的點,一方面是因為演算法很容易「越推薦同溫層越小」,如果「文章推薦給使用者,卻沒被點選」,這也會讓系統再度調整權重,讓下次的推薦更精準,但越精準,看到的資訊重複率就高。

另外一個原因是,現在媒體「互相轉載」的情況嚴重,所以你會看到一樣的內容,出現在不同媒體上,只是標題不同,系統一抓,就一排一樣的文章了,另一方面,即使過濾調完全一樣的內容,一個較紅的新聞,可能各媒體也會一樣的素材改寫一百遍,這大家在某個新聞熱點爆出時,應該很有感觸,覺得看都看膩了,所以內容形式不同,但實質上還是一樣的,所以要加上以下兩種方法

  1. 偕同特徵:延伸挖掘使用者「可能」會有的需求,它不是分析一個使用者的歷史行為,來找出它的喜好,而是把使用者行為本身做分析,然後興趣或行為類似的分一組,再從這組裡面的使用者偏好,擴展要推送的內容,例如我可能偶然點了母嬰相關的主題,除了推送母嬰相關文章以外,系統分析一群點選母嬰主題的人,大抵都是30幾歲的上班族女性,這群女生裡面有很大的比例也會點選韓劇相關報導,所以即使我沒點選過韓劇內容,它也會推送相關的文章給我。要做到這種分類,需要使用者數量足夠龐大,也累積了一定的行為內容,才有辦法做得到。
  2. 「反面」的標籤:用來降低某些權重,例如拉低某些熱點推薦文章的熱度,以免使用者滑來滑去都是一樣的內容,反而跳出。也就是說,在熟悉的推薦內容中,還需要加一點「意外」的資訊刺激,才能延長使用者的使用時間。

上面的標籤做得好的話,看起來精準、無懈可擊,的確今日頭條也收割了非常大量的注意力,一飛衝天,抖音也是延續了類似的推薦系統,讓使用者「上癮」,但你能不能嘗試想一想,這樣的做法會帶來什麼問題?

答案是,這些演算法算出來的內容,都沒有「內容品質以及道德」的判斷與篩選。

對演算法來說,「好的內容品質」叫做「精準符合使用者興趣」,但是對於人類來說,「好的內容品質」包含對底線的「是不是假新聞」、「有沒有腥羶色」,更進一步的是「這是沒營養的花邊新聞,還是對使用者有幫助的資訊」,這些涉及「道德與價值選擇」的內容,不是演算法可以決定的,這其實也是今日許多媒體的問題,即使是人為篩選、決定內容,還是有「你是要提供腥羶色但流量高的文章,還是曲高和寡的文章」的價值選擇問題。

對於這個問題,創辦人張一鳴的態度是,今日頭條以「科技公司」自居,而不是「新聞媒體」,他認為平台的重點在於「資訊分配」,而非「內容的思想價值」,今日頭條就好像「郵局」,將內容彙整之後,靠著演算法這個「郵差」,把內容分門別類地投遞給用戶,郵差不用管遞送什麼,他們做的事也和媒體的道德標準沒有關係。

這本質上其實是很常見的「平台規避責任」的論調--平台會說,「站上的買方賣方的個人行為跟我沒關係,我只是媒合平台」,但問題其實還是在於實質的影響力與責任,更多影響力,就有更多的審核責任,尤其是在中國,這樣的逃避態度很快讓今日頭條迎來中國企業最害怕的大危機--政府整改。

在2017年12月29日,中國政府約談了今日頭條,原因是「違規轉載新聞資訊」,「標題黨」問題突出,「嚴重干擾網上傳播秩序」,「違反國家有關網際網路法律法規和管理要求,傳播色情低俗資訊,存在嚴重導向問題,對網上輿論生態造成惡劣影響」,因此今日頭條關閉「社會」頻道,預設改為「新時代」頻道(宣揚習近平中國特色社會主義思想的頻道),也開始大幅招募內容稽核團隊,不得不正式面對內容品質的問題。

2018年3月29日,可能是今日頭條最黑暗的一天,中國央視先是釋出了一個半小時的報導,指出今日頭條無視監管,避開北上廣深這些審查嚴格的地區,刊登藥品廣告,而且賣的還是假藥,隔天今日頭條火速回應廣告主帳戶已經被封停,代理商已經永久停止合作,但是4月4號國家廣播電視總局還是約談了今日頭條,要求全面稽查,4月9日政府通知Android和蘋果App store下架今日頭條,為期三週。

當天今日頭條在Android被下架,隔天App store也下架了,同時,起家的第一個產品「內涵段子」,被永久關停下架,一個有上億用戶,而且形成一定次文化的產品,就這麼永遠消失了,有人認為內涵段子就是因為已經形成強大的次文化,具有動員能力,所以才被整肅,在內涵段子被下架隔天,引起「段友」群起激憤,有許多「段友」甚至開車包圍廣電大廈鳴笛抗議。

最後,張一鳴發文表示,公司「過分強調技術的作用,卻沒有意識到,技術必須要用社會主義核心價值觀來引導、傳播正能量」,之後將以「正確的價值觀融入技術和產品」,並整治社群秩序,最佳化社群氛圍。文章還表示,今日頭條將不斷強化人工運營和稽核,將運營稽核隊伍擴大到10000人。

經歷了這樣的危機,除了理解演算法技術的侷限以外,你可能也更能理解「抖音」國外版TikTok,為什麼會受到美國政府的忌憚,短期觀點是,實際上真的有人在TikTok上動員了「取票不出席」的活動,讓川普疫情後的首次競選活動人數不如預期,長期來看,經歷了這樣的震撼教育,字節跳動對中國政府的配合程度應該是會蠻高的,這可能是美國有疑慮的背景因素了。

即使沒有用今日頭條,「演算法推送內容」這件事,在我們的生活其實已經不少見,例如Facebook、Youtube,都是靠演算法推薦內容,持續佔據你的注意力、讓你上癮,兩個平台也都各自爆出許多「內容是否該審查」的爭議,但是在大量的用戶製作內容中如何篩選、過濾有問題的內容,價值觀是什麼,至今還是沒有很好的解答,只能靠我們自己,要有意識知道自己正在被演算法監控與控制,主動跳脫迴圈,也跳脫同溫層,拿回注意力的主導權。

數據化營運課程 - 早鳥只到9/30
數據化營運的概念其實很簡單,他就是「全員增長」的概念,產品經理跨足產品增長,行銷負責打造用戶獲取飛輪,UX則是會用指標證明自己的設計價值,RD不只是交付,更知道自己的交付會驅動什麼關鍵指標。

這樣的一個「全員增長」怎麼建構,就是課程想要帶給大家的。

歡迎報名:數據化營運課程,享受早鳥九折優惠

發表迴響

30 天體驗方案 $ 490 (9/30 止) 點我報名 👈

X