五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

實現(xiàn)億級費用減省,B站大數(shù)據(jù)治理之路

2023-04-11 12:00 作者:嗶哩嗶哩技術(shù)  | 我要投稿

本期作者



B站大數(shù)據(jù)歷史


  • B站大數(shù)據(jù)成立歷史

  • 公司流量快速增長、數(shù)據(jù)必然爆發(fā)式增長

  • 以增加資產(chǎn)解決資源瓶頸已不是長期方案

互聯(lián)網(wǎng)公司發(fā)展到一定階段,各種場景的數(shù)據(jù)需求會越來越多,業(yè)務(wù)通過數(shù)據(jù)進行快速迭代、決策,已成為各家互聯(lián)網(wǎng)公司必備的能力。要解決猛增 數(shù)據(jù)的清洗 以及 海量歷史數(shù)據(jù)的加工,勢必要引入大數(shù)據(jù)能力。B站是 09 年成立的互聯(lián)網(wǎng)公司,但整體大數(shù)據(jù)體系的建設(shè)相對較晚,17年成立大數(shù)據(jù)團隊,19年才開始規(guī)?;慕ㄔO(shè),隨著公司快速發(fā)展,數(shù)據(jù)規(guī)模也在爆發(fā)式的增長。

(圖一 往年大數(shù)據(jù)規(guī)模)


截至 23 年 B站數(shù)據(jù)已經(jīng)達到 EB + 超大規(guī)模體量。爆發(fā)式的增長,長期通過采購服務(wù)器來滿足資源瓶頸,已不切實際。我們需要有一套長期地、合理的資源管理模式。既能滿足業(yè)務(wù)增長過程中的數(shù)據(jù)使用,也能有效控制公司在大數(shù)據(jù)體系整體投入的預(yù)算、費用。?但要達成預(yù)期數(shù)據(jù)治理效果,我們將要面臨的巨大挑戰(zhàn),包括:

  • 多個業(yè)務(wù)線,各自管理數(shù)據(jù),無統(tǒng)一管理體系;

  • 業(yè)務(wù)數(shù)據(jù)、技術(shù)數(shù)據(jù)混合在一起;

  • 資產(chǎn)歸屬認(rèn)證體系缺失,存在大量無主數(shù)據(jù);

  • 數(shù)據(jù)上報無統(tǒng)一標(biāo)準(zhǔn)、格式等。

如何能有效地解決現(xiàn)有問題?21 年下半年,數(shù)據(jù)平臺開啟公司大數(shù)據(jù)治理之路(立項 —— 望樓 1.0)。


“望樓”項目啟動,

存儲淤泥中從0到1的掙扎


望樓,是古代觀敵預(yù)警、登高望遠(yuǎn)的樓閣。項目以此為名,寓意最終必須構(gòu)建一套能從高處全盤掌控數(shù)據(jù)資產(chǎn)情況,長期地監(jiān)控異常、及時地警示風(fēng)險、權(quán)威地解決問題的治理框架。

在立項時,有兩個問題是首要考慮的:

(1)如何啟動治理這件事 ?

(2)如何讓用戶改變習(xí)慣和觀念,參與資產(chǎn)治理 ?


問題一:如何啟動?


其一,讓資產(chǎn)元數(shù)據(jù)鋪開治理的第一塊磚


資產(chǎn)治理本質(zhì)是一個為業(yè)務(wù)賦能的過程。它要先有業(yè)務(wù)數(shù)據(jù)建設(shè),再談為業(yè)務(wù)賦能。在具體的實施上,映射為先做資產(chǎn)元數(shù)據(jù)模型,再建治理指標(biāo)體系。

  • 資產(chǎn)元數(shù)據(jù)模型


(圖二 資產(chǎn)數(shù)倉數(shù)據(jù)域)



建設(shè)之初,公司的大數(shù)據(jù)資產(chǎn)規(guī)模、明細(xì),都是一個混沌的狀態(tài)。

這個階段需要自下而上的建設(shè)路線,先圈定平臺主要數(shù)據(jù)資產(chǎn)項(hive表、調(diào)度任務(wù)),再列出資產(chǎn)項生命周期各環(huán)節(jié)的業(yè)務(wù)過程(建表、建任務(wù)、發(fā)布、運行、授權(quán)、消費、下線等),輸出一個較完整但不鉆細(xì)節(jié)的元數(shù)據(jù)主題。這些數(shù)據(jù)輸出,是為了支撐起資產(chǎn)盤點、問題發(fā)現(xiàn)、治理策略探索等初期準(zhǔn)備工作。

當(dāng)資產(chǎn)規(guī)模和歷史問題有一定的盤點后,工作內(nèi)容從發(fā)現(xiàn)問題轉(zhuǎn)向用策略解決問題。這個階段就要逐步進入自上而下的建設(shè)路線,以治理指標(biāo)體系作為數(shù)據(jù)建設(shè)的主要需求輸入,最終數(shù)據(jù)的輸出,是為了治理策略執(zhí)行服務(wù)。

  • 治理指標(biāo)體系

指標(biāo)體系從來不是獨立成章的,它與運營方法牢牢綁定在一起。沒有運營落點的指標(biāo),產(chǎn)生不了價值,沒有指標(biāo)指導(dǎo)的運營,容易迷失方向。


(圖三 治理體系 指標(biāo)<->運營聯(lián)系)


B站的治理指標(biāo)體系模型,由治理目標(biāo)、治理策略、策略評估三者組成。

  • 治理目標(biāo):指一段時間內(nèi)要完成的目標(biāo)指標(biāo)(即北極星指標(biāo))。策略從目標(biāo)拆解,所以要先確定目標(biāo)指標(biāo)。

  • 治理策略:從目標(biāo)指標(biāo)拆解出實施策略。策略制定分為策略方向和實施項。


(圖四 治理目標(biāo)拆解方法)


  • 策略評估:包含兩類指標(biāo)。

  • 判斷是否命中實施策略的問題命中指標(biāo)

  • 評估策略好壞、實施效率的治理效果指標(biāo)

B站的治理運營方法,由指標(biāo)、問題、標(biāo)準(zhǔn)、實施四項組成。

  • 指標(biāo)->問題:通過問題命中指標(biāo),發(fā)現(xiàn)資產(chǎn)清單中存在哪些問題。

  • 問題->標(biāo)準(zhǔn):確定問題后,建立出能夠規(guī)避問題、解決問題的標(biāo)準(zhǔn)。

  • 標(biāo)準(zhǔn)->實施:標(biāo)準(zhǔn)建立后,依照標(biāo)準(zhǔn)制定運營策略,并付諸實施。

  • 實施->指標(biāo):實施周期后,觀察效果指標(biāo),評估該運營策略與此次實施行為的效率。


其二,選擇合適的發(fā)力點,讓運營方法首次轉(zhuǎn)動


資產(chǎn)規(guī)模大,存量問題繁雜,必須先專注于一個發(fā)力點,來實踐、驗證數(shù)據(jù)與策略。正如本節(jié)標(biāo)題所說,存儲治理成為了項目的第一個發(fā)力點。

  • 發(fā)力點的探索

為什么選擇了存儲治理?發(fā)力點要如何探索確定??思路應(yīng)當(dāng)是,找到瓶頸,當(dāng)前最痛的地方。

立項之初,幾乎每個月都要面臨存儲水位到達90%以上,緊急組織數(shù)據(jù)清理的狀況。同時從大數(shù)據(jù)資產(chǎn)的成本分布來看,離線存儲也是最大單項。


(圖五 大數(shù)據(jù)成本分布)


  • 存儲治理階段性目標(biāo)的確定

為了讓人力工時從存儲水位的應(yīng)急響應(yīng)中釋放,需要一波足夠大的存儲治理量,將水位降至安全線以下,并能在約半年的自然增長下,依然保持無風(fēng)險狀態(tài)。根據(jù)水位情況與預(yù)測增長趨勢。在21年的數(shù)據(jù)試水后,我們定下22年年內(nèi)優(yōu)化?整體存儲資源 50%?的目標(biāo)。

  • 存儲治理策略的拆解、排序

定好目標(biāo)是優(yōu)化存儲量,首先拆解第一層策略方向。


(圖六 治理單項目標(biāo)拆分)


我們先將視角放到歷史存量方向,利用命中指標(biāo)“存量存儲量“,可以拉出一批存儲量最高的TOP列表,分析TOP列表,找出列表中資產(chǎn)存在的共性問題,比如:

  • 下游無使用

  • TTL過長,超出該數(shù)據(jù)的時效意義

  • 數(shù)據(jù)未經(jīng)壓縮

等。

找出問題后,針對問題做出標(biāo)準(zhǔn)定義,制定策略:


三項策略制定好之后,依照人力工時的投入上限,我們還需對三項策略x上萬資產(chǎn)項的組合做好執(zhí)行優(yōu)先級的排序。排序以“實施成本低,效果收益高”的順序為最佳。

  • 模型與指標(biāo)的建設(shè)


(圖七 治理指標(biāo)建設(shè)過程)


在策略確定后,預(yù)定義所需的指標(biāo)。


(圖八 治理指標(biāo)的預(yù)定義設(shè)計)


以預(yù)定義好的指標(biāo)體系作為模型建設(shè)需求,做好數(shù)據(jù)源調(diào)研,確定指標(biāo)統(tǒng)計口徑。如果數(shù)據(jù)源的質(zhì)量或形態(tài)不滿足預(yù)定義指標(biāo)的口徑,則須重新定義替代指標(biāo)。

同時,還需定義策略實施中關(guān)注的維度。通常,在存儲治理實施中會有以下維度值得關(guān)注:


(圖九 治理指標(biāo)體系維度)


在不同維度下,策略可依據(jù)屬性值做階梯、特例等微調(diào)。

  • 存儲治理的持續(xù)化運營

按既定策略將策略指標(biāo)建好后,將其投入突擊性集中推進實施,或按天、按周、按月的周期性實施循環(huán)中。直至問題完全解決,或階段性解決。


(圖十 治理策略運營策略)


向問題資產(chǎn)項的owner發(fā)布問題清單,并通知他應(yīng)當(dāng)在何時完成優(yōu)化。


(圖十一 治理策略運營案例)


當(dāng)我們解決了第一批問題,依然可以繼續(xù)找新的問題,定義新的標(biāo)準(zhǔn)和策略。

舉例第二批問題:



新的問題,新的指標(biāo)建設(shè),新的策略實施,持續(xù)不斷地進行下去??梢杂么笮蓚€循環(huán)來描述這種持續(xù)性。


(圖十二 治理策略可持續(xù)運營)


?問題二:如何讓用戶配合?


其一,培養(yǎng)用戶對大數(shù)據(jù)資產(chǎn)成本和管理規(guī)范的意識jin


絕大多數(shù)用戶在跑查詢、做報表時,不會產(chǎn)生“我花了多少錢”這樣的意識,也不會產(chǎn)生“我這個行為是錯誤的、不規(guī)范的“這樣的意識。因此,想要用戶配合成本治理的實施,首先必須將這種意識種入用戶的大腦中。

花了多少錢,用賬單告知。

為了讓用戶感知到大數(shù)據(jù)成本,同時,也為描述當(dāng)前大數(shù)據(jù)平臺的資產(chǎn)規(guī)模,我們發(fā)布了部門、空間、個人三級賬單。賬單以資產(chǎn)大項、小項分別統(tǒng)計,再匯總。截至目前覆蓋的資產(chǎn)大小項包含:


賬單的計算,應(yīng)以兩個準(zhǔn)字為標(biāo)準(zhǔn)。

  • 歸屬準(zhǔn)

賬單建設(shè)初期,由于存量資產(chǎn)存在大量來源不明、歸屬不明問題,我們遇到了不少阻礙。


(圖十三 資產(chǎn)歸屬案例一 :歸屬不明導(dǎo)致無法記賬)


為解決資產(chǎn)歸屬問題:

  • 嚴(yán)格要求后續(xù)所有新數(shù)據(jù)資產(chǎn)通過數(shù)據(jù)平臺界面注冊,記錄注冊者信息。

  • 要求資產(chǎn)元數(shù)據(jù)能覆蓋到數(shù)據(jù)平臺支持的全部資產(chǎn)項。

  • 杜絕由于交接異常導(dǎo)致的失主,重新梳理交接流程,且規(guī)定生產(chǎn)任務(wù)與產(chǎn)出數(shù)據(jù)表的owner信息保持一致。

  • 推動客戶端鑒權(quán)與數(shù)據(jù)平臺權(quán)限打通,避免由客戶端操作導(dǎo)致的失主或歸屬異常。


(圖十四 資產(chǎn)歸屬案例二:資產(chǎn)交接原則)


當(dāng)歸屬異常的入口被關(guān)閉,對歷史存量,就要以一套基礎(chǔ)的歸屬追溯邏輯去批量尋主,使其找到歸屬人、歸屬部門。


(圖十五 資產(chǎn)歸屬案例三)


  • 度量準(zhǔn)

大數(shù)據(jù)資產(chǎn)賬單的計算公式可簡化為——用量 * 單價。

因此,記賬準(zhǔn),就要求資源用量的數(shù)據(jù)源、統(tǒng)計任務(wù),需要全鏈路的數(shù)據(jù)質(zhì)量保障。

最早做賬單任務(wù)鏈路時,流量資源、實時存儲資源等大項,存在無底層組件數(shù)據(jù)源、上層數(shù)據(jù)源也不穩(wěn)定,可用性堪憂的情況。這導(dǎo)致賬單發(fā)布的頭幾個月,記賬數(shù)據(jù)產(chǎn)出延遲、個別實例用量丟失等質(zhì)量問題,成為家常便飯。每月賬單產(chǎn)出前,都需要人工做二次確認(rèn),評估賬單總額、部門波動是否符合預(yù)期,如有違預(yù)期,還需找出異常原因,臨時設(shè)計修復(fù)方案。

到如今,數(shù)據(jù)平臺已將所有資源用量數(shù)據(jù)源替換為組件底層數(shù)據(jù),且通過常規(guī)方式入倉,上下游對其運維等級有統(tǒng)一的認(rèn)知,保障賬單產(chǎn)出的穩(wěn)定性和準(zhǔn)確性。

行為規(guī)范與否,用治理分告知。

為了讓用戶感知到資產(chǎn)管理規(guī)范,我們設(shè)計了一套評分模型,將一些基礎(chǔ)治理項的存量或?qū)嵤┺D(zhuǎn)化為加減分,以一個分值來體現(xiàn)各業(yè)務(wù)部門的治理規(guī)范水平。

治理評分模型的設(shè)計,有以下三個理念:

應(yīng)當(dāng)體現(xiàn)出平臺的治理經(jīng)驗。是歷史上經(jīng)驗教訓(xùn)的總結(jié),是已論證確實獲得效果收益的策略。能向用戶普及數(shù)據(jù)治理的概念,改變用戶只用不治的習(xí)慣。

應(yīng)當(dāng)體現(xiàn)出權(quán)威指導(dǎo)性。指標(biāo)并非固定不變,會做周期性更替,每一期更替依照公司當(dāng)前治理重點來調(diào)整。治理優(yōu)先級為重要參考因素,將高優(yōu)項納入評分,低優(yōu)項可排除出評分。

應(yīng)當(dāng)體現(xiàn)出執(zhí)行上的循序漸進。同類項,隨周期逐步加強要求,提高評分標(biāo)準(zhǔn)。模型規(guī)范,隨周期從ODS層逐步往高層推進。超前于當(dāng)前治理重點的指標(biāo)可做加分項,但后期應(yīng)更改為減分項。

摘錄第一期、第二期的指標(biāo)如下:


治理分的發(fā)布,幫助我們快速摸清公司的存量問題,控制和指導(dǎo)每一階段的大方向和優(yōu)先級,評估部門間的進度差異。

評分指標(biāo)項獲得業(yè)務(wù)部門認(rèn)可后,平臺與業(yè)務(wù)治理目標(biāo)、利益關(guān)系達成一致,加速推進。在公司每半年的技術(shù)大會上,設(shè)置了依據(jù)治理分評選出的部門級數(shù)據(jù)治理獎項,對當(dāng)個半年治理成效突出的部門予以表彰。


其二,提高用戶對成本治理實施的意愿


治理實施意愿取決于很多因素,但在幾次用戶調(diào)研中,可以發(fā)現(xiàn)最大的因素在于“歷史存量龐大,工時消耗過多”。用戶面臨數(shù)據(jù)平臺交予的治理任務(wù)時,會陷入好像怎么努力也做不完的苦惱中,何況用戶有自己的業(yè)務(wù)主線,不可能把工作時間全部投在治理實施上。

因此,為了提高用戶的實施意愿,需要幫助用戶解決:

  • 做好自動化:可自動化實施的問題項,避免用戶人工處理。

  • 做好問題攔截:可攔截的問題不要持續(xù)新增,讓用戶看到徹底解決的希望。

(圖十六 治理工具化:工具按標(biāo)準(zhǔn)自動攔截或處理)



  • 做好分類:讓用戶知道哪些問題可以合并處理,節(jié)省時間。

  • 做好排序:不同治理項之間、不同資產(chǎn)之間的優(yōu)先級,明確地告知用戶。

  • 做好功能引導(dǎo):怎么執(zhí)行、去哪里執(zhí)行,有什么注意事項,主動將此類引導(dǎo)給到用戶。

(圖十七 治理工具化:治理操作引導(dǎo)和分類排序)


做好工時評估:讓用戶知道每一項工時多久,并按周期提供用戶治理實施的工時統(tǒng)計。



做好效果量化:治理項實施之后,得到怎樣的效果收益,按周期提供給用戶統(tǒng)計值。


階段性成果


通過資產(chǎn)元數(shù)據(jù)與治理指標(biāo)體系的搭建,協(xié)同賬單與治理分的輔助,平臺在存儲治理這一單項上,兩年間取得了巨大效果收益。

截止22年,已實現(xiàn)整體存儲資源??55%?的治理,22年 全年增長速率從?21年?226%下降至34%?,累計節(jié)省B站大數(shù)據(jù)側(cè)預(yù)算億級規(guī)模?,最終超額完成整年的目標(biāo)。


化被動為主動,多元化治理的蛻變


雖然望樓項目在21~22年間成功實現(xiàn)存儲治理的巨大收益,但它依舊存在決定性的缺點與不足。其中最為突出的問題是:被動治理與單點治理。


問題一:如何化被動為主動?


發(fā)起存儲治理的原因是“痛”,當(dāng)痛點已經(jīng)出現(xiàn),水位瀕臨決堤,不得不投入人力去治理,這種治理模式是被動的。被動治理的弊處是,治理執(zhí)行節(jié)奏、時間預(yù)期,都取決于危機的逼近,不可自行控制。它會打斷業(yè)務(wù)常規(guī)工作,讓執(zhí)行者疲憊。

因此,將被動治理轉(zhuǎn)化為主動治理,是在多元化治理鋪開前必須實現(xiàn)的轉(zhuǎn)變。


其一,提前規(guī)劃長線治理目標(biāo),搶在問題爆發(fā)前,預(yù)備好數(shù)據(jù)和策略


面對存儲之痛時,計算并非不痛,只是小規(guī)模體現(xiàn),或等待爆發(fā)時機。主動的第一步,是將還不痛的資源治理納入規(guī)劃。

22年Q4,我們在深入實施存儲治理的同時,已對YARN、Flink、Kafka等多項資源展開瓶頸摸排、數(shù)據(jù)建設(shè)和策略預(yù)設(shè)的工作。23年H1,上述資源治理的計劃全部體現(xiàn)在OKR目標(biāo)中。


(圖十八 治理目標(biāo) OKR)


其二,水位風(fēng)險的發(fā)生可預(yù)測,且要有階梯預(yù)警與響應(yīng)機制


資源用量的增長有其規(guī)律性,這使得水位上升量是可預(yù)測的。平臺可以早于風(fēng)險真正發(fā)生,就提前發(fā)布預(yù)警。同時,預(yù)警需要與階梯性的響應(yīng)機制掛鉤,確保預(yù)警發(fā)出后,確實有人介入處理。

(圖十九 治理預(yù)警機制)



其三,每個階段的治理目標(biāo)和策略,有組織能快速自上而下傳達


以往,數(shù)據(jù)平臺與業(yè)務(wù)部門的治理溝通,是通過部門老板指派對接人。這種模式下,同一策略反復(fù)宣講、意見調(diào)和的溝通成本很高。且由于對接人不承擔(dān)治理責(zé)任、部門組織架構(gòu)調(diào)整帶來的人員變動等原因,使得對接人失效率很高。往往只有在事態(tài)緊急或者老板明確授權(quán)下,才能推進部門治理工作的落實。

22年Q4,B站組建了公司數(shù)據(jù)委員會,以委員制例會的形式,討論、頒布大數(shù)據(jù)治理標(biāo)準(zhǔn)和策略。大數(shù)據(jù)平臺不再對業(yè)務(wù)部門的治理實施負(fù)責(zé),只從公共策略層面掌舵公司的治理實施方向與節(jié)奏。相關(guān)信息由委員傳達到部門內(nèi),由委員調(diào)配部門內(nèi)的治理工作。

(圖二十 數(shù)據(jù)委員會)


  • 截止目前,數(shù)據(jù)委員會已頒布的標(biāo)準(zhǔn)與策略:

  • 成本管理主題,制度標(biāo)準(zhǔn)2項,執(zhí)行策略3項

  • 質(zhì)量管理主題,制度標(biāo)準(zhǔn)1項,執(zhí)行策略4項

  • 安全管理主題,制度標(biāo)準(zhǔn)1項,執(zhí)行策略1項


其四,問題的預(yù)警和清單,有工具能快速分發(fā)到個人


同樣是22年Q4,平臺發(fā)布了一個可以將治理工作分發(fā)到個人的產(chǎn)品——治理中心。治理中心將問題發(fā)現(xiàn)、策略解釋、危機預(yù)警、治理執(zhí)行、收益統(tǒng)計五大塊內(nèi)容,集成到同一個產(chǎn)品模塊,使用戶能在一個頁面解決散點問題。

建立好以上前置條件,從23年起,B站的大數(shù)據(jù)資源治理工作形成一個主動性極強的閉環(huán)。


(圖二十一 數(shù)委會和治理中心組成主動治理閉環(huán))



在這套主動機制建立之前,一次存儲高水位應(yīng)急預(yù)案的實施需要數(shù)天,并且要平臺與業(yè)務(wù)部門發(fā)起緊急臨時協(xié)調(diào)才能將問題解決。該機制下,高水位得以提前預(yù)測,無須平臺拉起溝通,業(yè)務(wù)部門響應(yīng)人員自行介入處理。伴隨著主動性提高,存儲水位由前兩年長期盤踞在?90%,下降至穩(wěn)定在?75%?左右。


?問題二:如何化單點為多元?


前文中提到,主動治理需要在各項資源的問題爆發(fā)前,預(yù)備好數(shù)據(jù)和策略。但只是照本宣科地做數(shù)據(jù)和策略,無法真正實現(xiàn)多元化治理。

多元化治理的核心矛盾點,在資源類型的多元化與人力工時的恒定不變之間。因此,如何提高人效,是實現(xiàn)多元化的關(guān)鍵。為提高人效,我們定義了一個治理操作框架。該框架,確保數(shù)據(jù)輸出是為治理應(yīng)用服務(wù),確保上一個治理項的發(fā)布與實施,能為下一個治理項積累經(jīng)驗、沉淀工具。

(圖二十二 完整治理架構(gòu))


其一,平臺運營人效


當(dāng)公司有了主動治理閉環(huán),平臺人員的精力,更多放在標(biāo)準(zhǔn)和策略上。運營提效的重點在于靠三個統(tǒng)一來提升標(biāo)準(zhǔn)制定和策略探索的效率。

  • 統(tǒng)一的標(biāo)簽?zāi)P?/p>

為了治理項能快速發(fā)布和迭代,我們基于資產(chǎn)元數(shù)據(jù)構(gòu)建了資產(chǎn)對象的指標(biāo)字典和標(biāo)簽字典。例如成本治理中,原本成百上千的治理指標(biāo),被合并歸納成7個資產(chǎn)對象, 23個業(yè)務(wù)過程,160個標(biāo)簽。通過標(biāo)簽組合匹配的形式,治理策略的探索變成一項簡單事務(wù),即便一些新人也可快速上手輸出有效的治理清單。


(圖二十三 治理標(biāo)簽)


  • 統(tǒng)一的管控策略

QUOTA限制,是公司數(shù)據(jù)委員會上發(fā)布過的重磅管控策略之一。它起于存儲QUOTA,規(guī)定了業(yè)務(wù)部門的存儲用量達到該部門存儲QUOTA后,將觸發(fā)大數(shù)據(jù)資源使用限制,直至用量恢復(fù)到QUOTA以下。

23年多元化治理啟動后,QUOTA限制策略陸續(xù)將在離線計算、實時計算、傳輸流量等資源項上實施。同一套方案,多處實施,每一項資源只要明確QUOTA值與用量口徑,管控機制就可迅速上線。

同時,平臺也支持將這一策略分層實施,即公司層面對部門限制,部門層面對下屬工作空間限制。不僅是平臺運營人力得到釋放,業(yè)務(wù)部門的數(shù)據(jù)委員也因此受益。


(圖二十四 治理配額設(shè)計)


  • 統(tǒng)一的策略實施流程

資源治理的實施經(jīng)常是一些銷毀操作,而銷毀操作需要慎之又慎。為了兼顧快速與謹(jǐn)慎,平臺對銷毀操作制定了從消費任務(wù)到生產(chǎn)任務(wù)倒序關(guān)閉、每個步驟都可快速回滾的標(biāo)準(zhǔn)流程。該流程可使平臺并行鋪開多個批次的銷毀,又確保每個批次有足夠的時間觀察銷毀影響。

(圖二十五 治理實施流程:平臺定義SOP)



其二,用戶實施人效


用戶單位時間治理效果的提升,可以通過降低實施耗時、提升實施收益來實現(xiàn)。

  • 自動化工具沉淀,降低工時投入

由于不同資源治理由不同團隊推進,發(fā)布清單和操作工具不同,用戶需要面對多個溝通群,理解背景、獲取清單、學(xué)習(xí)如何處理的成本也很大。治理中心上線后,用戶的治理流程被抽象為接收治理中心的推送,通過推送信息進入問題清單,在問題清單進入對應(yīng)操作模塊,操作完回到治理中心查看效果,這樣簡單的操作框架。

(圖二十六 治理實施流程:用戶的工具操作流程)


同時,治理工具幫助用戶組織、排序清單,收益的順序、執(zhí)行前后依賴的順序等,讓用戶避免“對無熱度表實施壓縮”這樣的無效勞動。

  • 引擎、存儲的新技術(shù)引入,加大治理收益

22年間,大數(shù)據(jù)平臺先后引入了EC、Z-ORDER等新技術(shù),且由于其對生產(chǎn)鏈路近乎無損的實施方案,用戶只需簡單配置,甚至無需配置,即可實現(xiàn)存儲資源與計算資源的治理收益。

(圖二十七 治理新技術(shù) 壓縮、冷備技術(shù))


蛻變后的新目標(biāo)


(圖二十八 治理長期目標(biāo)方向)



通過從被動到主動,從單點到多元的演進,我們對23年的大數(shù)據(jù)資源治理目標(biāo)也有了新的展望。

  • 存儲方面,將繼續(xù)保持安全水位,做到以全年資源成本0增長來支持業(yè)務(wù)的增長。

  • 計算方面,將繼存儲之后上線QUOTA管控策略,從離線計算、實時計算雙線出擊,釋放異常任務(wù)占用的資源,提升單位成本的任務(wù)密度。

  • 流量方面,將同樣上線QUOTA管控策略,流量用量納入賬單分?jǐn)偅蛲寺顸c成本的上升勢頭。


后續(xù)規(guī)劃


最后,經(jīng)過數(shù)據(jù)治理這1年多工作總結(jié)和復(fù)盤,我們也規(guī)劃后續(xù)三個核心重點方向。


從成本關(guān)注轉(zhuǎn)為成本-價值關(guān)注


這個階段,平臺方僅關(guān)注資產(chǎn)項的成本,該資產(chǎn)項的業(yè)務(wù)價值,是由用戶主觀提供的。后續(xù),平臺會設(shè)計數(shù)據(jù)價值評估體系,以更客觀的方式描述數(shù)據(jù)價值,提升大數(shù)據(jù)資源的ROI。


從碎片治理到集成治理,持續(xù)拓展治理中心的集成能力


治理中心的問題攔截、發(fā)現(xiàn)、預(yù)警能力,和治理實施操作引導(dǎo),將持續(xù)覆蓋到所有大數(shù)據(jù)資產(chǎn)項、更多問題策略,提升治理運營效率。


引入新技術(shù),優(yōu)化數(shù)據(jù)生產(chǎn)、輸出鏈路


大數(shù)據(jù)平臺正在積極引入湖倉一體、oneservice(統(tǒng)一數(shù)據(jù)服務(wù))等業(yè)內(nèi)先進方案,旨在:

  • 提升單個生產(chǎn)鏈路的多場景復(fù)用性。

  • 提升數(shù)據(jù)、指標(biāo)產(chǎn)出的多應(yīng)用復(fù)用性。

B站的價值觀?中有這樣兩條?社區(qū)優(yōu)先、合作共贏,感謝 和B站各部門的伙伴們一起走上了這條大數(shù)據(jù)之路,期待咱們數(shù)委會的下一篇《B站大數(shù)據(jù)治理之路 2.0》!


實現(xiàn)億級費用減省,B站大數(shù)據(jù)治理之路的評論 (共 條)

分享到微博請遵守國家法律
眉山市| 融水| 专栏| 昆山市| 武威市| 林西县| 秭归县| 枝江市| 望谟县| 民乐县| 政和县| 通榆县| 扎赉特旗| 望城县| 潮州市| 许昌市| 佛学| 银川市| 桐乡市| 承德县| 曲麻莱县| 通化市| 永康市| 宁武县| 秦皇岛市| 连云港市| 当雄县| 社会| 九台市| 汨罗市| 彰化县| 吉隆县| 乳山市| 阜城县| 福建省| 名山县| 吕梁市| 凭祥市| 兴国县| 穆棱市| 金华市|