在线免费观看麻豆_国产+日韩+欧美_欧美色插_国产无限免费av在线播放_夜色阁亚洲一区二区三区_亚洲男女羞羞无遮挡久久丫

數據倉庫體系應該怎么規劃?
  • 更新時間:2025-05-04 11:30:30
  • 數倉開發
  • 發布時間:11個月前
  • 596

數倉規劃是數倉建設的藍圖,涵蓋從需求分析開始到最終的數倉評估驗收整個環境;數倉規劃之所以重要,是因為它是描述了數據流動的概念性框架,為元數據管理奠定了基礎,對數據加工過程的理解、數倉建設的交流分享、數據的使用和問題排查、數倉健康度的評估都提供了極大的幫助。

需要強調的是本文是從宏觀上描述數倉的框架,具體到數據模型的細節對比、存儲選型和管理、接入數據源管理等數倉建設的周邊在本節不涉及。通過本文的閱讀,你將了解到以下知識:

從業務矩陣的設計(宏觀、微觀)、橫向的分層、縱向的分線到主題劃分等角度解構數倉

數倉建設的實施流程

1數據倉庫規劃

矩陣

分宏觀和微觀來看,宏觀的是公司的整體業務布局,微觀的是產品的業務過程布局和業務過程的維度分解交叉信息。

宏觀矩陣

宏觀矩陣描述的是公司的業務線和對應的數據狀況,其行和列一般分別對應著業務主題和數據主題。

業務主題對應著公司的業務線布局,比如電商、游戲、視頻、應用商店、新聞資訊、瀏覽器等

數據主題根據抽象的程度和視角有不同的取法:

一般取業務線中用戶對內容的消費或者相關行為,比如曝光、點擊、消費、播放、分享等,對這些行為的劃分又可分為原生行為主題(通用和業務相關)、衍生行為主題(留存、活躍、流失等),這種劃分方法更多的取自數據的底層和公共層,因為高層的數據都是多行為的匯總。

對數據主題的另外劃分方式參加分主題部分,這種劃分方法更多的取自數據的高層

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

引自《數據倉庫實踐之業務數據矩陣的設計-木東居士》

微觀矩陣

微觀矩陣描述的是主題和對應的維度關系,下面以常見的內容消費和用戶主題兩個維度來看微觀矩陣的規劃

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

-w698

業務過程描述的一般是對內容的消費抽象,可以是原子的,也可以是抽象的,比如卡片曝光維度的劃分可以從以下兩個大方向入手:

通用標識維度(版本、機型、渠道、網絡、時間等)

業務過程維度:消費者等級、消費位置、消費路徑、其它等

分層

ODS->DW->DM->DA(ADS)層是如何劃分的?

清晰數據結構:每一個數據分層都有它的作用域和職責,在使用表的時候能更方便地定位和理解

減少重復開發:規范數據分層,開發一些通用的中間層數據,能夠減少極大的重復計算

統一數據口徑:通過數據分層,提供統一的數據出口,統一對外輸出的數據口徑

復雜問題簡單化:將一個復雜的任務分解成多個步驟來完成,每一層解決特定的問題

層劃分

一個完整數倉分層演示圖如下:

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

一個典型的數倉分層樣例:

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

-w730

分層依據

分層的依據在ods、da、dim層一般無歧義,關鍵在dw層的分層依據,也是數據倉庫分層建設的核心。

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

每層劃分的依據如下:

ods層:存放原始數據信息,原則上不進行任何的數據清晰,和數據源保持一致。

dw層:數據公共層,是數倉建設的重點,一般是日志子表和一些寬表,主要完成數據的清洗、轉換等

dm層:數據集市層,是最直接體系數據資產的層,一般是匯總數據,現在已經逐步弱化,面向挖掘、數據分析等

da層:數據應用層,高度匯總數據,主要用于報表展示。

分線

分線也分宏觀和微觀,宏觀的是整體的業務線,比如應用分發線、商業智能線、游戲運營線、廣告流量線等;微觀的是某個app或者某個具體的線,本節介紹的是app的數據線。分線和分主題有很多相似的地方,只是看待數據的角度不同,分主題是從數據內容分類和對外服務的角度看,類似商品分類;而分線是從數據生產加工過程的角度來看,類似業務生產流水線。

用戶主線

反映整個app的用戶規模,比如整個app的活躍、累積活躍、新增、留存、回流、流失。

用戶群線

滿足某些行為的用戶群的追蹤,目的是為了進行個性化的運營等活動,該線的升華擴展是用戶畫像。

內容消費

提供的消費實體的曝光、點擊、生成、轉化等,以及內容的累積消費、消費排行等都屬于內容線。

狀態線

一般會作為輔線存在,相當于維表的存在,狀態線一般又分為以下幾種:

1.天表全量用戶狀態,會加入一些修正,以及基于天全量的累積表的快照全量用戶信息維表;

2.開關操作狀態線。記錄開關狀態變更記錄,得到當前用戶的開關狀態快照,是多態記錄的一種特殊情況;

3.添加刪除狀態線。記錄用戶的添加刪除等操作,得到當前用戶操作結果的保有快照;

4.其它,比如登錄狀態、用戶等級等。

商業化線

商業化線相關的與收入相關的,比如cp合作、廣告位、推廣位、訂單、會員充值等;

需要說明的是本系列的數倉的主要介紹的是流量型產品形態、更多的是關注用戶規模,所以主線是是關于用戶的,而對于其它的產品形態,比如購物類、充值消費類的則主線可能是商業化線等。此外作為用戶流量型產品,還隱藏著另外一個更加常用的線:自查線,每個主題的自查明細表,基于event_id或者參數的展開,但是沒有參數值的組合過濾。(自查線這個似乎沒有必要)

下圖是一張數倉的分線演示圖,每個框是一張表,不同顏色的框串聯成各自的數倉線。

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

分主題

在進行分矩陣設計的時候牽涉到分行和列的業務主題,此處詳細介紹下數據主題的設計,本部分的設計是從高層次上的。

主題劃分的一些依據:業務過程(或子過程,比如訂單)、ER中的E(或者R,比如商品主題)、數據服務的對象(運營主題)、數據的用途(比如商業);分主題也即數據集市,根據業務形態的不同,會衍生出不同的主題,但以下主題在app中廣泛存在:

用戶主題(也即大盤:新增活躍、留存)

內容主題(具體提供的服務形式,也可以理解為產品主題,含曝光、點擊、分享等用戶消費傳播行為)

運營主題(可能合并到某個內容主題上,比如活動、通知、彈窗、授權、分享等)

商業化主題(廣告、訂單等通常用于結算)

技術主題(故障率、崩潰率、準確率等衡量技術指標)

備注:

社交主題可以合并到內容主題也可以合并到運營主題,需要視app的具體特性和重視程度確定

數倉的分主題主要體現在數據集市層,而數據集市層可能會因為使用比如kylin等多維分析工具被弱化。

用戶主題

用戶主題是產品的盤子,就像家店鋪,多少人使用就像多少顧客。基于用戶主題的常見統計有整體的新增、活躍、累積活躍、新增留存、活躍留存等大盤數據,以及對某些關鍵行為的用戶的后續追蹤,還有某些核心過程的PUV、轉化漏斗等。

內容主題

內容主題是盤子里東西的消費狀況,就像提供的菜單,每個菜被多少人點了。基于內容主題的常見統計有針對內容(文章、視頻、商品等)的各種消費行為(曝光、點擊、購買、下載等)的次數、人數、時長、金額等按不同維度的度量統計。常見的維度拆分有時間拆分、地域拆分、位置(人貨場模型中的場)拆分、畫像拆分、渠道拆分等,對度量的統計又有累積、非累積、TopN等。

運營主題

廣告、促銷、活動等一切由于運營活動相關本身的數據統計,以及運營活動對其它主題數據的影響衡量。

營收主題

營收的來源主要分為以下幾種:

流量廣告

商務合作

優惠券

充值消費

會員充值

訂單、打賞等

流量廣告的數據主要產生于用戶行為,而充值消費的數據主要來自業務庫相關。

以上四個主題是在常見應用上通用的主題,其它的主題比如技術主題,在某些有明顯的技術指標對比的產品上會占主要的地位,比如文字識別類應用的識別準確率、搜索類產品的搜索滿意度、語音智能助理類的會話完成率等。這些產品上技術指標和用戶的體驗密切相關,是產品未來發展重要的參考方向,因此會強化出來做數據主題。另外如引流類或者與其他app有頻繁的引流拉起等應用的數據體系建設上,也會單獨拿出跳轉對接數據做主題分析。總之,主題的劃分并不是確定不變的,需要根據業務的具體形態和重點度量的指標等進行建設。

以上的矩陣、分層、分線、分主題的規劃只是從不同的角度來看數據框架,本質都是對數據流圖的一種拆解,差異在拆解的數據視角。

數據倉庫體系的規劃建設,數據倉庫分層設計,數倉規劃與數倉建設,業務矩陣

2數據倉庫實施

需求分析

了解業務過程,每個業務過程的參與實體和各實體可能的分析維度等信息; 了解數據源組成,有哪些數據源、數據的更新周期;預構建指標體系,了解指標的分類,分析維度、時效性要求;了解可能的擴展需求,比如畫像寬表。需求分析階段是建立數倉的概念模型,明白數倉要支持的大致需求,雖然數倉建設并不要完全滿足業務需求,在建設的過程中肯定要有取舍,但第一步進行需求分析能保證在數倉建設過程中不致于偏離目標太多,避免建設爛尾或者好看不好用的繡花枕頭

指標體系

此部分會另外開專題介紹,指標體系一般分為三類:

用戶增長體系

流量體系

營收體系

每個體系內分析數據的維度、更新周期等。指標體系的建立是需求分析環節需要重點完成的一步。

模型選擇

模型選擇環節要根據需求分析階段的結論,在ER模型、維度建模等基本的建模思想中選擇一種建模思想,比如說選擇了維度建模,要進一步根據需求分析中相關的業務過程和維度視角,在星型模型、雪花模型、星座模型中選擇一種模式。這個過程要充分的結合業務的實際狀況、開發人力和成本、各模型的優缺點等因素進行綜合分析,是關系到建模是否成功的關鍵環節。需要說明的是,在快速迭代的互聯網行業,業務規則可能經常變化,而對于不同粒度水平進行度量和監控,進而快速響應的需求卻基本保持不變,比如層級的時間粒度(年、月、周、日、小時)、層級的地理粒度(大區、省、市、區縣、商圈)以及基于產品自身屬性的層級粒度(大類、子類)。基于這種特性,互聯網行業中廣泛采用維度建模的思想,同時為了使用的方便,又以星型模型和雪花模型較多。

標準規劃

標準規劃是對數倉建設過程各階段中涉及的對象、屬性、關系、鍵、交付物等進行規范定義,同時制定標準落地方式或者檢查的方式。比如表命名規范、字段命名規范、任務命名規范、調度依賴規范、代碼開發規范等。需求強調的是,這一步看似無關緊要,也往往直接被忽略跳過,但好的標準規劃能為建設高質量數倉的保駕護航,對數倉質量、健康度的保持都大有裨益。

開發部署

包含表設計、代碼開發、調度開發和告警開發等

事實表和維表設計

維表設計

代碼開發

流程、審核機制、回退機制

調度開發

依賴任務的配置

回跑機制

任務權限管理

告警開發:

數據量異常,某些細分維度、字段值、計算指標異常的告警措施

任務失敗、等待超時、執行超時、上下線、上游重跑等告警措施

開發部署階段完成了數倉建設的邏輯模型和物理模型設計階段,是數倉建設的主要工作內容。

評估驗收

對應的問題包含在相關問題介紹部分,需要進一步思考數倉開發的交付物是什么。

數據字典

指標口徑的定義

核心表和其用途

數據流圖和重要指標的出口

業務變動對數倉的影響,比如某些手工維護的維表需要根據業務變動進行相應的更新

3總結

本篇從業務矩陣、分層、分線和分主題等方面對數倉的規劃做了簡要的描述。這些方面的差異只在于剖析數倉的角度,其目的是一致的,即為了清晰地梳理數據體系、洞察數據狀態、以及更好地規劃未來數據地圖,從而更好的服務于各個業務需求方(BI報表、數據分析、用戶畫像等);本節最后簡要的介紹了數倉開發的基本流程。


我們專注高端建站,小程序開發、軟件系統定制開發、BUG修復、物聯網開發、各類API接口對接開發等。十余年開發經驗,每一個項目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!

本文章出于推來客官網,轉載請表明原文地址:https://www.tlkjt.com/sc/18440.html

在線客服

掃碼聯系客服

3985758

回到頂部

主站蜘蛛池模板: 欧洲亚洲免费视频_99久久久久久久_91综合网站_在线观看国产h_亚州国产_欧洲久久久久_国产精品毛片一区_欧美白丰满老太aaa片 | 美女一级特黄大片_亚洲中文字幕无码AV正片_亚洲性区_国产黄色大片在线免费观看_日本国产欧美_草草影院国产_香港三级韩国三级日本三级国产_亚洲AV成人无码人在线观看堂 | 新91在线观看_久久中文字幕亚洲精品最新_AⅤ无码国产在线看_久青草国产在视频在线观看_免费h片在线观看_国产精品美女视频免费午夜版_猫咪成人官网_成人免费午夜视频69影院 | 色视频线观看在线播放_日日爱699_日韩中文一区二区_1234区中文字幕在线观看_免费观看无码不卡av_国模激情_毛片女女女女女女女毛_亚洲三及片 | 在线精品一卡乱码免费_女同久久另类99精品蜜臀_亚洲欧美国产免费综合视频_91精品天堂福利在线观看_国产成人久久久77777_秋霞午夜日韩免费毛片_国产乱妇无码大片在线观看_青娱乐超碰在线91 | 国产免费一区二区三区VR_亚洲AV无码不卡无码_美女裸体无遮挡免费视频网站_亚洲AV无码成H在线观看_国产免国产免费_久久无码字幕中文久久无码_精品一区二区久久久久久久网站_美女让男人桶爽免费视频 | 久久AV喷潮久久AV高清_99久久精品国_亚洲aⅴ综合av国产八av_麻豆精品无码国产在线果冻_丝袜高潮流白浆潮喷在线播放_亚洲欧洲国产综合AⅤ无码_131美女MM爱做爽爽爽视频_国产视色 | 日韩成人高清_精品韩国三级在线观看视频_天堂中文在线资源_久久久久91_最近最新中文第一页_日本丰满大乳无码免费看_日本韩国视频在线观看_无码人妻久久一区二区三区 | 日本妇人成熟免费视频_国产一三四2021不卡_亚洲黄色小说视频_高清av网址_欧美性影院_女人被爽到呻吟GIF动态图_国产精品自在_日本少妇xxxx软件 | 欧美精品一区二区视频_97超碰人人爱香蕉精品_成年人在线免费_黄瓜视频在线免费欧美日韩在线看_成人av大全_国产精品免费看_国产精品偷伦视频播放_国产欧美日韩亚洲一区二区三区 | 欧美精品一二三区免费_性大片爱赏网免费观看_久久免费视频5_亚洲AV无码一区二区三区国产_亚洲国产成人精品在线_久草在线视频网_四虎5151久久欧美毛片_性xxxx欧美老妇胖老太269 | 国产精品日韩一区二区三区_vps私人毛片_欧美younv交_免费观看韩国理论片_国产精品一二三区视频出来一_粉嫩饱饱鱼一线天在线观看_国模少妇一区二区三区咪咕_日日做夜狠狠爱欧美黑人 | 久久久久高清视频_52avaⅴ我爱haose免费视频_亚洲日韩成人性av网站_黄色影视免费看_JVID亚洲精品无圣光图套_久久国产欧美一区二区精品爱欲_国产精品96久久久久久久_亚洲天堂区 | 少妇MM被擦出白浆液视频_成人三级做爰视频在线看_福利视频在线看_在线视频观看一区_国产精品久久久久一区二_大学生疯狂高潮呻吟免费视频_1000部禁片未18勿进免费观看_www视频在线观看免费 | 狠狠操综合_99热这里只有精品5_国产aⅴ精品_日本在线视频www色_97夜夜澡人人波多野结衣_欧美一级一区二区三区_国产精品自拍系列_日韩精品免费综合视频在线播放 | 佐野ゆいな在线播放_人人看97_成年人在线播放_国产一区二区三区不卡av_精品人妻无码一区二区三区在线_2022精品久久久久久中文字幕_国产亚洲一卡2卡3卡4卡老狼_毛片24种姿势无遮无拦 | 日韩1区在线_久久精品最新_麻豆乱码国产二区三区使用方法_狠狠天天_wwwxxxx中国_国产又猛又黄又爽三男一女_欧美变态另类ZOZO_亚洲成A人片在线观看国产 | 国产精品自在拍视频首页_中文字幕乱码亚洲无线码按摩_成人激情视频在线观看_www.四虎com_国产在线视频99_2002亚洲精品真实在线_国产精选在线播放_色先锋影音岛国av资源 | 国产免费一区二区三区VR_亚洲AV无码不卡无码_美女裸体无遮挡免费视频网站_亚洲AV无码成H在线观看_国产免国产免费_久久无码字幕中文久久无码_精品一区二区久久久久久久网站_美女让男人桶爽免费视频 | 欧美日韩中文亚洲_国产有码在线_亚洲精品小视频在线观看_久久精品一级片_丰满人妻一区二区三区视频53_亚洲一区二区av在线_欧美一级片黄色_直接看的69xxx | 亚洲国产精品成人综合色在线_中文字幕国语版毛片免费_精品视频第一页_国内高清久久久久久_亚洲精品国产suv_成人毛片视频免费_欧美成人综合视频_一区二区三区在线 | 亚洲日韩久久精品无码蜜桃臀_日韩v在线_欧美女优在线观看_神马香蕉久久_阳茎伸入女人阳道视频免费_久久国产精品二国产精品_少妇88久久中文字幕_黄色av片三级三级三级免费看 | 色欲视频综合免费天天_麻豆网站在线看_久久久久久久久久一区二区_91国内视频在线_欧美毛多水多肥妇_无码裸模视频在线观看_国产精品久人妻精品老妇_a级毛片免费 | 成人97精品毛片免费看_中国china体内裑精亚洲片_jiujiure国产_宅男在线免费视频_精品视频久久_日本伊人中文字幕_女子被狂揉下部羞羞图片_精品久久香蕉国产线看观看亚洲 | 佐野ゆいな在线播放_人人看97_成年人在线播放_国产一区二区三区不卡av_精品人妻无码一区二区三区在线_2022精品久久久久久中文字幕_国产亚洲一卡2卡3卡4卡老狼_毛片24种姿势无遮无拦 | 色欲AV蜜桃一区二区三_日韩激情中文字幕_亚洲一区二区三区免费看_日韩深夜视频_国产精品久国产精品_久久福利视频一区_日本高清WWW午色夜在线视频_人与性动交AAAABBBB视频 | 九九热九九_日韩精品一区二区三区九九_热久久思思_精品人妻系列无码一区二区三区_超碰福利在线_成人免费视频观看视频_免费无码黄动漫在线观看_欧美一区在线观看视频 | 欧洲亚洲免费视频_99久久久久久久_91综合网站_在线观看国产h_亚州国产_欧洲久久久久_国产精品毛片一区_欧美白丰满老太aaa片 | 91福利网址_成人在线观看影院_欧产日产国产精品v_成人做爰高潮片免费视频_真实国产乱子伦对白视频不卡_国产色综合久久无码有码_黄色av毛片_亚洲精品aⅴ | 夜夜揉揉日日人人视频_秋霞成人午夜伦在线观看_jizz在线观看免费_91大神精品在线_国产精品精品国产_成年肉动漫在线观看无码中文_老熟女重囗味HDXX70星空_久久久久久久久影院 | 精品一区二区三区91_国产黄网在线_国产精品熟妇一区二区三区四区_亚洲αv在线精品糸列_无遮挡边摸边吃奶边做的视频刺激_在线免费观看h视频_狠狠爱网_免费无码AV片在线观看软件 | 91精彩视频_青草在线视频_69精品_女人18毛片水最多_噜啊噜在线成人A片观看_97色碰碰公开视频_色女人综合_成人在线视频一区 | 亚洲人成小说网站色_免费在线看黄色_久久久久久亚洲精品_一个人看的www免费观看视频_亚洲欧洲日本国产_不卡久久_性生交大片免费全毛片_兔子先生高清在线观看 | 无码人妻久久一区二区三区蜜桃_av免费网站_男人戳女人戳到爽视频_在线中文字幕精品第5页_国产一级在线观看视频_成人一级_成年人免费在线看惊悚片动作片_色欲色av免费观看 | 老头天天吃我奶躁我的视频_男人的天堂AV亚洲一区2区_亚洲高清不卡视频_超碰在线c_亚洲A∨无码男人的天堂_无码色av一二区在线播放_99热最新精品_国产裸体视频网站 | brazzershd欧美情趣丝袜_一区二区国产在线观看_亚洲国产精品点击进入_免费一二三区_自拍偷拍亚洲一区_亚洲国产精品一区二区美利坚_好男人在线社区www在线影院_亚洲国产成人精品女人久久久 | 91在线免费观看网站_欧美一区二区三区xxxx监狱_成人国产片免费_日韩一二区在线观看_亚洲国产精品不卡av在线_97澡人人澡人澡人人澡天天_五月婷av综合网色伊人苍井空_四虎WWW成人影院观看 | 性色av蜜臀av色欲av_脱了老师内裤猛烈进入的软件_中文亚洲AV片在线观看无码_a毛片视频_日韩视频在线观看一区二区三区_av大片在线无码免费_理论片91_99精品全国免费观看视频 | 久久久夜色精品亚洲a_亚州精品成人_91视频网入口_亚洲成人色图网_亚洲中文字幕av无码区_日韩免费观看av_国产伦理精品_谍战剧惊弦免费观看 | 欧美日韩一区在线播放_亚洲高清人人爽夜夜爽AV毛片_亚洲成在人线aⅴ免费毛片_亚洲区一区二区_欧美破苞系列二十三_国产初高中生视频在线观看_午夜性又黄又爽免费看尤物_国产精品亚洲第一区在线暖暖韩国 | 超碰人人在_成人视频在线观看_国产伦理久久久久久妇女_chinese国产hd中国熟女_中日韩一级片_亚洲精品ww久久久久久p站_欧美在线视频一区二区三区_小荡货腿张开让我cao爽视频 |