數據庫和數據倉庫這幾個字看起來都差不多,不就多個倉字嘛,又不是多了蒼老師? 從本質上來說,數據庫和數據倉庫都是數據的集合。沒什么不同。 但是它們...

收錄了32篇文章 · 169人關注
數據庫和數據倉庫這幾個字看起來都差不多,不就多個倉字嘛,又不是多了蒼老師? 從本質上來說,數據庫和數據倉庫都是數據的集合。沒什么不同。 但是它們...
在使用Hive搭建數據倉庫,處理數據時,同傳統數倉的結構化數據不同,我們經常會遇到一些非結構化的數據,json格式的字符串就是常見的一種類型。對...
PS:無法復制表格樣式,只能截圖了
大數據數倉的性能優化主要圍繞以下四個方面: 調度優化 模型優化 同步任務優化 計算任務優化下面將對著四方面的優化方法進行具體闡述。 調度優化 在...
數據倉庫(Data Warehouse ) 1.1 基本概念 數據倉庫的目的是構建面向分析的集成化的數據環境, 為企業提供決策支持 (Decis...
前篇傳送門:http://www.lxweimin.com/p/5ffd8730aad8 目錄 Prologue(見前篇) Kudu的初衷(見前...
Prologue join是我們這些整天與數據打交道的人繞不開的一個詞,不管是在傳統的關系型數據庫,還是在大數據領域的數據倉庫/數據湖中,joi...
后篇傳送門:http://www.lxweimin.com/p/24bdc6f62e84 目錄 Prologue Kudu的初衷 集群架構與共識...
1、ETL和ELT ETL是Extract、Transfrom、Load即抽取、轉換、加載三個英文單詞首字母的集合: E:抽取,從源系統(Sou...
畢業后做了7年java應用開發,主要在一家傳統軟件公司做BI相關的東西。因為主要是寫業務代碼,大公司都有自己的技術平臺,所以java技術也...