數據可視化是將數據信息梳理整合后圖形化,將數據的內在聯系和其意義更清晰高效表達的手段。圖表設計是數據可視化最基礎常見的應用,形式也不少,前段時間恰好做了有關于圖表設計的項目,對各種圖表的分類、適用情況及其特點有一些思考,寫篇短文,聊以記載:)
圖表的形式,根據形式來區分的話,比較主要的類型有有線型圖、柱狀圖、餅圖、雷達圖及極坐標圖這么幾類,在這里也只對這幾種類型畫簡圖進行分析。
A.線型圖
線型圖,直接將數據的變量和值標記在二維坐標系上而后連線,是最為常見的圖表形式。能將這些點直接相連,說明變量(即x)是有連續性的,而最常見的有連續性的日常概念,是時間。所以線型圖是特別適合(也可以說幾乎是僅適合)用來表達一些值隨著時間的變化而變化的圖。
當然也曾見過利用線型圖表現類似不同人或者不同地區的數值變化,個人認為嚴格意義上來看,是不夠嚴謹的,不知算不算是理科生思維在作祟:)
折線圖、曲線圖,線型圖的兩個最基礎形式。
雙折線(多折線),直觀的表現變量的變化趨勢并呈現之間的對比關系。實際涉及到多變量,從展示上來說,最好選用對比色來表示每一項,增強識別性。
線型圖以點連線來表現趨勢,難免會有線條的單薄感,在線條交錯與線條較多的情況下識別性會變差,而且在較開闊場合展示時也會比較難看清。在這些情況下,將線型圖表現為面積圖的形式是比較合理的。值得注意的還有一點,除非能保證所有變量的變化趨勢完全一致,否則還是讓面積圖有一定透明度。
區間圖這種表現形式比較少見,但也確實見過這種形式。以折線間的距離和面積來表現區間,倒不如用柱狀圖表現的分明,同一數據對應的兩個值比較難建立良好的聯系對應關系,區間概念表達的很含糊。
垂線圖是很適合平面展示數據的方式。平面圖表不可交互,不用y軸,而是更為直觀的把對應數值寫在數據點旁邊,再通過垂線使數據與x軸概念聯系性和對應感增強。
B.柱狀圖
柱狀圖中,每項獨立開、以高度或長度來表示數值,可以說是最常見也最為靈活的一種圖表形式,能表達的概念非常多,應用場景也非常多。
圖B1中展示了最常見的兩種柱狀圖的形式……橫的和豎的:)
最基礎的形式之下,當然也有少許變形,如圖B2所示,不管如何優化改變外形,“每項獨立”與“以高度或長度表示數值”這兩者不變的話,就依然是柱狀圖。
柱狀圖也可以用來表現折線圖的特長——時間相關的圖表。在表示時間圖表時,折線圖和柱狀圖各有千秋:折線圖重在凸顯數值隨時間的變化趨勢,柱狀圖把每個時段分開重在互相比較。
表達兩者比較概念、自身比較概念。
表示對比概念。
柱狀圖一個“柱”可以表達多個數據:可通過上下位置表示范圍概念,最常見的應用如k線圖;也可通過柱內數據堆積整合,同時觀察整體變化與部分所占比重與變化趨勢。
C.餅圖
餅圖,將一個圓自12點方向開始劃分為若干個扇形,以每塊的面積來表示數據。它的專用場景,是用來表示比例,能方便直觀的表現局部和整體的關系。
餅圖適合表現怎樣的比例數據呢?最好是所分份數不多、且某一份獨占鰲頭分去一大塊,這樣的話,餅圖就能明確凸顯其中數據對比,將要強調的這塊兒直觀的表現了出來。這也反過來說明,分類數過多或每一份數據都相近的話,其實不適合用餅圖來呈現,可以考慮數據是否可進行整合或者換成別的數據表現形式。
環圖是餅圖的非常實用的一種變形。
可以說環圖兼具餅圖和柱狀圖的特點,保留了餅圖“圓”=“100%”的概念,用圓弧長度表現部分在整體中所占份額,中間又留出空隙給一些相關內容,可以說是相當實用了。
在有的應用場景下,圓形在排版時可能有點尷尬——中間飽滿、四周空缺,有點難處理。應用缺口環圖就能回避這個問題,但缺口環圖,還能很好的表現比例關系嗎?我想是不適合的,它只能稱之為彎曲的柱狀圖,環圖一旦缺口,“圓”=“100%”的意義就已經失去了,圖中繪制了一個反例。
環圖的優點也在于具有可疊加性。環圖疊環圖或者餅圖都不成問題,可實現多個數據的對比或某一數據的內部細分,在這一點上環圖其實可以說是彎曲的柱狀圖,有柱狀圖的概念和功能,但又有疊來起來是“100%”的整體概念。
D.雷達圖
雷達圖可以說是一種特別的折線圖。坐標變形,以某一物體或主題為核心,將與其相關的多個量的值標出,首尾相連形成折線。
在這里首尾連線并不代表連續性,而只是要通過連線形成的圖形,觀察比對數據的傾向性。
? ?E.極坐標圖
極坐標圖可以說又是一種特殊的雷達圖。
區別只在于,它的坐標軸不再是直接相連的蛛網形而是圓形,所以它又自然而然的有了圓的特性,最適合用來表現角度、方位相關概念,如風玫瑰圖。
圖表設計誠然是非常好的數據可視化方式,但在做具體數據項目,難免還是會遇到一些問題。也正是對這些問題的思考,讓呈現出來的數據不斷優化、愈加清晰。在我的學習和思考過程中,除了對各種圖表的分類和適用進行明確了之外,更重要的是跳出具體圖表,對運用圖表這件事有了一些界定:
其一,圖表表達要真誠。這是最為基礎的一點,有時巧妙微調圖表就能造成理解偏差成功誤導讀者,《統計數據會撒謊》一書中有不少此類案例,如果連真誠也做不到,那表達就無意義;
其二,圖表制作要克制。圖表的第一追求是信息傳達清晰完整,所以設計圖表時一定要克制,對著做出來的效果要常反躬自問“這樣是否有助于區分和閱讀?”,力求做到數據墨水比例最高;
其三,圖表有其局限性。雖然在有的情況,“有個圖”會顯得比較好,但在數據過多、偏差不大等情況下,還是需要考慮是不是用表格直接呈現數據更合適。
愿我在以后做數據項目時,依然謹記這三條,時時敲打自己:)
愿大家都能作出更棒的數據圖表:)