Obraz wart tysiąc liczb
Tabela z setkami liczb może być przytłaczająca. Ale ten sam zbiór danych przedstawiony na wykresie staje się zrozumiały w kilka sekund. Wykresy to jedno z najpotężniejszych narzędzi w statystyce - pomagają zobaczyć wzorce, trendy i anomalie, które w surowych danych są niewidoczne.
Wykres słupkowy
Idealny do porównywania kategorii. Każda kategoria ma słupek, którego wysokość (lub długość) odpowiada wartości.
GUS raportuje stopę bezrobocia według województw. Wykres słupkowy z 16 słupkami (po jednym na województwo) od razu pokazuje, które regiony mają najwyższe i najniższe bezrobocie. Na pierwszy rzut oka widzisz, że warmińsko-mazurskie ma najwyższe, a wielkopolskie najniższe.
Kiedy używać: porównywanie kategorii - sprzedaż produktów, wyniki drużyn, populacja miast.
Wykres kołowy
Pokazuje, jak całość dzieli się na części. Każdy "kawałek tortu" reprezentuje udział procentowy kategorii.
Struktura wydatków przeciętnego polskiego gospodarstwa domowego: żywność 25%, mieszkanie 22%, transport 10%, zdrowie 6%, edukacja 4%, inne 33%. Wykres kołowy natychmiast pokazuje, że żywność i mieszkanie pochłaniają prawie połowę budżetu.
Kiedy używać: pokazywanie udziałów w całości. Uwaga: unikaj wykresów kołowych z więcej niż 5-6 kategoriami - stają się nieczytelne.
Wykres liniowy
Idealny do pokazywania zmian w czasie. Punkty danych są połączone linią, co pozwala zobaczyć trendy.
Średnia temperatura w Warszawie w każdym miesiącu roku. Wykres liniowy wyraźnie pokazuje wzrost od stycznia do lipca i spadek z powrotem do grudnia. Widzisz sezonowość na pierwszy rzut oka.
Kiedy używać: dane zmieniające się w czasie - ceny, temperatury, sprzedaż miesięczna, kursy walut.
Histogram
Wygląda jak wykres słupkowy, ale jest czymś innym. Histogram pokazuje rozkład danych ciągłych - dzieli zakres wartości na przedziały i pokazuje, ile danych wpada do każdego przedziału.
Wyniki matury z matematyki 500 uczniów. Przedziały: 0-10%, 11-20%, 21-30%, ..., 91-100%. Histogram pokazuje, że większość uczniów uzyskała wyniki w przedziale 50-70%, a bardzo mało osób miało poniżej 20% lub powyżej 90%. Kształt histogramu przypomina krzywą dzwonową.
Kiedy używać: rozkład danych liczbowych - zarobki, wyniki testów, wzrost, wiek.
Wykres rozrzutu (punktowy)
Pokazuje związek między dwiema zmiennymi. Każdy punkt na wykresie reprezentuje jedną obserwację z wartościami obu zmiennych.
Na osi X: godziny nauki tygodniowo. Na osi Y: wynik matury. Każdy punkt to jeden uczeń. Jeśli punkty układają się w trend rosnący (im więcej nauki, tym lepszy wynik), widzisz pozytywny związek między zmiennymi.
Jak wykresy mogą kłamać
Wykresy to potężne narzędzia, ale mogą też być używane do manipulacji. Oto najczęstsze sztuczki:
- Obcięta oś Y: zamiast zaczynać od zera, oś zaczyna od np. 95, przez co mała różnica wygląda jak przepaść
- Nierówne skale: zmieniając proporcje osi, można sprawić, że trend wygląda na bardziej lub mniej stromy
- Brak kontekstu: pokazanie danych bez porównania może być mylące
Partia polityczna pokazuje wykres słupkowy: "Bezrobocie spadło z 5,2% do 5,0%!" Oś Y zaczyna się od 4,8%, więc słupek 5,0% wygląda na połowę słupka 5,2%. W rzeczywistości to spadek o 0,2 punktu procentowego - niewielki. Gdyby oś zaczynała się od 0%, różnica byłaby ledwo widoczna.
Różne typy wykresów służą różnym celom: słupkowe do porównywania kategorii, kołowe do udziałów, liniowe do trendów czasowych, histogramy do rozkładów, punktowe do związków między zmiennymi. Wykresy czynią dane zrozumiałymi, ale mogą też wprowadzać w błąd - zawsze sprawdzaj skalę osi i kontekst prezentowanych danych.