Wykresy i diagramy

Poziom trudności: Początkujący Czas czytania: 10 minut

Obraz wart tysiąc liczb

Tabela z setkami liczb może być przytłaczająca. Ale ten sam zbiór danych przedstawiony na wykresie staje się zrozumiały w kilka sekund. Wykresy to jedno z najpotężniejszych narzędzi w statystyce - pomagają zobaczyć wzorce, trendy i anomalie, które w surowych danych są niewidoczne.

12 Pon 19 Wt 8 Śr 25 Czw 15 Pt

Wykres słupkowy

Idealny do porównywania kategorii. Każda kategoria ma słupek, którego wysokość (lub długość) odpowiada wartości.

Przykład

GUS raportuje stopę bezrobocia według województw. Wykres słupkowy z 16 słupkami (po jednym na województwo) od razu pokazuje, które regiony mają najwyższe i najniższe bezrobocie. Na pierwszy rzut oka widzisz, że warmińsko-mazurskie ma najwyższe, a wielkopolskie najniższe.

Kiedy używać: porównywanie kategorii - sprzedaż produktów, wyniki drużyn, populacja miast.

Wykres kołowy

Pokazuje, jak całość dzieli się na części. Każdy "kawałek tortu" reprezentuje udział procentowy kategorii.

20 30 40 50 60 70 80
Przykład

Struktura wydatków przeciętnego polskiego gospodarstwa domowego: żywność 25%, mieszkanie 22%, transport 10%, zdrowie 6%, edukacja 4%, inne 33%. Wykres kołowy natychmiast pokazuje, że żywność i mieszkanie pochłaniają prawie połowę budżetu.

Kiedy używać: pokazywanie udziałów w całości. Uwaga: unikaj wykresów kołowych z więcej niż 5-6 kategoriami - stają się nieczytelne.

Wykres liniowy

Idealny do pokazywania zmian w czasie. Punkty danych są połączone linią, co pozwala zobaczyć trendy.

Przykład

Średnia temperatura w Warszawie w każdym miesiącu roku. Wykres liniowy wyraźnie pokazuje wzrost od stycznia do lipca i spadek z powrotem do grudnia. Widzisz sezonowość na pierwszy rzut oka.

Kiedy używać: dane zmieniające się w czasie - ceny, temperatury, sprzedaż miesięczna, kursy walut.

Histogram

Wygląda jak wykres słupkowy, ale jest czymś innym. Histogram pokazuje rozkład danych ciągłych - dzieli zakres wartości na przedziały i pokazuje, ile danych wpada do każdego przedziału.

0 7 14 21 28 35 0-10 10-20 20-30 30-40 40-50 50-60 60-70
Przykład

Wyniki matury z matematyki 500 uczniów. Przedziały: 0-10%, 11-20%, 21-30%, ..., 91-100%. Histogram pokazuje, że większość uczniów uzyskała wyniki w przedziale 50-70%, a bardzo mało osób miało poniżej 20% lub powyżej 90%. Kształt histogramu przypomina krzywą dzwonową.

Kiedy używać: rozkład danych liczbowych - zarobki, wyniki testów, wzrost, wiek.

Wykres rozrzutu (punktowy)

Pokazuje związek między dwiema zmiennymi. Każdy punkt na wykresie reprezentuje jedną obserwację z wartościami obu zmiennych.

Przykład

Na osi X: godziny nauki tygodniowo. Na osi Y: wynik matury. Każdy punkt to jeden uczeń. Jeśli punkty układają się w trend rosnący (im więcej nauki, tym lepszy wynik), widzisz pozytywny związek między zmiennymi.

Jak wykresy mogą kłamać

Wykresy to potężne narzędzia, ale mogą też być używane do manipulacji. Oto najczęstsze sztuczki:

  • Obcięta oś Y: zamiast zaczynać od zera, oś zaczyna od np. 95, przez co mała różnica wygląda jak przepaść
  • Nierówne skale: zmieniając proporcje osi, można sprawić, że trend wygląda na bardziej lub mniej stromy
  • Brak kontekstu: pokazanie danych bez porównania może być mylące
Przykład

Partia polityczna pokazuje wykres słupkowy: "Bezrobocie spadło z 5,2% do 5,0%!" Oś Y zaczyna się od 4,8%, więc słupek 5,0% wygląda na połowę słupka 5,2%. W rzeczywistości to spadek o 0,2 punktu procentowego - niewielki. Gdyby oś zaczynała się od 0%, różnica byłaby ledwo widoczna.

Kluczowy wniosek

Różne typy wykresów służą różnym celom: słupkowe do porównywania kategorii, kołowe do udziałów, liniowe do trendów czasowych, histogramy do rozkładów, punktowe do związków między zmiennymi. Wykresy czynią dane zrozumiałymi, ale mogą też wprowadzać w błąd - zawsze sprawdzaj skalę osi i kontekst prezentowanych danych.