Mediana jest jednym z podstawowych pojęć w statystyce opisowej. Pozwala w prosty sposób odpowiedzieć na pytanie: „Jaka wartość jest po środku moich danych?”. W przeciwieństwie do średniej arytmetycznej, mediana jest odporna na pojedyncze skrajne wyniki (tzw. wartości odstające), dlatego często lepiej opisuje „typową” wartość w zbiorze.
Co to jest mediana? Intuicyjne wyjaśnienie
Wyobraź sobie, że masz kilka liczb – mogą to być na przykład:
- wyniki sprawdzianu w klasie,
- wzrost uczniów,
- zarobki pracowników w firmie.
Jeśli wszystkie te wartości ustawisz w kolejności od najmniejszej do największej, mediana to taka wartość, która znajduje się dokładnie w środku:
- po lewej ma tyle samo wartości, co po prawej,
- połowa danych jest mniejsza lub równa medianie,
- połowa danych jest większa lub równa medianie.
Formalnie, jeśli mamy zbiór danych (np. liczb):
\\( x\_1, x\_2, \dots, x\_n \\)
to najpierw porządkujemy je rosnąco:
\\( x\_{(1)} \le x\_{(2)} \le \dots \le x\_{(n)} \\)
(nawiasy okrągłe przy indeksie oznaczają, że liczby są już uporządkowane).
Definicja mediany
Rozróżniamy dwa przypadki: gdy liczba obserwacji \\(n\\) jest nieparzysta oraz gdy jest parzysta.
Przypadek 1: liczba obserwacji jest nieparzysta
Jeśli liczba danych jest nieparzysta (np. 5, 7, 9…), to istnieje jedna wartość dokładnie w środku. Wtedy:
\\[ \text{Mediana} = x\_{\left(\frac{n+1}{2}\right)} \\]
Przykład:
Dane (np. liczba książek przeczytanych w miesiącu przez 7 osób):
\\( 3,\ 0,\ 5,\ 2,\ 4,\ 1,\ 2 \\)
- Porządkujemy dane rosnąco:
\\( 0,\ 1,\ 2,\ 2,\ 3,\ 4,\ 5 \\) - Jest 7 liczb, więc \\(n = 7\\), czyli \\( \frac{n+1}{2} = \frac{7+1}{2} = 4 \\).
- Mediana to 4. element w uporządkowanym szeregu:
\\( x\_{(4)} = 2 \\)
Mediana = 2
Przypadek 2: liczba obserwacji jest parzysta
Jeśli liczba danych jest parzysta (np. 4, 6, 10…), to środek wypada „pomiędzy” dwiema wartościami. Wtedy mediana jest średnią arytmetyczną dwóch środkowych liczb.
\\[ \text{Mediana} = \frac{x\_{\left(\frac{n}{2}\right)} + x\_{\left(\frac{n}{2} + 1\right)}}{2} \\]
Przykład:
Dane (np. liczba godzin snu 6 osób):
\\( 6,\ 8,\ 7,\ 5,\ 9,\ 4 \\)
- Porządkujemy dane rosnąco:
\\( 4,\ 5,\ 6,\ 7,\ 8,\ 9 \\) - Jest 6 liczb, więc \\(n = 6\\).
- Dwie środkowe liczby to:
\\( x\_{(3)} = 6 \\) oraz \\( x\_{(4)} = 7 \\). - Mediana to ich średnia:
\\[
\text{Mediana} = \frac{6 + 7}{2} = \frac{13}{2} = 6{,}5
\\]
Mediana = 6,5
Krok po kroku: jak obliczyć medianę?
Poniżej znajduje się uniwersalna procedura obliczania mediany dla danych pojedynczych (lista liczb).
- Zbierz dane
Zapisz wszystkie wartości (np. wyniki, zarobki, czas, odległości…). - Uporządkuj dane rosnąco
Od najmniejszej do największej. To najważniejszy krok – bez porządkowania nie da się poprawnie znaleźć mediany. - Policz, ile masz danych
Oznacz tę liczbę przez \\(n\\). - Sprawdź, czy \\(n\\) jest parzyste czy nieparzyste.
- Jeśli \\(n\\) jest nieparzyste – oblicz \\(k = \frac{n+1}{2}\\). Mediana to \\(k\\)-ta wartość w uporządkowanym szeregu.
- Jeśli \\(n\\) jest parzyste – znajdź dwie środkowe wartości: \\(x\_{(\frac{n}{2})}\\) i \\(x\_{(\frac{n}{2}+1)}\\), a następnie policz ich średnią.
Prosty przykład krok po kroku
Dane (np. liczba punktów zdobytych przez 9 uczniów):
\\( 10,\ 15,\ 8,\ 18,\ 12,\ 14,\ 16,\ 11,\ 13 \\)
- Porządkujemy dane rosnąco:
\\( 8,\ 10,\ 11,\ 12,\ 13,\ 14,\ 15,\ 16,\ 18 \\) - Jest 9 danych, więc \\(n = 9\\), nieparzyste.
- Pozycja mediany:
\\[
k = \frac{n+1}{2} = \frac{9+1}{2} = \frac{10}{2} = 5
\\] - Mediana to 5. element w uporządkowanym szeregu:
\\( x\_{(5)} = 13 \\).
Mediana = 13
Mediana a średnia – czym się różnią?
W statystyce bardzo często używa się zarówno mediany, jak i średniej arytmetycznej. Warto zrozumieć, czym się różnią.
Średnia arytmetyczna
Średnia arytmetyczna to „zwykła” średnia, czyli:
\\[ \overline{x} = \frac{x\_1 + x\_2 + \dots + x\_n}{n} \\]
Do jej obliczenia używamy wszystkich wartości i je sumujemy.
Mediana
Mediana to wartość środkowa po uporządkowaniu danych. Nie zależy od tego, jak bardzo duże lub małe są skrajne wartości – liczy się tylko pozycja w szeregu.
Porównanie mediany i średniej
| Cecha | Średnia arytmetyczna | Mediana |
|---|---|---|
| Sposób obliczania | Suma wszystkich wartości podzielona przez ich liczbę | Wartość środkowa w uporządkowanym szeregu (lub średnia dwóch środkowych) |
| Wrażliwość na wartości skrajne | Wysoka – kilka bardzo dużych lub bardzo małych wartości może mocno ją zmienić | Niska – pojedyncze wartości skrajne zwykle nie przesuwają mediany |
| Przykład zastosowania | Średni wynik z testu w klasie, średnia prędkość, przeciętny wzrost | Typowa wysokość zarobków, „przeciętny” czas dojazdu, środkowa cena mieszkań |
Przykład różnicy między medianą a średnią
Załóżmy, że zarobki 5 osób w firmie wynoszą (w tysiącach złotych):
\\( 3,\ 3,\ 4,\ 4,\ 50 \\)
- Średnia arytmetyczna:
\\[
\overline{x} = \frac{3 + 3 + 4 + 4 + 50}{5} = \frac{64}{5} = 12{,}8
\\]
Średnia sugeruje, że „typowe” zarobki to 12,8 tys. zł, co nie jest prawdą dla większości pracowników. - Mediana:
Porządkujemy (już są uporządkowane): \\( 3,\ 3,\ 4,\ 4,\ 50 \\).
Środkowa wartość (3. z kolei) to \\(4\\).
Mediana = 4 tys. zł – to lepiej opisuje zarobki „przeciętnego” pracownika.
Widać, że jedna bardzo wysoka pensja mocno podniosła średnią, ale nie zmieniła aż tak mediany.
Dlaczego mediana jest ważna w statystyce?
Mediana ma wiele zastosowań, szczególnie gdy dane są:
- asymetryczne – rozkład nie jest „symetryczny”, np. większość ludzi zarabia raczej mało lub średnio, a tylko nieliczni bardzo dużo,
- zawierają wartości odstające – pojedyncze bardzo duże lub bardzo małe wartości.
Przykłady zastosowań mediany:
- Statystyki zarobków (np. „mediana wynagrodzeń w Polsce”),
- Analiza cen mieszkań (mediana ceny za m²),
- Analiza czasu dojazdu do pracy (mediana czasu),
- Ocena typowego wyniku z egzaminu, gdy niektórzy uczniowie uzyskali bardzo skrajne wyniki.
Mediana krok po kroku – kilka dodatkowych przykładów
Przykład 1: liczba obserwacji nieparzysta
Dane (np. liczba błędów w dyktandzie 9 uczniów):
\\( 4,\ 2,\ 0,\ 3,\ 5,\ 2,\ 1,\ 4,\ 3 \\)
- Porządkowanie danych:
\\( 0,\ 1,\ 2,\ 2,\ 3,\ 3,\ 4,\ 4,\ 5 \\) - \\(n = 9\\), więc:
\\[
k = \frac{n+1}{2} = \frac{9+1}{2} = 5
\\] - 5. wartość w szeregu to \\(3\\).
Mediana = 3
Przykład 2: liczba obserwacji parzysta
Dane (np. czas dojazdu do szkoły w minutach dla 8 uczniów):
\\( 10,\ 15,\ 20,\ 25,\ 30,\ 35,\ 40,\ 45 \\)
- Dane są już uporządkowane.
- \\(n = 8\\), więc dwie środkowe wartości to:
\\( x\_{(4)} = 25 \\) oraz \\( x\_{(5)} = 30 \\). - Mediana:
\\[
\text{Mediana} = \frac{25 + 30}{2} = \frac{55}{2} = 27{,}5
\\]
Mediana = 27,5 minuty
Wizualizacja mediany – prosty wykres
Poniżej znajduje się prosty wykres słupkowy wykonany w elemencie <canvas>, pokazujący 7 wartości uporządkowanych rosnąco. Słupek odpowiadający medianie jest zaznaczony innym kolorem.
Na wykresie:
- wysokość słupka oznacza wartość liczby,
- środkowy słupek (w innym kolorze) to mediana.
Prosty kalkulator mediany (JavaScript)
Aby ułatwić naukę, poniżej znajduje się prosty kalkulator mediany. Wpisz liczby oddzielone przecinkami lub spacjami, a skrypt:
- uporządkuje je rosnąco,
- pokaże posortowaną listę,
- obliczy medianę.
Posortowane dane: –
Mediana: –
Najczęstsze błędy przy obliczaniu mediany
- Brak uporządkowania danych – próba wybierania „środkowej” liczby z nieposortowanej listy.
- Pomylenie mediany ze średnią – mediana nie wymaga sumowania wszystkich wartości.
- Niepoprawne liczenie pozycji przy parzystej liczbie danych – trzeba wziąć dwie środkowe wartości i obliczyć ich średnią.
- Ignorowanie powtarzających się wartości – mediana jak najbardziej może być liczbą, która powtarza się w szeregu (to nie problem).
Podsumowanie – co powinieneś zapamiętać?
- Mediana to wartość środkowa uporządkowanych danych.
- Aby ją znaleźć, zawsze najpierw sortujemy dane rosnąco.
- Gdy liczba obserwacji jest nieparzysta, mediana to środkowa wartość.
- Gdy liczba obserwacji jest parzysta, mediana to średnia dwóch środkowych wartości.
- Mediana jest odporna na wartości skrajne, dlatego często lepiej opisuje „typową” wartość niż średnia arytmetyczna.
- Możesz korzystać z prostego kalkulatora mediany (takiego jak powyżej), aby sprawdzić swoje ręczne obliczenia.
