Mediana to bardzo pożyteczne zwierzątko. Wiedziałem to od czasów ogólniaka, ale jakoś tak… zapomniałem. Przypomniał mi o tym Thomas Piketty, gdy czytałem jego pracę „Kapitał XXI wieku”. Kiedy jeszcze pracowałem w szkole, a mam na myśli ten okres, kiedy wszechwładne stały się tzw. testy niekompetencji – pardon – kompetencji, mediana przydawała mi się w liczeniu statystyki wyników osiąganych przez uczniów. Jednak najpierw warto przeczytać ogólną definicję z Wikipedii, jeśli ktoś nie jest matematykiem.
Mediana (zwana też wartością środkową, wartością przeciętną lub drugim kwartylem) – wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2, czyli drugim kwartylem. Jest również trzecim kwantylem szóstego rzędu, piątym decylem itd.
Mediana spełnia następujący warunek: jeśli szukamy liczby takiej, że średnia modułów odchyleń wartości dla wszystkich obserwacji od niej byłaby najmniejsza, to liczbą tą jest właśnie mediana. Dzięki temu mediana ma interpretację jako optymalne przewidywanie wartości za pomocą jednej liczby, jeśli przyjętą funkcją błędu przewidywania jest moduł odchylenia (różnicy). [Wikipedia]
Do czego się przydaje mediana? Mówi się, że kłamstwa dzielimy na niewielkie, duże i statystykę. Mediana pozwala trochę oczyścić statystykę z zarzutów o kłamstwo. Wyobraźmy sobie małą firmę, której pracownicy zarabiają po tysiąc złotych, a właściciel bierze sobie 30 tysięcy. Średnia pensja w tej firmie to 3900. I wygląda to bardzo ładnie. W tym konkretnym wypadku mediana jednak powie nam prawdę, bowiem mediana to wartość dwóch środkowych liczb dodanych do siebie i podzielonych przez dwa, przy założeniu, że ciąg liczb jest ustawiony od najmniejszej do największej. Mediana to 1000 złotych. Różnica między medianą a średnią arytmetyczną pokaże nam też rozwarstwienie płac. A ono nie wygląda ładnie.
A teraz przykład z innego podwórka. Powiedzmy, że mamy 10 uczniów którzy piszą sprawdzian. Wyobraźmy sobie, że nauczyciel lubi pracować wyłącznie z uczniami zdolniejszymi, im poświęca całą uwagę, a pozostałych uważa za niewartych swej pracy. W rezultacie tak oto kształtują się oceny:
1,1,1,1,2,2,5,6,6,6
Średnia ocen będzie równa 3,1 i nie jest to niepokojące, bo przecież każdy nauczyciel wie, że są klasy słabsze i wyniki tam z różnych powodów trudno tam osiągnąć. Ale mediana będzie równa 2 i to będzie sygnał niepokojący. Powie nam, że większość wyników w tej klasie jest poniżej wszelkich oczekiwań.
Czasami może być też odwrotnie. Dziesięciu uczniów dostało ze sprawdzianu następujące oceny:
1,1,2,2,3,4,4,4,5,6
Średnia arytmetyczna z tych ocen to 3,2 i wydaje się niska, choć nie jest to bardzo kiepski wynik, jeśli klasa ogólnie jest słaba. Jednak mediana w tym przypadku to będzie 3,5, a to – po pierwsze – znacznie lepszy wynik. Po drugie, mediana pokazuje, że 50% uczniów ma wynik lepszy od niej i w stosunku do poprzedniego przykładu, jest dowodem, że nauczyciel pracuje równo ze wszystkimi uczniami i stara się zoptymalizować ich wyniki.
Dziś, gdy rzekomo Polska jest w ruinie i często dyskutuje się o płacach, też warto pamiętać o tych dwóch elementach statystyki. Z jednej strony jest średnia arytmetyczna, z drugiej mediana.
A co widać ze wzrastających różnic pomiędzy średnią a medianą? Że w Polsce powoli, ale stale dochodzi do rozwarstwienia dochodów. Proces jest wolniejszy, niż w innych krajach, ale jest. O tym między innymi pisze Thomas Piketty w interesującym dziele współczesnej ekonomii – „Kapitał XXI wieku”.