Tři bratři – 3. bratr medián

Reprezentace není legrace

Blíží se volby. Každý rok se blíží nějaké. I letos budeme vybírat zástupce, který nás bude reprezentovat navenek. Děláme to proto, že jednat s každým z nás je prakticky nemožné. Proto zvolíme jednoho, se kterým bude jednáno, který bude jednat za nás.

Před stejným problémem stojíme, máme-li třeba sto hodnot nějakého měření. Která hodnota má právo zastupovat celý soubor měření?

Tři bratři – zastupitelé

Ve statistice nejčastěji jako reprezentativní hodnoty bereme: aritmetický průměr, modus a medián. Každý z těchto ukazatelů se hodí na něco jiného a existují data, kdy se nehodí ani jeden z nich.

O aritmetickém průměru je článek: zde klikněte

O modusu je článek: zde klikněte

Medián

Zcela jednoduše: medián je prostřední hodnota. Chceme-li jej zjistit, naměřená data si uspořádáme podle velikosti a najdeme prostřední hodnotu. Například máme tato data:

153, 178, 178, 180, 187,     pak medián má hodnotu 178

Při lichém počtu dat medián je vskutku ta prostřední hodnota.

Má-li dat sudý počet členů, například doměříme ještě jednu hodnotu

153, 178, 178, 180, 183, 187,

            medián má hodnotu (178+180) /2 = 179

Při sudém počtu, abychom se nedohadovali, která hodnota je ta prostřední, vezmeme obě a uděláme z nich aritmetický průměr.

Abiturientský večírek

Třída maturantů z roku 1990 pořádá večírek po 30 letech. A jsou zvědaví, kam to platově dotáhli. Aby nevznikaly mezi nimi vády, provedli to takto: Každý napsal na papírek zcela anonymně jaký je jeho měsíční čistý příjem. Jeden z nich pak získané hodnoty zpracoval do tabulky.

příjem 100 000 60 000 40 000 25 000 20 000 18 000 13 000
počet 1 1 2 3 5 1 12

Která hodnota má zastupovat tuto třídu studentů pro srovnání s jinou třídou? Jaká hodnota má být reprezentantem souboru dat?

Spočteme-li aritmetický průměr, dostaneme 23 560. To je příjem, který nikdo nemá. Nejbližší hodnota je 25 000. 25 tisíc a více má jen 7 studentů z 25, tj. pouhých 28 %. To je na reprezentanta trochu málo.

Pohledem do tabulky snadno najdeme nejčetnější hodnotu. Modus se rovná 13 000. Tento příjem má 12 studentů, tj. 48 %. Příjem 13 tisíc má téměř celá polovina přítomných, ale více studentů má příjem vyšší. To také zrovna reprezentativní není.

Při 25 účastníků je prostřední hodnota ta třináctá. Je jedno, zdali počítáme zleva nebo zprava. Ona prostřední hodnota je rovna 18 000 a nazývá se medián. Je sice pravda, že tento příjem bere jediný student, ale těch, kteří berou méně, je přesně stejně jako těch, kteří berou více.

Výhody mediánu

Statistika již dávno objevila a používá medián, tuto “prostřední hodnotu”, “centrální hodnotu” Má mimo jiné tu výhodu, že ji lze použít na soubory dat, u nichž výpočet aritmetického průměru nemá žádný smysl. Je možné zjistit “prostředního” žáka – z 31 žáků před “prostředním” je 15 lepších, za ním 15 horších, zatímco aritmetický průměr ze součtu známek na vysvědčení by spíše mátl. Mimoto lze mediánu použít i v “otevřených stupnicích”. Kdybychom třeba řekli, že dva z našich abiturientů vydělávali “přes 50 000 T”, pak by nebylo možno vypočítat aritmetický průměr, medián však zůstane stejný.

Z těchto důvodů jej lze účelně použít i tam, kde chybí omezení nahoru nebo dolů, protože se třeba shrnou všechny nízké a všechny vysoké hodnoty pod označení typu “více než.. .”, “méně než “.

Nevýhody mediánu

Přesto má i tato “prostřední hodnota” své nevýhody. Představme si akciovou společnost, jejíž celkový kapitál je rozdělen do 500 000 akcií. Akcie této společnosti vlastní 50 000 osob, a průměrně má tedy každý akcionář 10 akcií. Skutečnost je však jiná.

počet akcionářů počet akcií
1 320 000
1 30 102
100 1 000
49898 1

Jediný majoritní akcionář má 320 000 podílů, další 30 102, sto osob vlastní po 1000 akciích a zbývajících 49 898 akcionářů má jen po jediném podílu ve své hubené peněžence.

Kdybychom chtěli tuto skutečnost skrýt a přitom nemluvit o prostém průměru, můžeme říct, že vlastnictví akcií je „neobyčejně široce rozptýleno“. Nebo, že 99 % akcionářů má méně než 800 akcií. Věta je pravdivá, ale hodně zamlžuje skutečnost. Však i použití průměru „každý akcionář má v průměru celých 10 akcií“ je zkreslující tvrzení třebaže pravdivé.

Vraťme se k mediánu. I ten je v příkladu našich akcionářů značně nevhodný. Je vidět, že je nutno uvést jednoho z 49 898 nejmenších akcionářů jako “prostředního“, ačkoliv všichni mají stejně málo.

 

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *