Australský Lifehacker 101 přináší pěkný, a až příliš typický, příklad toho, jak jsou často statictická data zkreslována nebo chybně sbírána. Zamýšlí se nad konkrétní tiskovou zprávou: Počítače Mac získají v roce 2011 o 57 % vyšší podíl na trhu.
To zní jako zajímavá zpráva, je tu ale pár detailů, které by měly po jejím přečtení být jasné i člověku, co se ve statistice orientuje jen základně. Vy, co jste se statistikou více sžití, v nich rozpoznáte klasické chyby (nebo manipulace) :
- nárůst 57 % zní působivě, ale protože jde nárůst relativně malého podílu (z 3,3 % na 5,5 %), tak by bylo férovější se tímto číslem neohánět. Stejně tak by šlo napsat “Mac bude stále tvořit méně než 10 % trhu”
- jen 8 % respondentů bylo mimoamerických – proč tedy výzkum tyto firmy raději nevyfiltroval, než aby se snažil dělat jakoby globální závěry?
- a největším problémem je samotný vzorek on-line průzkumu – dělala jej totiž organizace EDA, která se zaměřuje na počítače Mac, a kdokoli se na jejich stránky dostane, je tedy pravděpodobně částečně naladěn na “jejich notu”. Je to jako ptát se na fanouškovských stránkách Pána prstenů: “Kterou trilogii máte nejraději?” Je nasnadě, že jedna z nich bude ve výrazné, přirozené výhodě.
Je dobré se naučit ptát se tyto otázky (vzorek? metodika? procent z čeho? statistická chyba?) u každého průzkumu. Budete tak méně náchylní dělat špatné závěry na základě novinářských chyb nebo korporátních manipulací.
Mimochodem (zpráva od sponzora), fanoušci statistik si nyní mohou udělat i svou vlastní statistickou vizitku