Gonick, Larry i Smith, Woollcott
La estadística en cómic
Barcelona: Zendreda Zariquiey, 1999.
És simpàtic, amè i divertit aprendre l’estadística amb vinyetes de còmic que ens estimulen i ens fan riure. Per als estudiants de batxillerat resulta una eina eficaç per a l’aprenentatge d’una matèria matemàtica i pràctica de primer ordre, però en alguns aspectes feixuga. Tot comença amb la definició d’estadística, una matèria de recerca que sovint tenim present en les ciències econòmiques, en biologia i en enginyeria. Òbviament, direu que l’estadística troba sempre el que és simplificador però important d’un conjunt de dades: en l’estadística descriptiva sovint parlem de mitjana, mediana i moda. No sempre ens fixem en la dada resum d’un concepte –a partir d’ara «variable»–, sinó que també destaquem aquests outliers o dades extremes que conviuen amb dades més homogènies. De fet parlem de variància i de rang.
L’estadística vol trobar prediccions i –mitjançant anàlisis quantitatius–, lleis o teories empíriques útils per a molts fenòmens. L’anàlisi quantitativa té dos elements importants: els dissenys experimentals i el mostreig. En tot cas, normalment es pressuposa que aquestes variables es comporten segons la distribució normal. Aquesta distribució de forma de campana permet fer inferència, és a dir, generalitzacions. Les inferències es fan mitjançant contrastos d’hipòtesi. Els contrastos d’hipòtesi més comuns són la trobada de mitjanes poblacionals o bé de proporcions. També són comunes les equivalències de proporcions. Una manera molt utilitzada de mostrar si estem errats en una predicció, s’aconsegueix a través de l’interval de confiança que se situa a un 95% o bé a un 99%. Altrament, una anàlisi com l’ANOVA estudia l’equivalència de variància entre grups.
L’estadística té l’eix central en la probabilitat. Les lleis de probabilitat són conegudes pels estudiants: la probabilitat d’un fenomen en una població total és valor 1 o bé la probabilitat d’un valor d’una variable és més gran que 0. Hi ha la probabilitat bayesiana, que ha ocupat tota una secció important de l’estadística, que estudia els fenòmens condicionats a d’altres. No tota l’estadística es basa en la inferència a partir de distribucions normals. L’estadística no paramètrica avui dia és rellevant i permet fer anàlisis sense aquesta hipòtesi.
El model més conegut de l’estadística predictiva és la regressió. Permet conèixer l’evolució d’una variable a partir d’una altra. És una relació causa-efecte. Cal no confondre la correlació amb la causalitat. En la correlació se sap que dues variables estan relacionades, però no afirmem que l’una és causa de l’altra. En la regressió sí que hi ha relació causa-efecte. La regressió pot ser lineal –en representació gràfica– o bé no lineal (més complexa de treballar).
Animo totes aquelles persones que els agradi la teoria bàsica de l’estadística a donar una ullada a aquest llibre per animar altres estudiants a endinsar-se en aquest camp. És una manera de treure-li el dramatisme d’assignatura difícil d’aprendre i de fer més propera a tots una pràctica necessària per als estudis universitaris.