Forhastet generalisering

Kortversjonen
En forhastet generalisering skjer når man antar at det man ser i et lite utvalg, også må gjelde generelt.
Skal man undersøke noe med statistikk, er kanskje det viktigste å ha et stort nok utvalg. Små utvalg kan gi et uriktig bilde av verden på grunn av tilfeldige utslag. Det er når vi velger å anta disse tilfeldige utslagene som riktig for det store bildet, at vi gjøre en forhastet generalisering.
Når 1 av 100 blir til 1 av 1
Regnestykket kan gjøres veldig enkelt. Se for deg et utvalg av 100 mennesker som blir spurt et ja/nei-spørsmål. En av disse varer ja, de 99 andre svarer nei. Dette gir altså et bilde av at så godt som alle svarer nei. Men hva om du spurte bare en person og dette tilfeldigvis var den ene av disse hundre som svare ja? Plutselig har ja-siden gått fra å være 1 % av de hundre, til å være 100 % av den ene.
Utvalget i en undersøkelse har altså betydning for hvor treffsikker konklusjonen kan være. Dersom man går andre veien, og oppdager at blant 1000 spurte, svarer 11 ja, så ser vi at forskjellen prosentmessig når vi spør disse 1000 (1,1 %) ikke avviker særlig fra når man spurte 100 (1 %). Hvis man derimot hadde spurt de 100 som inneholdt to ja-svar, så er forskjellen litt større med 2 % på de 100 spurte, og 1,1% på de 100 spurte. Øker man så igjen til 10.000 og får tilsvarende tilfeldig utslag, vil forskjellen igjen bli enda mindre. Altså, jo flere vi spør, jo mindre utslag vil et tilfeldig avvik utgjøre.
Feilen i målingen, tankefeilen i konklusjonen
Dersom man undersøker blant et for lite utvalg, er det liten tvil om at feilen starter allerede i undersøkelsen eller målingen. Selve tankefeilen skjer imidlertid når man, i stedet for å konkludere med at man har et for lite utvalg, velger å konkludere basert på det utvalget man har. Dersom man antar at det man ser i det lille utvalget kan overføres direkte og uten noen forbehold til den store sammenhengen, da har man gjort en forhastet generalisering.
Lite utvalg og føre-var-prinsippet
Selv om det å konkludere basert på en liten datamengde er en tankefeil, kan det i spesielle tilfeller være nyttig å bruke føre-var-prinsippet når man kun har tilgang på et lite datautvalg. Se for eksempel for deg at du er ute i ørkenen og går med en annen person. Vedkommende blir bitt av en rød slange og dør bare minutter senere. Om du da konkluderer med at røde slanger er giftige med basis i føre-var-prinsippet vil dette nok være det fornuftige valget å gjøre i den gitte situasjonen. Dette selv om det i utgangspunktet er en forhastet generalisering.
Eksempel
A: Oldefaren min røyket 20 sigaretter om dagen og levde til han ble 96, så røyking kan ikke være så farlig da!
Statistisk sett dør ca. annenhver røyker av røykingen. Det vil samtidig si at det finnes noen som får et langt liv selv om de røyker. Å anta at det ikke kan være så usunt bare fordi et enkeltmenneske man kjenner ikke døde av det, blir dermed en forhastet generalisering.
Eksempel
A: Både oldefaren min og onkelen min røyket 20 sigaretter om dagen og levde til de ble over 90, så røyking kan ikke være så farlig da!
Statistisk sett dør ca. annenhver røyker av røykingen. Det vil samtidig si at det finnes noen som får et langt liv selv om de røyker. Å anta at det ikke kan være så usunt basert på et utvalg på to personer er altså en forhastet generalisering.