Koronatartunnat ovat Helsingissä uutisten mukaan kasvussa. Tapauksia on sen verran, että tartunnoista julkaistiin postinumerokohtainen lista. Mediassa on puhuttu että tartunnat korreloivat joidenkin taustamuuttujien kanssa kuten asumistiheyden, tulotason, koulutustason, omistusasumisen tms kanssa. Halusin nähdä löydänkö Tilastokeskuksen Postinumerodatan perusteella kerätystä aineistosta jonkin tartuntoja selittävän suureen. Keräsin siis viralliset Koronatartuntatapaukset postinumeroittain ja Tilastokeskuksen viralliset postinumerotilastot ja yhdistin ne.
En löytänyt mitään täydellistä korrelaatiota vaikka jotkin muuttujat korostuvat.
Hypoteesini oli että asumisväljyys, jonkin tietyn ikäluokan suhteellinen määrä tai julkisuudessa paljon puhuttu tulotaso jotenkin korreloisi. Kun katsoin korrelaatiota kaikkien muuttujien kautta, eniten korreloiva asia on työttömien suhteellinen määrä. Pearson korrelaatio työttömien suhteellisen määrän ja koronatapausten kanssa on 47,50%. Toiseksi suurin korrelaatio on alhaisen koulutuksen omaavien suuri edustus. Jos ylin koulutustaso on perusaste, korrelaatio on 44,71%. Lisäksi vanhusten suhteellisesti iso osuus postinumeroalueella voi näkyä suurempana tartuntojen tilastointina. Johtuuko tämä siitä että vanhuksia testataan enemmän, en tiedä?
Negatiivista korrelaatiota ei juurikaan esiinny, Talouksien keskikoko (-34%) ja Talouksien keskitulo (-32,96%) olivat negatiivisimmat korrelaatiot.
Korona on kuin kausiflunssa leviämisen suhteen: Se tarttuu sekä valkokaulustyöntekijään, että rakennusmieheen, kerrostalossa asuvaan, että omakotitalossa asuvaan.
HUS:n ylilääkäri Asko Järvinen arvioi IS:n uutisessa “Uudet tiedot: Tässä ovat Helsingin pahimmat koronapesäkkeet – katso tilanne eri postinumeroalueilla – Kotimaa – Ilta-Sanomat (is.fi)” että “Itä-Helsingin paikoin huono koronatilanne nivoutuu alueen maahanmuuttajapainotteisuuteen ja väestön matalaan tulotasoon.” Tämä on tietyllä tavalla totta, mutta jos Järvisen lähtöaineistona on sama data kuin minulla, on työttömyys itseasiassa suurempi syy. Nyt mediassa on puhuttu siitä että matalan ansiotason ihmiset eivät pystyisi pitämään turvaetäisyyksiä ja sitä kautta altistuisivat enemmän. Tämä voi olla totta, mutta se ei selitä työttömien sairastumista. Työttömät korreloivat voimakkaammin kuin matala tulotaso, jotka tietenkin voivat olla sidoksissa toisiinsa. Lisäksi koulutustaso on paljon merkitsevämpi seikka kuin matala tulotaso. Koulutustaso näkyy itseasiassa myös päin vastoin, tartuntojen negatiivinen korrelaatio on alueilla, joissa koulutustaso on keskimääräistä korkeampi.
Parhaiten koronatartunnat korreloivat siis työttömien suhteellinen määrän, pelkästään perusasteen suorittaneiden kansalaisten suhteellinen määrän ja vanhempien ihmisten yleisyyden kanssa!
Nyt huomaa, tämä raportti vaatii sinulta ihan hieman tarkkuutta ja taas perusmatemaattisia taitoja.
1. Valitse vasemmasta reunasta haluatko katsoa tilastomuuttujaa sellaisenaan vai jakaa sen asukkaiden lukumäärällä. Esimerkiksi keskiansiota ei kannata jakaa, mutta lasten lukumäärä voi olla mielekästä jos haluat nähdä missä on suhteellisesti eniten lapsia.
2. Keskeltä valitse haluatko katsoa absoluuttisia tartuntalukumääriä vai suhteellista per 100 000 ihmistä. Isommat postinumeroalueet korostuvat jos katsot absoluuttisia.
3. Kolmannesta kartasta näet miten asiat korreloivat. Eli onko esim väljimmin asutussa kaupunginosassa vähiten tartuntoja ja tiheimmässä eniten. Kuvaajan yläpuolella oleva luku kertoo keskimääräisen korrelaation. Mitä kauempana luku on 0%:sta, sitä paremmin se korreloi. Jos luku on lähellä -100%:aa, korreloi luku kääntäen ja jos 100%, suoraan. Korrelaatioluku on Pearsonin korrelaatiokerroin.
Jos luvut raportilla näkyvät sinulla liian pieniltä, voit avata raportin tästä