Ik ben data science technieken aan het leren, mijn kennis van statistiek aan het opfrissen en opnieuw gestart met python code.
- setup ontwikkelomgeving
- open access data verzamelen
- EDA
- na data en plots: centrale stelling
- test hypothese
- andere correlaties testen
Vaak worden in discussies aannames gebruikt, die niet verantwoord worden door cijfers. De klimaatcrisis is (helaas) een goed voorbeeld: door klimaatcritici wordt vaak op hoge toon beweerd, dat de opwarming van de aarde binnen de marges van ons klimaat valt - net zoals warme zomers altijd al uitzonderlijk, maar niet onmogelijk waren. Zonder verdere onderbouwing of data.. maar veel dingen zijn niet 100% zeker Bij 95% of 99% waarschijnlijkheid op basis van data is er genoeg aanleiding voor nader onderzoek. Veel recente publicaties hebben een prominente plaats ingeruimd voor een nadere uitleg, wat 95% en 99% waarschijnlijkheid in de praktijk betekent.