Data Science

Nederlands

Ik ben data science technieken aan het leren, mijn kennis van statistiek aan het opfrissen en opnieuw gestart met python code.

  1. setup ontwikkelomgeving
  2. open access data verzamelen
  3. EDA
  4. na data en plots: centrale stelling
  5. test hypothese
  6. andere correlaties testen

Vaak worden in discussies aannames gebruikt, die niet verantwoord worden door cijfers. De klimaatcrisis is (helaas) een goed voorbeeld: door klimaatcritici wordt vaak op hoge toon beweerd, dat de opwarming van de aarde binnen de marges van ons klimaat valt - net zoals warme zomers altijd al uitzonderlijk, maar niet onmogelijk waren. Zonder verdere onderbouwing of data.. maar veel dingen zijn niet 100% zeker

Bij 95% of 99% waarschijnlijkheid op basis van data is er genoeg aanleiding voor nader onderzoek. Veel recente publicaties hebben een prominente plaats ingeruimd voor een nadere uitleg, wat 95% en 99% waarschijnlijkheid in de praktijk betekent.