Datawetenskap - Inleiding tot Statistiek
Inleiding tot Statistiek
Statistiek is die wetenskap van die ontleding van data.
Wanneer ons 'n model vir voorspelling geskep het, moet ons die voorspelling se betroubaarheid assesseer.
Wat is 'n voorspelling tog werd as ons nie daarop kan staatmaak nie?
Beskrywende statistieke
Ons sal eers 'n paar basiese beskrywende statistieke dek.
Beskrywende statistiek som belangrike kenmerke van 'n datastel op soos:
- Tel
- Som
- Standaard afwyking
- Persentiel
- Gemiddeld
- Ens..
Dit is 'n goeie beginpunt om vertroud te raak met die data.
Ons kan die describe()
funksie in Python gebruik om die data op te som:
Voorbeeld
print (full_health_data.describe())
Uitset:
Sien jy iets interessants hier?