Datawetenskap - Inleiding tot Statistiek


Inleiding tot Statistiek

Statistiek is die wetenskap van die ontleding van data.

Wanneer ons 'n model vir voorspelling geskep het, moet ons die voorspelling se betroubaarheid assesseer.

Wat is 'n voorspelling tog werd as ons nie daarop kan staatmaak nie?


Beskrywende statistieke

Ons sal eers 'n paar basiese beskrywende statistieke dek.

Beskrywende statistiek som belangrike kenmerke van 'n datastel op soos:

  • Tel
  • Som
  • Standaard afwyking
  • Persentiel
  • Gemiddeld
  • Ens..

Dit is 'n goeie beginpunt om vertroud te raak met die data.

Ons kan die describe()funksie in Python gebruik om die data op te som:

Voorbeeld

print (full_health_data.describe())

Uitset:

Stat Beskryf

Sien jy iets interessants hier?