Datawetenskap - Wat is data?


Wat is data?

Data is 'n versameling van inligting.

Een doel van Data Science is om data te struktureer, wat dit interpreteerbaar en maklik maak om mee te werk.

Data kan in twee groepe gekategoriseer word:

  • Gestruktureerde data
  • Ongestruktureerde data

Ongestruktureerde data

Ongestruktureerde data is nie georganiseer nie. Ons moet die data organiseer vir ontledingsdoeleindes.

Ongestruktureerde data

Ongestruktureerde data


Gestruktureerde data

Gestruktureerde data is georganiseer en makliker om mee te werk.

Gestruktureerde data


Hoe om data te struktureer?

Ons kan 'n skikking of 'n databasistabel gebruik om data te struktureer of aan te bied.

Voorbeeld van 'n skikking:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

Die volgende voorbeeld wys hoe om 'n skikking in Python te skep:

Voorbeeld

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

Dit is algemeen om met baie groot datastelle in Datawetenskap te werk.

In hierdie tutoriaal sal ons probeer om dit so maklik as moontlik te maak om die konsepte van Datawetenskap te verstaan. Ons sal dus met 'n klein datastel werk wat maklik is om te interpreteer.