Datawetenskap Inleiding


Datawetenskap is 'n kombinasie van veelvuldige dissiplines wat statistiek, data-analise en masjienleer gebruik om data te ontleed en om kennis en insigte daaruit te onttrek.


Wat is datawetenskap?

Data Science gaan oor data-insameling, ontleding en besluitneming.

Datawetenskap gaan oor die vind van patrone in data, deur ontleding, en maak toekomstige voorspellings.

Deur Data Science te gebruik, kan maatskappye:

  • Beter besluite (moet ons A of B kies)
  • Voorspellende analise (wat sal volgende gebeur?)
  • Patroonontdekkings (vind patroon, of dalk versteekte inligting in die data)

Waar is datawetenskap nodig?

Data Science word vandag in baie industrieë in die wêreld gebruik, bv. bankwese, konsultasie, gesondheidsorg en vervaardiging.

Voorbeelde van waar datawetenskap benodig word:

  • Vir roetebeplanning: Om die beste roetes te ontdek om te stuur
  • Om vertragings vir vlug/skip/trein ens. te voorsien (deur voorspellende analise)
  • Om promosie-aanbiedinge te skep
  • Om die beste geskikte tyd te vind om goedere af te lewer
  • Om die volgende jaar se inkomste vir 'n maatskappy te voorspel
  • Om die gesondheidsvoordeel van opleiding te ontleed
  • Om te voorspel wie verkiesings gaan wen

Datawetenskap kan toegepas word in byna elke deel van 'n besigheid waar data beskikbaar is. Voorbeelde is:

  • Verbruikersgoedere
  • Aandelemarkte
  • Nywerheid
  • Politiek
  • Logistieke maatskappye
  • E-handel

Hoe werk 'n datawetenskaplike?

'n Datawetenskaplike benodig kundigheid in verskeie agtergronde:

  • Masjienleer
  • Statistiek
  • Programmering (Python of R)
  • Wiskunde
  • Databasisse

'n Datawetenskaplike moet patrone binne die data vind. Voordat hy/sy die patrone kan vind, moet hy/sy die data in 'n standaardformaat organiseer.

Hier is hoe 'n datawetenskaplike werk:

  1. Vra die regte vrae - Om die besigheidsprobleem te verstaan.
  2. Verken en versamel data - Van databasis, weblogboeke, klantterugvoer, ens.
  3. Onttrek die data - Transformeer die data na 'n gestandaardiseerde formaat.
  4. Maak die data skoon - Verwyder foutiewe waardes uit die data.
  5. Soek en vervang ontbrekende waardes - Kyk vir ontbrekende waardes en vervang dit met 'n geskikte waarde (bv. 'n gemiddelde waarde).
  6. Normaliseer data - Skaal die waardes in 'n praktiese reeks (bv. 140 cm is kleiner as 1,8 m. Die getal 140 is egter groter as 1,8. - dus skaal is belangrik).
  7. Ontleed data, vind patrone en maak toekomstige voorspellings .
  8. Stel die resultaat voor - Bied die resultaat aan met nuttige insigte op 'n manier wat die "maatskappy" kan verstaan.

Waar om te begin?

In hierdie tutoriaal sal ons begin deur aan te bied wat data is en hoe data ontleed kan word.

Jy sal leer hoe om statistiek en wiskundige funksies te gebruik om voorspellings te maak.