Python- tutoriaal

Python TUIS Python Intro Python Begin Python-sintaksis Python-kommentaar Python veranderlikes Python-datatipes Python-nommers Python Casting Python Strings Python Booleans Python-operateurs Python-lyste Python Tuples Python-stelle Python Woordeboeke Python As...Anders Python While Loops Python vir lusse Python-funksies Python Lambda Python-skikkings Python-klasse/-voorwerpe Python Erfenis Python Iterators Python-omvang Python-modules Python-datums Python Wiskunde Python JSON Python RegEx Python PIP Python Probeer ... Behalwe Python-gebruikersinvoer Python String Formatering

Lêerhantering

Python-lêerhantering Python Lees lêers Python Skryf/skep lêers Python verwyder lêers

Python-modules

NumPy Tutoriaal Panda Walkthrough Scipy Tutoriaal

Python Matplotlib

Matplotlib Intro Matplotlib Begin Matplotlib Pyplot Matplotlib Plotte Matplotlib Merkers Matplotlib-lyn Matplotlib-etikette Matplotlib-rooster Matplotlib Subplotte Matplotlib Scatter Matplotlib Bars Matplotlib Histogramme Matplotlib sirkeldiagramme

Masjienleer

Aan die gang kom Gemiddelde mediaanmodus Standaard afwyking Persentiel Dataverspreiding Normale dataverspreiding Strooi plot Lineêre regressie Polinoomregressie Meervoudige regressie Skaal Trein/toets Besluitboom

Python MySQL

MySQL Begin MySQL Skep databasis MySQL Skep tabel MySQL-insetsel MySQL Kies MySQL Waar MySQL Bestel deur MySQL verwyder MySQL Drop Table MySQL-opdatering MySQL-limiet MySQL Sluit aan

Python MongoDB

MongoDB Begin MongoDB Skep databasis MongoDB Skep versameling MongoDB-insetsel MongoDB Vind MongoDB-navraag MongoDB Sorteer MongoDB verwyder MongoDB Drop Collection MongoDB-opdatering MongoDB-limiet

Python-verwysing

Python Oorsig Python ingeboude funksies Python-stringmetodes Python Lys Metodes Python Woordeboek Metodes Python Tuple Metodes Python Stel metodes Python-lêermetodes Python sleutelwoorde Python-uitsonderings Python Woordelys

Moduleverwysing

Ewekansige module Versoeke Module Statistiek Module Wiskunde Module cMath-module

Python Hoe om

Verwyder lys duplikate Draai 'n snaar om Voeg twee getalle by

Python voorbeelde

Python voorbeelde Python-samesteller Python-oefeninge Python Vasvra Python-sertifikaat

Masjienleer

Masjienleer laat die rekenaar leer deur data en statistiek te bestudeer.

Masjienleer is 'n stap in die rigting van kunsmatige intelligensie (KI).

Masjienleer is 'n program wat data ontleed en leer om die uitkoms te voorspel.

Waar om te begin?

In hierdie tutoriaal gaan ons terug na wiskunde en studiestatistieke, en hoe om belangrike getalle te bereken gebaseer op datastelle.

Ons sal ook leer hoe om verskeie Python-modules te gebruik om die antwoorde te kry wat ons nodig het.

En ons sal leer hoe om funksies te maak wat die uitkoms kan voorspel op grond van wat ons geleer het.


Datastel

In die gedagtes van 'n rekenaar is 'n datastel enige versameling data. Dit kan enigiets van 'n skikking tot 'n volledige databasis wees.

Voorbeeld van 'n skikking:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Voorbeeld van 'n databasis:

KarnaamKleurOuderdomSpoedAutoPass
BMWrooi599Y
Volvoswart786Y
VWgrys887N
VWwit788Y
Fordwit2111Y
VWwit1786Y
Teslarooi2103Y
BMWswart987Y
Volvogrys494N
Fordwit1178N
Toyotagrys1277N
VWwit985N
Toyotablou686Y

Deur na die skikking te kyk, kan ons raai dat die gemiddelde waarde waarskynlik rondom 80 of 90 is, en ons kan ook die hoogste waarde en die laagste waarde bepaal, maar wat anders kan ons doen?

En deur na die databasis te kyk, kan ons sien dat die gewildste kleur wit is, en die oudste motor is 17 jaar, maar wat as ons kan voorspel of 'n motor 'n AutoPass het, net deur na die ander waardes te kyk?

Dit is waarvoor Masjienleer is! Ontleed data en voorspel die uitkoms!

In Masjienleer is dit algemeen om met baie groot datastelle te werk. In hierdie tutoriaal sal ons probeer om dit so maklik moontlik te maak om die verskillende konsepte van masjienleer te verstaan, en ons sal met klein maklik verstaanbare datastelle werk.


Datatipes

Om data te ontleed, is dit belangrik om te weet met watter tipe data ons te doen het.

Ons kan die datatipes in drie hoofkategorieë verdeel:

  • Numeries
  • Kategories
  • Ordinaal

Numeriese data is getalle en kan in twee numeriese kategorieë verdeel word:

  • Diskrete Data
    - getalle wat beperk is tot heelgetalle. Voorbeeld: Die aantal motors wat verbyry.
  • Deurlopende data
    - getalle wat van oneindige waarde is. Voorbeeld: Die prys van 'n item, of die grootte van 'n item

Kategoriese data is waardes wat nie aan mekaar gemeet kan word nie. Voorbeeld: 'n kleurwaarde, of enige ja/nee-waardes.

Ordinale data is soos kategoriese data, maar kan aan mekaar gemeet word. Voorbeeld: skoolgrade waar A beter is as B ensovoorts.

Deur die datatipe van jou databron te ken, sal jy kan weet watter tegniek om te gebruik wanneer jy dit ontleed.

Jy sal in die volgende hoofstukke meer leer oor statistiek en die ontleding van data.