Python- tutoriaal

Python TUIS Python Intro Python Begin Python-sintaksis Python-kommentaar Python veranderlikes Python-datatipes Python-nommers Python Casting Python Strings Python Booleans Python-operateurs Python-lyste Python Tuples Python-stelle Python Woordeboeke Python As...Anders Python While Loops Python vir lusse Python-funksies Python Lambda Python-skikkings Python-klasse/-voorwerpe Python Erfenis Python Iterators Python-omvang Python-modules Python-datums Python Wiskunde Python JSON Python RegEx Python PIP Python Probeer ... Behalwe Python-gebruikersinvoer Python String Formatering

Lêerhantering

Python-lêerhantering Python Lees lêers Python Skryf/skep lêers Python verwyder lêers

Python-modules

NumPy Tutoriaal Panda Walkthrough Scipy Tutoriaal

Python Matplotlib

Matplotlib Intro Matplotlib Begin Matplotlib Pyplot Matplotlib Plotte Matplotlib Merkers Matplotlib-lyn Matplotlib-etikette Matplotlib-rooster Matplotlib Subplotte Matplotlib Scatter Matplotlib Bars Matplotlib Histogramme Matplotlib sirkeldiagramme

Masjienleer

Aan die gang kom Gemiddelde mediaanmodus Standaard afwyking Persentiel Dataverspreiding Normale dataverspreiding Strooi plot Lineêre regressie Polinoomregressie Meervoudige regressie Skaal Trein/toets Besluitboom

Python MySQL

MySQL Begin MySQL Skep databasis MySQL Skep tabel MySQL-insetsel MySQL Kies MySQL Waar MySQL Bestel deur MySQL verwyder MySQL Drop Table MySQL-opdatering MySQL-limiet MySQL Sluit aan

Python MongoDB

MongoDB Begin MongoDB Skep databasis MongoDB Skep versameling MongoDB-insetsel MongoDB Vind MongoDB-navraag MongoDB Sorteer MongoDB verwyder MongoDB Drop Collection MongoDB-opdatering MongoDB-limiet

Python-verwysing

Python Oorsig Python ingeboude funksies Python-stringmetodes Python Lys Metodes Python Woordeboek Metodes Python Tuple Metodes Python Stel metodes Python-lêermetodes Python sleutelwoorde Python-uitsonderings Python Woordelys

Moduleverwysing

Ewekansige module Versoeke Module Statistiek Module Wiskunde Module cMath-module

Python Hoe om

Verwyder lys duplikate Draai 'n snaar om Voeg twee getalle by

Python voorbeelde

Python voorbeelde Python-samesteller Python-oefeninge Python Vasvra Python-sertifikaat

Masjienleer - Dataverspreiding


Dataverspreiding

Ons het vroeër in hierdie tutoriaal met baie klein hoeveelhede data in ons voorbeelde gewerk, net om die verskillende konsepte te verstaan.

In die werklike wêreld is die datastelle baie groter, maar dit kan moeilik wees om werklike data in te samel, ten minste in 'n vroeë stadium van 'n projek.

Hoe kan ons groot datastelle kry?

Om groot datastelle vir toetsing te skep, gebruik ons ​​die Python-module NumPy, wat met 'n aantal metodes kom om ewekansige datastelle van enige grootte te skep.

Voorbeeld

Skep 'n skikking wat 250 ewekansige dryf tussen 0 en 5 bevat:

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

Histogram

Om die datastel te visualiseer kan ons 'n histogram teken met die data wat ons ingesamel het.

Ons sal die Python-module Matplotlib gebruik om 'n histogram te teken.

Kom meer te wete oor die Matplotlib-module in ons Matplotlib-tutoriaal .

Voorbeeld

Teken 'n histogram:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()

Resultaat:

Histogram verduidelik

Ons gebruik die skikking van die voorbeeld hierbo om 'n histogram met 5 stawe te teken.

Die eerste balk verteenwoordig hoeveel waardes in die skikking tussen 0 en 1 is.

Die tweede balk verteenwoordig hoeveel waardes tussen 1 en 2 is.

Ens.

Wat vir ons hierdie resultaat gee:

  • 52 waardes is tussen 0 en 1
  • 48 waardes is tussen 1 en 2
  • 49 waardes is tussen 2 en 3
  • 51 waardes is tussen 3 en 4
  • 50 waardes is tussen 4 en 5

Let wel: Die skikkingwaardes is ewekansige getalle en sal nie presies dieselfde resultaat op jou rekenaar wys nie.

Groot data verspreidings

'n Skikking wat 250 waardes bevat, word nie as baie groot beskou nie, maar nou weet jy hoe om 'n ewekansige stel waardes te skep, en deur die parameters te verander, kan jy die datastel so groot skep as wat jy wil.

Voorbeeld

Skep 'n skikking met 100 000 ewekansige getalle, en vertoon hulle met 'n histogram met 100 stawe:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 100000)

plt.hist(x, 100)
plt.show()