Masjienleer - Normale dataverspreiding
Normale dataverspreiding
In die vorige hoofstuk het ons geleer hoe om 'n heeltemal ewekansige skikking, van 'n gegewe grootte, en tussen twee gegewe waardes te skep.
In hierdie hoofstuk sal ons leer hoe om 'n skikking te skep waar die waardes rondom 'n gegewe waarde gekonsentreer is.
In waarskynlikheidsteorie staan hierdie soort dataverspreiding bekend as die normale dataverspreiding , of die Gaussiese dataverspreiding , na die wiskundige Carl Friedrich Gauss wat met die formule van hierdie dataverspreiding vorendag gekom het.
Voorbeeld
'n Tipiese normale dataverspreiding:
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
Resultaat:
Let wel: 'n Normale verspreidingsgrafiek staan ook bekend as die klokkurwe vanweë sy kenmerkende vorm van 'n klok.
Histogram verduidelik
Ons gebruik die skikking van die numpy.random.normal()
metode, met 100000 waardes, om 'n histogram met 100 stawe te teken.
Ons spesifiseer dat die gemiddelde waarde 5,0 is, en die standaardafwyking is 1,0.
Dit beteken dat die waardes rondom 5,0 gekonsentreer moet wees, en selde verder as 1,0 van die gemiddelde af.
En soos jy uit die histogram kan sien, is die meeste waardes tussen 4.0 en 6.0, met 'n top op ongeveer 5.0.