Masjienleer - Standaardafwyking
Wat is standaardafwyking?
Standaardafwyking is 'n getal wat beskryf hoe verspreid die waardes is.
'n Lae standaardafwyking beteken dat die meeste van die getalle naby die gemiddelde (gemiddelde) waarde is.
'n Hoë standaardafwyking beteken dat die waardes oor 'n groter reeks versprei is.
Voorbeeld: Hierdie keer het ons die spoed van 7 motors geregistreer:
speed = [86,87,88,86,87,85,86]
Die standaardafwyking is:
0.9
Dit beteken dat die meeste van die waardes binne die reeks van 0,9 van die gemiddelde waarde is, wat 86,4 is.
Kom ons doen dieselfde met 'n keuse van getalle met 'n groter reeks:
speed = [32,111,138,28,59,77,97]
Die standaardafwyking is:
37.85
Dit beteken dat die meeste van die waardes binne die omvang van 37,85 van die gemiddelde waarde is, wat 77,4 is.
Soos u kan sien, dui 'n hoër standaardafwyking daarop dat die waardes oor 'n wyer reeks versprei is.
Die NumPy-module het 'n metode om die standaardafwyking te bereken:
Voorbeeld
Gebruik die NumPy std()
-metode om die standaardafwyking te vind:
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
Voorbeeld
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Variansie
Variansie is nog 'n getal wat aandui hoe verspreid die waardes is.
Trouens, as jy die vierkantswortel van die afwyking neem, kry jy die standaardafwyking!
Of andersom, as jy die standaardafwyking met homself vermenigvuldig, kry jy die afwyking!
Om die afwyking te bereken, moet jy soos volg doen:
1. Vind die gemiddelde:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Vir elke waarde: vind die verskil van die gemiddelde:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. Vir elke verskil: vind die vierkantwaarde:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. Die variansie is die gemiddelde aantal van hierdie kwadraatverskille:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
Gelukkig het NumPy 'n metode om die variansie te bereken:
Voorbeeld
Gebruik die NumPy var()
-metode om die variansie te vind:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
Standaard afwyking
Soos ons geleer het, is die formule om die standaardafwyking te vind die vierkantswortel van die variansie:
√1432.25 = 37.85
Of, soos in die voorbeeld van voorheen, gebruik die NumPy om die standaardafwyking te bereken:
Voorbeeld
Gebruik die NumPy std()
-metode om die standaardafwyking te vind:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Simbole
Standaardafwyking word dikwels voorgestel deur die simbool Sigma: σ
Variansie word dikwels voorgestel deur die simbool Sigma Square: σ 2
Hoofstuk Opsomming
Die Standaardafwyking en Variansie is terme wat dikwels in Masjienleer gebruik word, daarom is dit belangrik om te verstaan hoe om dit te kry, en die konsep daaragter.