Ewekansige dataverspreiding
Wat is dataverspreiding?
Dataverspreiding is 'n lys van alle moontlike waardes, en hoe gereeld elke waarde voorkom.
Sulke lyste is belangrik wanneer daar met statistiek en datawetenskap gewerk word.
Die ewekansige module bied metodes wat ewekansig gegenereerde dataverspreidings terugstuur.
Ewekansige verspreiding
'n Ewekansige verspreiding is 'n stel ewekansige getalle wat 'n sekere waarskynlikheidsdigtheidsfunksie volg .
Waarskynlikheidsdigtheidfunksie: 'n Funksie wat 'n kontinue waarskynlikheid beskryf. dws waarskynlikheid van alle waardes in 'n skikking.
Ons kan ewekansige getalle op grond van gedefinieerde waarskynlikhede genereer deur die
choice()
metode van die
random
module te gebruik.
Die choice()
metode stel ons in staat om die waarskynlikheid vir elke waarde te spesifiseer.
Die waarskynlikheid word bepaal deur 'n getal tussen 0 en 1, waar 0 beteken dat die waarde nooit sal voorkom nie en 1 beteken dat die waarde altyd sal voorkom.
Voorbeeld
Genereer 'n 1-D-skikking wat 100 waardes bevat, waar elke waarde 3, 5, 7 of 9 moet wees.
Die waarskynlikheid dat die waarde 3 is, word op 0,1 gestel
Die waarskynlikheid dat die waarde 5 is, word op 0,3 gestel
Die waarskynlikheid dat die waarde 7 is, word op 0,6 gestel
Die waarskynlikheid dat die waarde 9 is, word op 0 gestel
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(100))
print(x)
Die som van alle waarskynlikheidsgetalle moet 1 wees.
Selfs as jy die voorbeeld hierbo 100 keer hardloop, sal die waarde 9 nooit voorkom nie.
Jy kan skikkings van enige vorm en grootte terugstuur deur die vorm in die
size
parameter te spesifiseer.
Voorbeeld
Dieselfde voorbeeld as hierbo, maar gee 'n 2-D skikking terug met 3 rye, wat elk 5 waardes bevat.
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(3, 5))
print(x)