Ewekansige dataverspreiding


Wat is dataverspreiding?

Dataverspreiding is 'n lys van alle moontlike waardes, en hoe gereeld elke waarde voorkom.

Sulke lyste is belangrik wanneer daar met statistiek en datawetenskap gewerk word.

Die ewekansige module bied metodes wat ewekansig gegenereerde dataverspreidings terugstuur.


Ewekansige verspreiding

'n Ewekansige verspreiding is 'n stel ewekansige getalle wat 'n sekere waarskynlikheidsdigtheidsfunksie volg .

Waarskynlikheidsdigtheidfunksie: 'n Funksie wat 'n kontinue waarskynlikheid beskryf. dws waarskynlikheid van alle waardes in 'n skikking.

Ons kan ewekansige getalle op grond van gedefinieerde waarskynlikhede genereer deur die choice()metode van die randommodule te gebruik.

Die choice()metode stel ons in staat om die waarskynlikheid vir elke waarde te spesifiseer.

Die waarskynlikheid word bepaal deur 'n getal tussen 0 en 1, waar 0 beteken dat die waarde nooit sal voorkom nie en 1 beteken dat die waarde altyd sal voorkom.

Voorbeeld

Genereer 'n 1-D-skikking wat 100 waardes bevat, waar elke waarde 3, 5, 7 of 9 moet wees.

Die waarskynlikheid dat die waarde 3 is, word op 0,1 gestel

Die waarskynlikheid dat die waarde 5 is, word op 0,3 gestel

Die waarskynlikheid dat die waarde 7 is, word op 0,6 gestel

Die waarskynlikheid dat die waarde 9 is, word op 0 gestel

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

Die som van alle waarskynlikheidsgetalle moet 1 wees.

Selfs as jy die voorbeeld hierbo 100 keer hardloop, sal die waarde 9 nooit voorkom nie.

Jy kan skikkings van enige vorm en grootte terugstuur deur die vorm in die sizeparameter te spesifiseer.

Voorbeeld

Dieselfde voorbeeld as hierbo, maar gee 'n 2-D skikking terug met 3 rye, wat elk 5 waardes bevat.

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)