Zipf verspreiding


Zipf-verdelings word gebruik om data te monster gebaseer op zipf se wet.

Zipf se wet: In 'n versameling is die nde algemene term 1/n keer van die mees algemene term. Bv. 5de algemene woord in Engels kom byna 1/5 keer voor as van die mees gebruikte woord.

Dit het twee parameters:

a - verspreiding parameter.

size - Die vorm van die teruggekeerde skikking.

Voorbeeld

Trek 'n steekproef uit vir zipf-verspreiding met verspreidingsparameter 2 met grootte 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Visualisering van Zipf-verspreiding

Voorbeeld van 1000 punte, maar teken slegs punte met waarde < 10 vir meer betekenisvolle grafiek.

Voorbeeld

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Resultaat