R Strooi plot


Strooi erwe

Jy het uit die Plot hoofstuk geleer dat die plot()funksie gebruik word om getalle teen mekaar te plot.

'n "Verspreidingsplot" is 'n tipe plot wat gebruik word om die verwantskap tussen twee numeriese veranderlikes te vertoon, en teken een kolletjie vir elke waarneming.

Dit benodig twee vektore van dieselfde lengte, een vir die x-as (horisontaal) en een vir die y-as (vertikaal):

Voorbeeld

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Resultaat:

Die waarneming in die voorbeeld hierbo moet die resultaat toon van 12 motors wat verbyry.

Dit is dalk nie duidelik vir iemand wat die grafiek vir die eerste keer sien nie, so kom ons voeg 'n kopskrif en verskillende byskrifte by om die verspreidingsdiagram beter te beskryf:

Voorbeeld

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Resultaat:

Om saam te vat, die waarneming in die voorbeeld hierbo is die resultaat van 12 motors wat verbyry.

Die x-as wys hoe oud die motor is.

Die y-as wys die spoed van die motor wanneer dit verbyry.

Is daar enige verwantskappe tussen die waarnemings?

Dit lyk of hoe nuwer die kar is, hoe vinniger ry hy, maar dit kan toevallig wees, ons het immers net 12 motors geregistreer.


Vergelyk erwe

In die voorbeeld hierbo blyk dit 'n verband te wees tussen die motorspoed en ouderdom, maar wat as ons die waarnemings van 'n ander dag ook plot? Sal die verstrooiingsplot ons iets anders vertel?

Om die plot met 'n ander plot te vergelyk, gebruik die points()funksie:

Voorbeeld

Teken twee plotte op dieselfde figuur:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Resultaat:

Let wel: Om die verskil van die vergelyking te kan sien, moet jy verskillende kleure aan die plotte toeken (deur die colparameter te gebruik). Rooi verteenwoordig die waardes van dag 1, terwyl blou dag 2 verteenwoordig. Let daarop dat ons ook die cexparameter bygevoeg het om die grootte van die kolletjies te vergroot.

Gevolgtrekking van waarneming: Deur die twee plotte te vergelyk, dink ek dit is veilig om te sê dat hulle albei vir ons dieselfde gevolgtrekking gee: hoe nuwer die motor, hoe vinniger ry dit.