Pandas - Plot



Plot

Pandas gebruik die plot()metode om diagramme te skep.

Ons kan Pyplot, 'n submodule van die Matplotlib-biblioteek gebruik om die diagram op die skerm te visualiseer.

Lees meer oor Matplotlib in ons Matplotlib-tutoriaal .

Voorbeeld

Voer pyplot van Matplotlib in en visualiseer ons DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Die voorbeelde in hierdie bladsy gebruik 'n CSV-lêer genaamd: 'data.csv'.

Laai data.csv af of Open data.csv


Strooi plot

Spesifiseer dat jy 'n spreidingsplot wil hê met die kindargument:

kind = 'scatter'

'n Spreidiagram benodig 'n x- en 'n y-as.

In die voorbeeld hieronder sal ons "Duur" vir die x-as en "Kalorieë" vir die y-as gebruik.

Sluit die x- en y-argumente soos volg in:

x = 'Duration', y = 'Calories'

Voorbeeld

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Resultaat

Onthou: In die vorige voorbeeld het ons geleer dat die korrelasie tussen "Duur" en "Kalorieë" was 0.922721, en ons het afgesluit met die feit dat hoër tydsduur meer kalorieë verbrand beteken.

Deur na die verspreidingsdiagram te kyk, sal ek saamstem.

Kom ons skep nog 'n spreidingsdiagram, waar daar 'n slegte verhouding tussen die kolomme is, soos "Duration" en "Maxpulse", met die korrelasie 0.009403:

Voorbeeld

'n Spreidiagram waar daar geen verband tussen die kolomme is nie:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Resultaat


w3schools CERTIFIED . 2021

Word gesertifiseer!

Voltooi die Pandas-modules, doen die oefeninge, neem die eksamen, en jy sal w3schools-gesertifiseer word!

R10 INSKRYF

Histogram

Gebruik die kindargument om te spesifiseer dat jy 'n histogram wil hê:

kind = 'hist'

'n Histogram benodig slegs een kolom.

'n Histogram wys vir ons die frekwensie van elke interval, bv. hoeveel oefensessies het tussen 50 en 60 minute geduur?

In die voorbeeld hieronder sal ons die "Duration" kolom gebruik om die histogram te skep:

Voorbeeld

df["Duration"].plot(kind = 'hist')

Resultaat

Let wel: Die histogram vertel ons dat daar meer as 100 oefensessies was wat tussen 50 en 60 minute geduur het.


Toets jouself met oefeninge

Oefening:

Voeg 'n korrekte sintaksis in om die data in DataFrame as 'n diagram (plot) te visualiseer.

df.()