Pandas - Plot
Plot
Pandas gebruik die plot()
metode om diagramme te skep.
Ons kan Pyplot, 'n submodule van die Matplotlib-biblioteek gebruik om die diagram op die skerm te visualiseer.
Lees meer oor Matplotlib in ons Matplotlib-tutoriaal .
Voorbeeld
Voer pyplot van Matplotlib in en visualiseer ons DataFrame:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
Die voorbeelde in hierdie bladsy gebruik 'n CSV-lêer genaamd: 'data.csv'.
Laai data.csv af of Open data.csv
Strooi plot
Spesifiseer dat jy 'n spreidingsplot wil hê met die
kind
argument:
kind = 'scatter'
'n Spreidiagram benodig 'n x- en 'n y-as.
In die voorbeeld hieronder sal ons "Duur" vir die x-as en "Kalorieë" vir die y-as gebruik.
Sluit die x- en y-argumente soos volg in:
x = 'Duration', y = 'Calories'
Voorbeeld
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Resultaat
Onthou:
In die vorige voorbeeld het ons geleer dat die korrelasie tussen "Duur" en "Kalorieë" was 0.922721
, en ons het afgesluit met die feit dat hoër tydsduur meer kalorieë verbrand beteken.
Deur na die verspreidingsdiagram te kyk, sal ek saamstem.
Kom ons skep nog 'n spreidingsdiagram, waar daar 'n slegte verhouding tussen die kolomme is, soos "Duration" en "Maxpulse", met die korrelasie 0.009403
:
Voorbeeld
'n Spreidiagram waar daar geen verband tussen die kolomme is nie:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Resultaat
Word gesertifiseer!
R10 INSKRYF
Histogram
Gebruik die
kind
argument om te spesifiseer dat jy 'n histogram wil hê:
kind = 'hist'
'n Histogram benodig slegs een kolom.
'n Histogram wys vir ons die frekwensie van elke interval, bv. hoeveel oefensessies het tussen 50 en 60 minute geduur?
In die voorbeeld hieronder sal ons die "Duration" kolom gebruik om die histogram te skep:
Voorbeeld
df["Duration"].plot(kind = 'hist')
Resultaat
Let wel: Die histogram vertel ons dat daar meer as 100 oefensessies was wat tussen 50 en 60 minute geduur het.