Pandas datarame
Wat is 'n DataFrame?
'n Pandas DataFrame is 'n 2-dimensionele datastruktuur, soos 'n 2-dimensionele skikking, of 'n tabel met rye en kolomme.
Voorbeeld
Skep 'n eenvoudige Pandas DataFrame:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
Resultaat
calories duration 0 420 50 1 380 40 2 390 45
Vind ry
Soos u uit die resultaat hierbo kan sien, is die DataFrame soos 'n tabel met rye en kolomme.
Pandas gebruik die loc
kenmerk om een of meer gespesifiseerde ry(s) terug te gee
Voorbeeld
Keer terug ry 0:
#refer to the row index:
print(df.loc[0])
Resultaat
calories 420 duration 50 Name: 0, dtype: int64
Let wel: Hierdie voorbeeld gee 'n Pandas -reeks terug .
Voorbeeld
Keer ry 0 en 1 terug:
#use a list of indexes:
print(df.loc[[0, 1]])
Resultaat
calories duration 0 420 50 1 380 40
Let wel: As u , gebruik []
, is die resultaat 'n Pandas DataFrame .
Word gesertifiseer!
R10 INSKRYF
Benoemde Indekse
Met die index
argument kan jy jou eie indekse noem.
Voorbeeld
Voeg 'n lys name by om elke ry 'n naam te gee:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
Resultaat
calories duration day1 420 50 day2 380 40 day3 390 45
Vind benoemde indekse
Gebruik die benoemde indeks in die loc
kenmerk om die gespesifiseerde ry(s) terug te gee.
Voorbeeld
Keer "dag 2" terug:
#refer to the named index:
print(df.loc["day2"])
Resultaat
calories 380 duration 40 Name: 0, dtype: int64
Laai lêers in 'n dataraam
As jou datastelle in 'n lêer gestoor word, kan Pandas dit in 'n DataFrame laai.
Voorbeeld
Laai 'n kommageskeide lêer (CSV-lêer) in 'n DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Jy sal meer leer oor die invoer van lêers in die volgende hoofstukke.