Pandas DataFrame är en 2-dimensionell märkt datastruktur som en tabell med rader och kolumner. Storleken och värdena på DataFrame är föränderliga, d.v.s. kan modifieras.
DataFrame används mest i dataanalys och datamanipulation. Det låter dig lagra data i tabellform som SQL-databas, MS Excel eller Google Sheets, vilket gör det lättare att utföra aritmetiska operationer på data.
Det är det mest använda Panda-objektet. De DataFrame() funktion används för att skapa en DataFrame i Pandas. Du kan också skapa Pandas DataFrame på flera sätt.
Pandas Dataframe() Syntax
pandas.DataFrame(data, index, kolumner)
justera bilden med css
Parametrar:
- data : Det är en datauppsättning från vilken en DataFrame ska skapas. Det kan vara en lista, ordbok, skalärt värde, serier och matriser, etc.
- index : Det är valfritt, som standard börjar indexet för DataFrame från 0 och slutar vid det sista datavärdet (n-1). Den definierar radetiketten explicit.
- kolumner : Den här parametern används för att tillhandahålla kolumnnamn i DataFrame. Om kolumnnamnet inte är definierat som standard kommer det att ha ett värde från 0 till n-1.
Returnerar:
- DataFrame-objekt
Nu när vi har diskuterat DataFrame()-funktionen, låt oss titta på olika sätt att skapa en DataFrame:
Olika sätt att skapa dataram i Python
Det finns flera sätt att skapa en Pandas dataram i Pytonorm . Du kan skapa en DataFrame med följande metoder:
- Skapa Pandas DataFrame med DataFrame()-funktionen
- Skapa Pandas DataFrame från lista med listor
- Skapa Pandas DataFrame från ordboken för ndarray/list
- Skapa Pandas DataFrame från listan över ordböcker
- Skapa Pandas DataFrame från en ordbok över serier
- Skapar DataFrame med hjälp av zip()-funktionen
- Skapa en DataFrame genom att explicit bevisa indexetiketten
Skapa en tom DataFrame med DataFrame() Method
DataFrame i Python kan skapas av DataFrame()-funktionen i Pandas bibliotek . Anropa bara funktionen med DataFrame-konstruktorn för att skapa en DataFrame.
Exempel : Skapa en tom DataFrame med funktionen DataFrame() i Python
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Produktion:
Empty DataFrame Columns: [] Index: []>
Skapa DataFrame från listor med listor
För att skapa en Pandas DataFrame från en lista av listor kan du använda funktionen pd.DataFrame() . Denna funktion tar en lista med listor som indata och skapar en DataFrame med samma antal rader och kolumner som inmatningslistan.
Exempel : Skapar DataFrame från listor med listor med DataFrame()-metoden
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Produktion:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Skapa DataFrame från Dictionary of ndArray/Lists
För att skapa DataFrame från en lexikon av ndarrays /lists måste alla arrayer vara av samma längd. Om ett index passeras ska längdindexet vara lika med längden på arrayerna.
Om inget index skickas kommer indexet som standard att vara range(n) där n är arraylängden.
Exempel : Skapar DataFrame från en ordbok med ndarray/lists
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
läsa från en csv-fil i java
>
Produktion:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Notera: När du skapar DataFrame med hjälp av en ordbok kommer nycklarna i ordboken att vara kolumnnamn som standard. Vi kan också tillhandahålla kolumnnamn uttryckligen med kolumnparameter.
Skapa DataFrame från List of Dictionaries
Pandas DataFrame kan skapas genom att passera listor över ordböcker som indata. Som standard tas ordboksnycklar som kolumner.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
tvådimensionellt array-program i c
>
Produktion:
a b c 0 1 2 3 1 10 20 30>
Ett annat exempel är att skapa en Pandas DataFrame genom att skicka listor med ordböcker och radindex .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Produktion:
b c a first 2 3 NaN second 20 30 10.0>
Skapa DataFrame från en ordbok av serier
För att skapa en DataFrame från en ordbok av serier , kan en ordbok skickas för att bilda en DataFrame. Det resulterande indexet är föreningen av alla serier av godkända indexerade.
Exempel: Skapa en DataFrame från en ordbok med serier.
Python3
min skärmstorlek
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Produktion:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Skapa DataFrame med hjälp av zip()-funktionen
Två listor kan slås samman med hjälp av zip() funktion . Skapa nu Pandas DataFrame genom att anropa pd.DataFrame()-funktionen.
Exempel: Skapar DataFrame med hjälp av zip()-funktionen.
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Produktion:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Skapa en DataFrame genom att explicit bevisa indexetiketten
För att skapa en DataFrame genom att tillhandahålla indexetiketten explicit kan du använda indexparametern för pd.DataFrame()-konstruktorn. Indexparametern tar en lista med indexetiketter som indata, och DataFrame kommer att använda dessa etiketter för raderna i DataFrame.
Exempel: Skapa en DataFrame genom att explicit bevisa indexetiketten
saira banu skådespelare
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Produktion:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Slutsats
Python Pandas DataFrame liknar en tabell med rader och kolumner. Det är en tvådimensionell datastruktur och är mycket användbar för dataanalys och datamanipulation.
I den här handledningen har vi diskuterat flera sätt att skapa en Pandas DataFrame. Med den här handledningen kommer du att kunna hantera alla komplexa krav för att skapa DataFrame.