logo

Sätt att filtrera Pandas DataFrame efter kolumnvärden

Att filtrera en Pandas DataFrame med hjälp av kolumnvärden är en vanlig operation när man kör med information i Python. Du kan använda olika metoder och tekniker för att uppnå detta. Här är många sätt att filtrera bort en Pandas DataFrame genom kolumnvärden.

I det här inlägget kommer vi att se olika sätt att filtrera Pandas Dataframe efter kolumnvärden. Låt oss först skapa en dataram:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Produktion:

Dataram

Välja rader av Pandas Dataframe baserat på ett visst kolumnvärde med operatorn '>', '=', '=', '<=', '!='.

Exempel 1: Att välja alla rader från den givna dataramen där 'Procentandel' är större än 75 med [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Produktion:

utdataram

Exempel 2: Att välja alla rader från den givna dataramen där 'Procentandel' är större än 70 med plats [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

utdataram-1

Att välja de rader av Pandas Dataframe vars kolumnvärde finns i listan med hjälp av du() metod för dataramen.

Exempel 1: Att välja alla rader från den givna dataramen där 'Stream' finns i alternativlistan med hjälp av [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

utdataram-2

Exempel 2: Att välja alla rader från den givna dataramen där 'Stream' finns i alternativlistan med hjälp av plats [ ] .

Pytonorm




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

utdataram-3

Välja rader av Pandas Dataframe baserat på flera kolumnvillkor med hjälp av '&'-operatorn.

Exempel 1: Att välja alla rader från den givna dataramen där 'Age' är lika med 22 och 'Stream' finns i alternativlistan med [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

utdataram-4

Exempel 2: Att välja alla rader från den givna dataramen där 'Age' är lika med 22 och 'Stream' finns i alternativlistan med plats [ ] .

Python3




slumpvis ordning i sql

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produktion:

utdataram-5