Pandas bibliotek i Python är mycket användbart för manipulering av matematiska data och används ofta inom maskininlärning. Den innehåller många metoder för att den ska fungera korrekt. plats() och iloc() är en av dessa metoder. Dessa används för att skära upp data från Pandas DataFrame . De hjälper till med bekvämt urval av data från DataFrame i Pytonorm . De används för att filtrera data enligt vissa villkor.
Skillnaden mellan loc() och iloc() i Pandas DataFrame
Här kommer vi att se skillnaden mellan loc() och iloc() Funktion i Pandas DataFrame. För att se och jämföra skillnaden mellan dessa två kommer vi att skapa en exempeldataram som vi kommer att använda i hela stycket. Hur båda dessa metoder fungerar förklaras i exempeldataset av bilar.
python3
stjärntopologi
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Python loc() funktion
De loc() funktion är etikettbaserad datavalsmetod vilket innebär att vi måste skicka namnet på raden eller kolumnen som vi vill välja. Denna metod inkluderar det sista elementet i intervallet som skickas i det, till skillnad från iloc(). loc() kan acceptera booleska data till skillnad från iloc(). Många operationer kan utföras med metoden loc() som
Exempel 1: Välja data enligt vissa villkor
I det här exemplet använder kodenloc>funktion för att välja och visa rader från DataFrame där märket är 'Maruti' och körsträckan är större än 25, vilket visar relevant information om Maruti-bilar med hög körsträcka.
python3
# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])> |
>
>
för varje typskrift
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Exempel 2: Välja ett radintervall från DataFrame
I det här exemplet använder kodenloc>funktion för att extrahera och visa rader med index från 2 till 5 (inklusive) från DataFrame, vilket ger information om ett specifikt antal bilar i datamängden.
python3
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
>
>
Produktion
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Exempel 3: Uppdatera värdet för valfri kolumn
I det här exemplet använder kodenloc>funktion för att uppdatera 'Mileage'-värdena till 22 för bilar i DataFrame där tillverkningsåret är före 2015. Den modifierade DataFrame visas sedan, vilket återspeglar ändringarna som gjorts i Mileage-kolumnen.
python3
switch case java
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
bash while loop
>
>
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Python iloc() funktion
De iloc() funktion är en indexbaserad urvalsmetod som innebär att vi måste skicka ett heltalsindex i metoden för att välja en specifik rad/kolumn. Denna metod inkluderar inte det sista elementet i intervallet som skickas i det till skillnad från loc(). iloc() accepterar inte booleska data till skillnad från loc(). Operationer som utförs med iloc() är:
Exempel 1: Välja rader med heltalsindex
I det här exemplet använder kodeniloc>funktion för att extrahera och visa specifika rader med index 0, 2, 4 och 7 från DataFrame, som visar information om valda bilar i datamängden.
python3
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
Produktion
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Exempel 2: Välja ett intervall av kolumner och rader samtidigt
I det här exemplet använder kodeniloc>funktion för att extrahera och visa en delmängd av DataFrame, inklusive raderna 1 till 4 och kolumnerna 2 till 4. Detta ger information om ett specifikt antal bilar och deras relevanta attribut i datamängden.
python3
objektklass i java
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
>
Produktion
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>