En box graph är ett diagram som används för att visa information i form av distribution genom att rita boxplots för var och en av dem. Denna fördelning av data baseras på fem uppsättningar (minimum, första kvartil, median, tredje kvartil och maximum).
Boxplots in R programmeringsspråk
Boxplots skapas i R med hjälp av boxplot() fungera.
Syntax: boxplot(x, data, notch, varwidth, names, main)
Parametrar:
x: Denna parameter ställs in som en vektor eller en formel. data: Denna parameter ställer in dataramen. notch: Denna parameter är etiketten för horisontell axel. varwidth: Denna parameter är ett logiskt värde. Ställ in som sant för att rita bredden på rutan i proportion till provstorleken. main: Denna parameter är titeln på diagrammet. names: Denna parameter är gruppetiketterna som kommer att visas under varje boxplot.
Skapa en datamängd
För att förstå hur vi kan skapa en boxplot:
- Vi använder datamängden mtcars.
- Låt oss titta på kolumnerna mpg och cyl i mtcars.
R
sträng till char i java
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
Produktion:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
Skapar Boxplotten
Skapar Boxplot-grafen.
- Ta de parametrar som krävs för att göra en boxplot.
- Nu ritar vi en graf för sambandet mellan mpg och cyl.
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
Produktion:

Boxtomt i R
Boxplot med skåra
Så här ritar du en boxplot med hjälp av en skåra:
- Med hjälp av Notch kan vi ta reda på hur medianen för olika datagrupper matchar varandra.
R
typer av mjukvarutestning
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
Produktion:

Box Tomt i R
col: Använder en vektor av färger (my_colors) för att ändra fyllningsfärgen för rutorna.
gränser: Ställer in färgen på boxkanterna till svart.
hack: För att illustrera konfidensintervall läggs ett hack i rutorna.
hackbredd: Hanterar skårornas bredd.
medicin: Gör medianlinjens färg vit.
whiskcol: Ställer in morrhårens färg till svart med kommandot whiskcol.
boxwex: Ändrar lådornas bredd.
outpch : Ställer in avvikelsernas former till heldragna cirklar.
outcol: Ändrar avvikelsernas färg till svart.
Flera Boxplot
Här skapar vi flera boxplots. De individuella data för vilka en boxplot-representation krävs baseras på funktionen.
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
sträng delad bash
>
Produktion:

Flera boxplotter i R
- I den här koden börjar vi med att lista variablerna i variabelvektorn som vi vill göra boxplots för. Jag har lagt till mpg, disp, hp och wt i det här exemplet, men du kan ändra den här listan så att den passar dina behov.
- Kartläggningslayouten skapas sedan genom att använda par-funktionen och syntaxen mfrow = c(1, length(variables)), vilket genererar ett rutnät med en rad och lika många kolumner som det finns variabler i variabelvektorn.
- Vi använder boxplotfunktionen inuti loopen för att generera en boxplot för varje variabel. Get(var)-funktionen drar dynamiskt de matchande kolumnvärdena från datamängden. Med hjälp av de givna inställningarna ändrar vi varje boxplotts utseende.