ggplot2
Simple: instalar tidyverse
install.packages('tidyverse')
Medio: instalar unicamente ggplot2
install.pacakages('ggplot2')
Avanzado: instalar desde GitHub
devtools::install_github('tidyverse/ggplot2')
library(tidyverse)
## -- Attaching packages -------------------------------------------- tidyverse 1.2.1 --
## v ggplot2 3.2.1 v purrr 0.3.2## v tibble 2.1.3 v dplyr 0.8.3## v tidyr 0.8.3 v stringr 1.4.0## v readr 1.3.1 v forcats 0.4.0
## -- Conflicts ----------------------------------------------- tidyverse_conflicts() --## x dplyr::filter() masks stats::filter()## x dplyr::lag() masks stats::lag()
Hadley Wickham
Crear representaciones gráficas de nuestros datos es un paso clave para poder comunicar información y hallazgos a otros.
ggplot2 es un sistema para crear gráficos, basado en The Grammar of Graphics.
Usted proporciona los datos, le dice a ggplot2 cómo asignar variables, qué caracteristicas mostrar y esta se ocupa de los detalles.
Visualizacion de forma esquematica
Secuencia comprensible de la creacion de graficos
Sencilla de replicar
Secuencia concistente
ggplot2
es un gran paquete: filosofia + funciones
...muy bien organizadas
ggplot2
es un gran paquete: filosofia + funciones
...muy bien organizadas
Muchos ejemplos de visualizacion impresionantes
...no estan en estas diapositivas
ggplot2
es un gran paquete: filosofia + funciones
...muy bien organizadas
Muchos ejemplos de visualizacion impresionantes
...no estan en estas diapositivas
Quiza toquemos muchas ideas muy rapido
...pero conoceras donde buscar ayuda
ggplot2
es un gran paquete: filosofia + funciones
...muy bien organizadas
Muchos ejemplos de visualizacion impresionantes
...no estan en estas diapositivas
Quiza toquemos muchas ideas muy rapido
...pero conoceras donde buscar ayuda
https://github.com/allisonhorst/stats-illustrations
]
Grammar of Graphics
"Una idea clara de lo que deseas mostrar, encamina la construccion de un grafico."
manufacturer | class | cty | hwy | model |
---|---|---|---|---|
audi | compact | 18 | 27 | a4 |
audi | compact | 15 | 25 | a4 quattro |
ford | suv | 12 | 18 | expedition 2wd |
ford | suv | 13 | 19 | explorer 4wd |
toyota | suv | 16 | 20 | 4runner 4wd |
toyota | compact | 21 | 31 | camry solara |
toyota | compact | 28 | 37 | corolla |
toyota | suv | 13 | 18 | land cruiser wagon 4wd |
ggplot(data)
Cada variable una a columna
Cada observaCion es una fila
Cada mediocion es una unidad de la observacion
ggplot(data)
country | 1997 | 2002 | 2007 |
---|---|---|---|
Canada | 30.30584 | 31.90227 | 33.39014 |
China | 1230.07500 | 1280.40000 | 1318.68310 |
United States | 272.91176 | 287.67553 | 301.13995 |
ggplot(data)
country | 1997 | 2002 | 2007 |
---|---|---|---|
Canada | 30.30584 | 31.90227 | 33.39014 |
China | 1230.07500 | 1280.40000 | 1318.68310 |
United States | 272.91176 | 287.67553 | 301.13995 |
tidy_pop <- gather(messy_pop, 'year', 'pop', -country)
country | year | pop |
---|---|---|
Canada | 1997 | 30.306 |
China | 1997 | 1230.075 |
United States | 1997 | 272.912 |
Canada | 2002 | 31.902 |
China | 2002 | 1280.400 |
United States | 2002 | 287.676 |
Canada | 2007 | 33.390 |
China | 2007 | 1318.683 |
United States | 2007 | 301.140 |
+ aes()
Informacion a ser visualizada
year
pop
country
+ aes()
Informacion a ser visualizada
year → x
pop → y
country → shape, color, etc.
+ aes()
Informacion a ser visualizada
aes( x = year, y = pop, color = country)
+ geom_*()
Formas geometricas que se mostraran en el grafico
+ geom_*()
Tipo | Funcion |
---|---|
Punto | geom_point() |
Linea | geom_line() |
Barra | geom_bar() , geom_col() |
Histograma | geom_histogram() |
Regrecion | geom_smooth() |
Boxplot | geom_boxplot() |
Texto | geom_text() |
Linea Vertical | geom_vline() |
Linea Horizontal | geom_hline() |
Columnas | geom_col() |
https://eric.netlify.com/2017/08/10/most-popular-ggplot2-geoms/
+ geom_*()
Visisten http://ggplot2.tidyverse.org/reference/ para mas opciones
## [1] "geom_abline" "geom_area" "geom_bar" "geom_bin2d" ## [5] "geom_blank" "geom_boxplot" "geom_col" "geom_contour" ## [9] "geom_count" "geom_crossbar" "geom_curve" "geom_density" ## [13] "geom_density_2d" "geom_density2d" "geom_dotplot" "geom_errorbar" ## [17] "geom_errorbarh" "geom_freqpoly" "geom_hex" "geom_histogram" ## [21] "geom_hline" "geom_jitter" "geom_label" "geom_line" ## [25] "geom_linerange" "geom_map" "geom_path" "geom_point" ## [29] "geom_pointrange" "geom_polygon" "geom_qq" "geom_qq_line" ## [33] "geom_quantile" "geom_raster" "geom_rect" "geom_ribbon" ## [37] "geom_rug" "geom_segment" "geom_sf" "geom_sf_label" ## [41] "geom_sf_text" "geom_smooth" "geom_spoke" "geom_step" ## [45] "geom_text" "geom_tile" "geom_violin" "geom_vline"
+ geom_*()
Visisten http://ggplot2.tidyverse.org/reference/ para mas opciones
## [1] "geom_abline" "geom_area" "geom_bar" "geom_bin2d" ## [5] "geom_blank" "geom_boxplot" "geom_col" "geom_contour" ## [9] "geom_count" "geom_crossbar" "geom_curve" "geom_density" ## [13] "geom_density_2d" "geom_density2d" "geom_dotplot" "geom_errorbar" ## [17] "geom_errorbarh" "geom_freqpoly" "geom_hex" "geom_histogram" ## [21] "geom_hline" "geom_jitter" "geom_label" "geom_line" ## [25] "geom_linerange" "geom_map" "geom_path" "geom_point" ## [29] "geom_pointrange" "geom_polygon" "geom_qq" "geom_qq_line" ## [33] "geom_quantile" "geom_raster" "geom_rect" "geom_ribbon" ## [37] "geom_rug" "geom_segment" "geom_sf" "geom_sf_label" ## [41] "geom_sf_text" "geom_smooth" "geom_spoke" "geom_step" ## [45] "geom_text" "geom_tile" "geom_violin" "geom_vline"
O solo escriban
geom_
en la consola de RStudio
ggplot(tidy_pop)
ggplot(tidy_pop) + aes(x = year, y = pop)
ggplot(tidy_pop) + aes(x = year, y = pop) + geom_point()
ggplot(tidy_pop) + aes(x = year, y = pop, color = country) + geom_point()
ggplot(tidy_pop) + aes(x = year, y = pop, color = country) + geom_point() + geom_line()
geom_path: Cada grupo esta formado solopor una observacion. Es necesario especificar el argumento groupen aes()
ggplot(tidy_pop) + aes(x = year, y = pop, color = country) + geom_point() + geom_line( aes(group = country))
g <- ggplot(tidy_pop) + aes(x = year, y = pop, color = country) + geom_point() + geom_line( aes(group = country))g
+ geom_*()
geom_*(mapping, data, stat, position)
data
cada geom puede tener su propia data
map
geom_*, argumentos en aes()
geom_point
requiere x
- y
, opcional shape
, color
, size
, etc.geom_ribbon
requiere x
, ymin
- ymax
, opcional fill
?geom_ribbon
+ geom_*()
geom_*(mapping, data, position)
position
Ajusta lapocision de los objetos'dodge'
, 'stack'
, 'jitter'
+facet_wrap() +facet_grid()
g + facet_wrap(~ country)
+facet_wrap() +facet_grid()
g + facet_grid(continent ~ country)
+ labs()
g + labs(x = "Year", y = "Population")
+ coord_*()
g + coord_flip()
+ coord_*()
g + coord_polar()
+ scale_*_*()
scale
+ _
+ <aes>
+ _
+ <type>
+ ()
Que parametr deseas modificar? → <aes>
De que tipo es el parametro? → <type>
scale_x_discrete()
scale_y_log10()
scale_fill_discrete()
scale_color_manual()
+ scale_*_*()
g + scale_color_manual(values = c("peru", "pink", "plum"))
+ scale_*_*()
g + scale_y_log10()
+ scale_*_*()
g + scale_x_discrete(labels = c("MCMXCVII", "MMII", "MMVII"))
+ theme()
Se puede manipular la apariencia del grafico
Algunas opciones dentro de ggplot2
g + theme_bw()
g + theme_dark()
g + theme_gray()
g + theme_light()
g + theme_minimal()
+ theme()
Se tiene un gran numero de parametros,
agrupadas por el area de trabajo:
line
, rect
, text
, title
axis
: x-, y-, title, ticks, lineslegend
: leyendapanel
: area actual de trabajoplot
: todo el panelstrip
: etiquetas de los sub paneles+ theme()
Para modificar los elementos se cuenta con:
element_blank()
elimina los elementoselement_line()
element_rect()
element_text()
+ theme()
g + theme_bw()
+ theme()
g + theme_minimal() + theme(text = element_text(family = "Palatino"))
+ theme()
Pueden cargar un tema como opcion por defecto con: theme_set()
my_theme <- theme_bw() + theme( text = element_text(family = "Palatino", size = 12), panel.border = element_rect(colour = 'grey80'), panel.grid.minor = element_blank() )theme_set(my_theme)
Todos los graficos pueden usar ahora este tema!
+ theme()
g
+ theme()
g + theme(legend.position = 'bottom')
Se tiene la funcion, ggsave( )
ggsave( filename = "my_plot.png", plot = my_plot, width = 10, height = 8, dpi = 100, device = "png")
library(ggalt)df <- tibble(trt = LETTERS[1 : 10], value = seq(100, 10, by = -10))ggplot(df, aes(trt, value)) + geom_lollipop()
library(qqplotr)set.seed(0)smp <- data.frame(norm = rnorm(100))# Normal Q-Q plot of Normal datagg <- ggplot(data = smp, mapping = aes(sample = norm)) + stat_qq_band() + stat_qq_line() + stat_qq_point()gg + labs(x = "Theoretical Quantiles", y = "Sample Quantiles")
ggplot2 docs: http://ggplot2.tidyverse.org/
R4DS - Data visualization: http://r4ds.had.co.nz/data-visualisation.html
Hadley Wickham's ggplot2 book: https://www.amazon.com/dp/0387981403/
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |