Son muy pocas las ocasiones en que las variables de un conjunto de datos están libres de observaciones faltantes ( NAs o missing values ). Es usual que al abordar una data nos interese saber la cantidad de ausencias, y también su caracterización, es decir, si esa ( no respuesta ) obedece a un patrón específico o es atribuible a causas aleatorías. El conteo de valores faltantes por variable, en un data frame, puede realizarse con pocas líneas de código como en el siguiente ejemplo, hecho con una data ficticia y funciones de la familia apply : # datos ficticios set.seed(4363) datos Luego el total de no respuesta por variable sería: datos El paquete magritr puede hacer más cómoda la escritura de códigos como este: library(magrittr)# pipeline datos %>% lapply(., function(x) sum(is.na(x))) %>% unlist() # o con la función más estricta vapply datos %>% vapply(., function(x) sum(is.na(x)), numeric(1)) # V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 # 18 18 1...
Explorar procedimientos relacionados con el software R.