supprimer la ligne avec une valeur nan

Question

disons, par exemple, j'ai ces données:

data <- c(1,2,3,4,5,6,NaN,5,9,NaN,23,9) attr(data,"dim") <- c(6,2) data [,1] [,2] [1,] 1 NaN [2,] 2 5 [3,] 3 9 [4,] 4 NaN [5,] 5 23 [6,] 6 9

Maintenant, je veux supprimer les lignes contenant les valeurs NaN: lignes 1 et 4. Mais je ne sais pas où sont ces lignes, si c'est un ensemble de données de 100 000+ lignes, donc je dois les trouver avec une fonction et supprimer la ligne complète.

Quelqu'un peut-il m'orienter dans la bonne direction?

Andrie · Accepted Answer

La fonction complete.cases vous indiquera où se trouvent les lignes dont vous avez besoin:

data <- matrix(c(1,2,3,4,5,6,NaN,5,9,NaN,23,9), ncol=2) data[complete.cases(data), ] [,1] [,2] [1,] 2 5 [2,] 3 9 [3,] 5 23 [4,] 6 9

Wojciech Sobala · Answer

LES DONNÉES

data <- matrix(rnorm(100000000), ncol=10000) idx <- sample(1:10000,100) idy <- sample(1:10000,100) data[idx,idy] <- NaN

UNE FONCTION

foo <- function(d=data) d[apply(d,2,function(x) any(is.nan(x))),]

DUREES

> system.time(data[complete.cases(data),]) user system elapsed 3.53 0.12 3.65 > system.time(foo(data)) user system elapsed 2.37 0.09 2.46