Algumas vezes necessitamos obter um subconjunto de um conjunto de dados. Se pudermos estabelecer um critério a partir dos valores deste conjunto de dados podemos utilizar o comando subset. Para obter uma amostra aleatória das linhas pensei na seguinte solução:
# cria um conjuto de dados com duas colunas e 500 linhas
dados <- data.frame(rnorm(500,5,3),rnorm(500,10,6))
dim(dados)
summary(dados)
# faz a amostra de 100 linhas sem reposição
dados.amostra<-dados[sample(1:nrow(dados),100,replace=F),]
dim(dados.amostra)
summary(dados.amostra)
Nenhum comentário:
Postar um comentário