Anotações R Statistical Computing: Amostrar linhas em um data.frame

O R é um programa livre multiplataforma para análises estatísticas que pode ser baixado em seu site ou adicionado na lista de repositórios de máquinas linux. Suas possibilidades de aplicação em diversas áreas são praticamente ilimitadas.
Neste blog postarei o resultado de minha experiência em sua utilização nas áreas de dinâmica de populações de peixes, ciência pesqueira e ecologia.
As postagens deste blog se destina, além de mim mesmo, a iniciantes no R e alunos da minha área de atuação.
Aprendi muito em livros e nas listas de discussão R-help e a R_STAT, mas ainda tenho muito pela frente. Agradeço desde já qualquer contribuição.

domingo, 25 de março de 2012

Amostrar linhas em um data.frame

Algumas vezes necessitamos obter um subconjunto de um conjunto de dados. Se pudermos estabelecer um critério a partir dos valores deste conjunto de dados podemos utilizar o comando subset. Para obter uma amostra aleatória das linhas pensei na seguinte solução:

# cria um conjuto de dados com duas colunas e 500 linhas

dados <- data.frame(rnorm(500,5,3),rnorm(500,10,6))

dim(dados)

summary(dados)

# faz a amostra de 100 linhas sem reposição

dados.amostra<-dados[sample(1:nrow(dados),100,replace=F),]

dim(dados.amostra)

summary(dados.amostra)

domingo, 25 de março de 2012

Amostrar linhas em um data.frame

Nenhum comentário:

Postar um comentário