Checagem-filtragem-e-transformacao-dos-dados
Checagem-filtragem-e-transformacao-dos-dados.Rmd
library(distanceMonitoraflorestal)
PARTE II - Checagem, seleção e transformação dos dados
Base de dados para as análises
A base de dados para as análise tornam-se disponíveis ao usuário com
o carregamento do pacote com o nome de
monitora_aves_masto_florestal
. Podemos inspecionar seu
conteúdo usando a função glimpse
do pacote
dplyr
.
# inspecionar a base de dados
dplyr::glimpse(monitora_aves_masto_florestal)
A base de dados de aves e mamíferos de médio e grande porte gerada a partir de amostragem por distância contem 27887 observações (linhas) e 22 variáveis (colunas). Dentre as variáveis, há 12 que constituem fatores, ou seja, são variáveis categóricas com diferentes níveis (ex. nome_ea, nome_uc, nome_sp), 10 constituem variáveis numéricas contínuas (ex. numero_ea, esforco_total, distancia), 0 consituem variaǘeis numéricas inteiras (ex. ) e 2 variáveis que representam datas e tempos (ex. data_amostragem, tempo_censo). Todas as análises utilizam essa base de dados.
Filtragem dos dados
Para conduzir as análises de estimatica de abundância e densidade das
espécies, é necessário selecionar a espécie alvo e a(s) Unidade(s) de
Conservação onde esta(s) ocorre(m). Para isso, o pacote oferece uma
função para filtragem e seleção dos dados chamada
filtrar_dados()
. A função possui três argumentos,
nome_ucs
, nome_sps
e
validacao_obs
, permite selecionar uma parte dos dados de
acordo com a(s) Unidade(s) de Conservação, espécie(s) e nível de
validação taxonômico desejado, respectivamente. É possível acessar a
documentação da função filtrar_dados()
usando o código
help(filtrar_dados)
ou ?filtrar_dados
.
Por configuração, a função filtrar_dados()
retorna a
base de dados monitora_aves_masto_florestal
.
# retornar a base de dados completa
filtrar_dados()
Para retornar as observações de uma ou mais Unidades de Conservação,
o(s) nome(s) da(s) Unidade(s) de Conservação deve(m) ser informados
usando o argumento nome_ucs
.
# consultar o nome das UCs
nomes_ucs <- monitora_aves_masto_florestal |>
dplyr::distinct(nome_uc)
nomes_ucs
# retornar as observações de uma UC fornecendo o nome
filtrar_dados(nome_ucs = "resex_tapajos_arapiuns")
Também é possível selecionar uma ou mais Unidades de Conservação fornecendo um vetor do tipo caracter com um ou mais elementos.
# gerar um vetor contendo os nomes das UCs
nomes_ucs <- dplyr::pull(nomes_ucs)
nomes_ucs
# retornar as observações de uma UC fornecendo o nome
filtrar_dados(nome_ucs = nomes_ucs[1])
# retornar as observações de mais de uma UC
filtrar_dados(nome_ucs = nomes_ucs[2:3])
Para selecionar as observações de uma ou mais espécies, o(s) nome(s)
da(s) espécie(s) ser informados usando o argumento
nome_sps
.
# consultar o nome das UCs
nomes_sps <- monitora_aves_masto_florestal |>
dplyr::distinct(nome_sp)
nomes_sps
# retornar as observações de uma espécie fornecendo o nome
filtrar_dados(nome_sps = "dasyprocta_croconota")
Também é possível selecionar uma ou mais espécies fornecendo um vetor do tipo caracter com um ou mais elementos.
# gerar um vetor contendo os nomes das UCs
nomes_sps <- dplyr::pull(nomes_sps)
nomes_sps
# retornar as observações de uma UC fornecendo o nome
filtrar_dados(nome_sps = nomes_sps[1])
# retornar as observações de mais de uma UC
filtrar_dados(nome_sps = nomes_sps[c(33, 34)])
Para selecionar as observações de uma ou mais observações validadas,
o(s) nível(is) taxonômico(s) deve(m) ser informados usando o argumento
validacao_obs
.
# retornar as observações de uma espécie fornecendo o nome
filtrar_dados(
nome_sps = nomes_sps[c(33, 34)],
validacao_obs = "especie"
)
Finalmente, também é possível selecionar as observações a partir da(s) Unidade(s) de Cosnervação, espécie(s) e nível(is) taxonômico(s) de validação.
# retornar as observações de uma espécie fornecendo o nome
filtrar_dados(
nome_ucs = "flona_do_jamari",
nome_sps = "callicebus_brunneus",
validacao_obs = "especie"
)
Transformação dos dados
O uso da função que ajusta os modelos de função de detecção aos dados
para estimativa de abundância e densidade das espécies exigem que os
dados apresentem um formato específico. A função
transformar_dados_formato_Dsitance()
realiza a seleção das
variáveis e as transformações necessárias para deixar os dados prontos
para serem analisados.
Primeiramente, é necessário criar um tabela de dados contendo as observações da espécie que se deseja estimar a densidade.
dasy_croc <- filtrar_dados(
nome_sps = "dasyprocta_croconota",
validacao_obs = "especie"
)
# transformar os dados para o formato do Distance
dasy_croc_com_rep <- transformar_dados_formato_Distance(dasy_croc)
dasy_croc_com_rep
A função também permite eliminar as amostragens repetidas realizadas
em uma mesma estação do ano, selecionando apenas o dia em que foi
registrado o maior número de observações para uma determinada estação e
ano. Para eliminar as amostragens repetidas, basta utilizar o argumento
amostras_repetidas = FALSE
.
dasy_croc_sem_rep <- transformar_dados_formato_Distance(
dados = dasy_croc,
amostras_repetidas = FALSE
)
dasy_croc_sem_rep