Checagem-filtragem-e-transformacao-dos-dados • distanceMonitoraflorestal

library(distanceMonitoraflorestal)

PARTE II - Checagem, seleção e transformação dos dados

Base de dados para as análises

A base de dados para as análise tornam-se disponíveis ao usuário com o carregamento do pacote com o nome de monitora_aves_masto_florestal. Podemos inspecionar seu conteúdo usando a função glimpse do pacote dplyr.

# inspecionar a base de dados
dplyr::glimpse(monitora_aves_masto_florestal)

A base de dados de aves e mamíferos de médio e grande porte gerada a partir de amostragem por distância contem 27887 observações (linhas) e 22 variáveis (colunas). Dentre as variáveis, há 12 que constituem fatores, ou seja, são variáveis categóricas com diferentes níveis (ex. nome_ea, nome_uc, nome_sp), 10 constituem variáveis numéricas contínuas (ex. numero_ea, esforco_total, distancia), 0 consituem variaǘeis numéricas inteiras (ex. ) e 2 variáveis que representam datas e tempos (ex. data_amostragem, tempo_censo). Todas as análises utilizam essa base de dados.

Filtragem dos dados

Para conduzir as análises de estimatica de abundância e densidade das espécies, é necessário selecionar a espécie alvo e a(s) Unidade(s) de Conservação onde esta(s) ocorre(m). Para isso, o pacote oferece uma função para filtragem e seleção dos dados chamada filtrar_dados(). A função possui três argumentos, nome_ucs, nome_sps e validacao_obs, permite selecionar uma parte dos dados de acordo com a(s) Unidade(s) de Conservação, espécie(s) e nível de validação taxonômico desejado, respectivamente. É possível acessar a documentação da função filtrar_dados() usando o código help(filtrar_dados) ou ?filtrar_dados.

Por configuração, a função filtrar_dados() retorna a base de dados monitora_aves_masto_florestal.

# retornar a base de dados completa
filtrar_dados()

Para retornar as observações de uma ou mais Unidades de Conservação, o(s) nome(s) da(s) Unidade(s) de Conservação deve(m) ser informados usando o argumento nome_ucs.

# consultar o nome das UCs
nomes_ucs <- monitora_aves_masto_florestal |> 
  dplyr::distinct(nome_uc)

nomes_ucs

# retornar as observações de uma UC fornecendo o nome
filtrar_dados(nome_ucs = "resex_tapajos_arapiuns")

Também é possível selecionar uma ou mais Unidades de Conservação fornecendo um vetor do tipo caracter com um ou mais elementos.

# gerar um vetor contendo os nomes das UCs
nomes_ucs <- dplyr::pull(nomes_ucs)
nomes_ucs

# retornar as observações de uma UC fornecendo o nome
filtrar_dados(nome_ucs = nomes_ucs[1])

# retornar as observações de mais de uma UC
filtrar_dados(nome_ucs = nomes_ucs[2:3])

Para selecionar as observações de uma ou mais espécies, o(s) nome(s) da(s) espécie(s) ser informados usando o argumento nome_sps.

# consultar o nome das UCs
nomes_sps <- monitora_aves_masto_florestal |> 
  dplyr::distinct(nome_sp)

nomes_sps

# retornar as observações de uma espécie fornecendo o nome
filtrar_dados(nome_sps = "dasyprocta_croconota")

Também é possível selecionar uma ou mais espécies fornecendo um vetor do tipo caracter com um ou mais elementos.

# gerar um vetor contendo os nomes das UCs
nomes_sps <- dplyr::pull(nomes_sps)
nomes_sps

# retornar as observações de uma UC fornecendo o nome
filtrar_dados(nome_sps = nomes_sps[1])

# retornar as observações de mais de uma UC
filtrar_dados(nome_sps = nomes_sps[c(33, 34)])

Para selecionar as observações de uma ou mais observações validadas, o(s) nível(is) taxonômico(s) deve(m) ser informados usando o argumento validacao_obs.

# retornar as observações de uma espécie fornecendo o nome
filtrar_dados(
  nome_sps = nomes_sps[c(33, 34)],
  validacao_obs = "especie"
)

Finalmente, também é possível selecionar as observações a partir da(s) Unidade(s) de Cosnervação, espécie(s) e nível(is) taxonômico(s) de validação.

# retornar as observações de uma espécie fornecendo o nome
filtrar_dados(
  nome_ucs = "flona_do_jamari",
  nome_sps = "callicebus_brunneus",
  validacao_obs = "especie"
)

Transformação dos dados

O uso da função que ajusta os modelos de função de detecção aos dados para estimativa de abundância e densidade das espécies exigem que os dados apresentem um formato específico. A função transformar_dados_formato_Dsitance() realiza a seleção das variáveis e as transformações necessárias para deixar os dados prontos para serem analisados.

Primeiramente, é necessário criar um tabela de dados contendo as observações da espécie que se deseja estimar a densidade.

dasy_croc <- filtrar_dados(
  nome_sps = "dasyprocta_croconota",
  validacao_obs = "especie"
)

# transformar os dados para o formato do Distance
dasy_croc_com_rep <- transformar_dados_formato_Distance(dasy_croc)

dasy_croc_com_rep

A função também permite eliminar as amostragens repetidas realizadas em uma mesma estação do ano, selecionando apenas o dia em que foi registrado o maior número de observações para uma determinada estação e ano. Para eliminar as amostragens repetidas, basta utilizar o argumento amostras_repetidas = FALSE.

dasy_croc_sem_rep <- transformar_dados_formato_Distance(
  dados = dasy_croc,
  amostras_repetidas = FALSE
)

dasy_croc_sem_rep