sobre

  • r é um abiente/software aberto de análise de dados e geração de gráficos. estatísica e modelagem de dados. conta com packages de diversos comandos e dados.
  • o rstudio é um ambiente integrado de desenvolvimento, o qual fornece um avançado editor de textos. e deve ser baixado em computadores que já contenham o r.
  • os objetos manipulados podem ser variáveis, conjuntos numéricos, caracteres, funções ou estruturas ainda mais complexas.
  • argumentos contam os mecanismos utilizados que definirão como o comando será executado.
  • estrutura de dados:
    • vector: array em 1 dimensão;
    • matrix: array com 2 dimensões;
    • array: uma ou mais dimensões;
    • fator: representa dados categóricos;
    • data.frame: parecido com a matrix, mas permite atribuir diversas colunas a um objeto, muito aplicado para análises estatísticas;
    • list: diferentes estruturas de dados combinadas num objeto.
  • características de um objeto: tipo e tamanho (intrínsecos). outros (não intrínsecos): nomes, dimensão etc.
  • Inf: infinito e NaN: resultado indefinido e Na: valor ausente.
  • símbolos operacionais: <, <=, >, >=, == ou != para desigualdades.
  • %% para módulos, e %/% para divisão de inteiros; 5 %in% x, verifica presença de x em y; %*% multiplicação de matrizes.
  • c & f = interseção (e); c | f = união(ou); !c = negação.
  • packages tornam a codificação de certas tarefas mais fáceis. use install.package( ). library( ) p/ carregá-lo.

importando dados

  • importar tabelas CSV (comma separated values) do excel, e também SQL (colunas são escritas separadamente por vírgulas).
    • variav <- read_csv(' ')

comandos

@ básicos

  • library(help=base) #ajuda em algum package
    • ou help(base)
    • ou ??sequence
  • library(graphics) #carregar um pacote (ativa)
  • rm(x,y) #apagar objetos
    • ou rm(list=ls( )) #deleta todos os objetos da sessão
  • x = c(1,2,3) #cria vetor numérico, consistindo numa coleção de números
    • x é um vetor!
  • seq(from=, to=, by=) = seq(1,50,4) # cria sequências de x até n, em intervalos definidos
    • ou seq(10,1,-3) #para seq inversas
    • ou x= 1*5:10
  • letters[1:5] #cria seq alfabética
  • ls( ) #lista objetos na ssesão atual do r
  • print(x) #imprimir resultado de uma função
  • mode(x) #tipo de um objeto
  • true (T) ou false(F) representam respectivamente os valores 1 e 0, conforme a variável booleana
  • length(x) #tamanho do objeto
  • names(x)=c("blabla", "blabla") #nomear objetos
  • str(x) #mostra a estrutura do obj
    • cat(str) #em caso de texto quebrado, considera-o
    • nchar(str) #conta o nº de caracteres
    • grepl("nn", str) #verifica presença do caractere
  • attr(x, "names") #exibe atributo específico
  • as.matrix(x); as.numeric(x) etc.. #converte objetos para outros tipos, no entanto, para que essa informação seja salva, é necessário atribuir a função ao próprio objeto
  • range(x) #valor min e máx de um vetor
  • rep(x, times=2) #repetir vetor n vezes
  • x[1] #imprime a informação referente a posição desejada, pode ser seq, limitações
  • sqrt(x) #raiz de um nº
  • ceiling(x) #arredonda pra cima e floor(x) #arredonda pra baixo

@ if / else

  • if exprime condição, ex:
    • if (a > b) {
    • print ("maior")
    • }
  • else if gera outra condição caso a inicial não se satisfaça, ex:
    • if (a > b) {
    • print ("maior")
    • } else if (a == b) {
    • print ("iguais")
    • }
  • else exprime função semelhante, sem necessidade de delimitar condição. acatará em qualquer condição que vá contra a inicial, ex:
    • if (class(a) == "character") {
    • print ("é caractere")
    • } else if (class(a) == "numeric") {
    • print ("número")
    • } else {
    • print ("a é um argumento")
    • }

@ loops (while ou for)

  • while executa enquanto for verdade;
    • while (b < 14){
    • print (b)
    • b <- b + 1
    • b + 1 == b
    • b <- b + 1
    • if (b == 9) {
    • break
    • }
    • } #LINDA E BELA RODANDO FIBONACCI, UHUUM :D

@matrix

  • matrix(x, nrow=5, ncol=1, byrow=F) #cria matriz de um vetor existente, indicando linhas e colunas respectivamente
    • byrow=F é definido automaticamente, preenchendo os valores segundo a coluna. caso byrow=T, o preenchimento será pelas linhas.
  • dim(x) #dimensões da tabela linhasxcoluna
  • summary(x) #obtém informações de qualquer objeto - além das matrizes. e aqui, fornece informações descritivas segundo as linhas
    • ou summary(as.vector(x)) #informação geral da matrix

@ medidas de posição

média

  • mean(x)
    • ou sum(x)/legth(x)
  • mean(x, na.rm=TRUE) #argumento utilizado para deletar Na, o qual não é aceito pela mean, impossibilitando o cálculo. qualquer operação contendo NA resultará em NA, pois trata de uma informação incompleta e o resultado não pode ser conhecido.
may 7 2021 ∞
aug 27 2021 +