sobre
- r é um abiente/software aberto de análise de dados e geração de gráficos. estatísica e modelagem de dados. conta com packages de diversos comandos e dados.
- o rstudio é um ambiente integrado de desenvolvimento, o qual fornece um avançado editor de textos. e deve ser baixado em computadores que já contenham o r.
- os objetos manipulados podem ser variáveis, conjuntos numéricos, caracteres, funções ou estruturas ainda mais complexas.
- argumentos contam os mecanismos utilizados que definirão como o comando será executado.
- estrutura de dados:
- vector: array em 1 dimensão;
- matrix: array com 2 dimensões;
- array: uma ou mais dimensões;
- fator: representa dados categóricos;
- data.frame: parecido com a matrix, mas permite atribuir diversas colunas a um objeto, muito aplicado para análises estatísticas;
- list: diferentes estruturas de dados combinadas num objeto.
- características de um objeto: tipo e tamanho (intrínsecos). outros (não intrínsecos): nomes, dimensão etc.
- Inf: infinito e NaN: resultado indefinido e Na: valor ausente.
- símbolos operacionais: <, <=, >, >=, == ou != para desigualdades.
- %% para módulos, e %/% para divisão de inteiros; 5 %in% x, verifica presença de x em y; %*% multiplicação de matrizes.
- c & f = interseção (e); c | f = união(ou); !c = negação.
- packages tornam a codificação de certas tarefas mais fáceis. use install.package( ). library( ) p/ carregá-lo.
importando dados
- importar tabelas CSV (comma separated values) do excel, e também SQL (colunas são escritas separadamente por vírgulas).
comandos
@ básicos
- library(help=base) #ajuda em algum package
- ou help(base)
- ou ??sequence
- library(graphics) #carregar um pacote (ativa)
- rm(x,y) #apagar objetos
- ou rm(list=ls( )) #deleta todos os objetos da sessão
- x = c(1,2,3) #cria vetor numérico, consistindo numa coleção de números
- seq(from=, to=, by=) = seq(1,50,4) # cria sequências de x até n, em intervalos definidos
- ou seq(10,1,-3) #para seq inversas
- ou x= 1*5:10
- letters[1:5] #cria seq alfabética
- ls( ) #lista objetos na ssesão atual do r
- print(x) #imprimir resultado de uma função
- mode(x) #tipo de um objeto
- true (T) ou false(F) representam respectivamente os valores 1 e 0, conforme a variável booleana
- length(x) #tamanho do objeto
- names(x)=c("blabla", "blabla") #nomear objetos
- str(x) #mostra a estrutura do obj
- cat(str) #em caso de texto quebrado, considera-o
- nchar(str) #conta o nº de caracteres
- grepl("nn", str) #verifica presença do caractere
- attr(x, "names") #exibe atributo específico
- as.matrix(x); as.numeric(x) etc.. #converte objetos para outros tipos, no entanto, para que essa informação seja salva, é necessário atribuir a função ao próprio objeto
- range(x) #valor min e máx de um vetor
- rep(x, times=2) #repetir vetor n vezes
- x[1] #imprime a informação referente a posição desejada, pode ser seq, limitações
- sqrt(x) #raiz de um nº
- ceiling(x) #arredonda pra cima e floor(x) #arredonda pra baixo
@ if / else
- if exprime condição, ex:
- if (a > b) {
- print ("maior")
- }
- else if gera outra condição caso a inicial não se satisfaça, ex:
- if (a > b) {
- print ("maior")
- } else if (a == b) {
- print ("iguais")
- }
- else exprime função semelhante, sem necessidade de delimitar condição. acatará em qualquer condição que vá contra a inicial, ex:
- if (class(a) == "character") {
- print ("é caractere")
- } else if (class(a) == "numeric") {
- print ("número")
- } else {
- print ("a é um argumento")
- }
@ loops (while ou for)
- while executa enquanto for verdade;
- while (b < 14){
- print (b)
- b <- b + 1
- b + 1 == b
- b <- b + 1
- if (b == 9) {
- break
- }
- } #LINDA E BELA RODANDO FIBONACCI, UHUUM :D
@matrix
- matrix(x, nrow=5, ncol=1, byrow=F) #cria matriz de um vetor existente, indicando linhas e colunas respectivamente
- byrow=F é definido automaticamente, preenchendo os valores segundo a coluna. caso byrow=T, o preenchimento será pelas linhas.
- dim(x) #dimensões da tabela linhasxcoluna
- summary(x) #obtém informações de qualquer objeto - além das matrizes. e aqui, fornece informações descritivas segundo as linhas
- ou summary(as.vector(x)) #informação geral da matrix
@ medidas de posição
média
- mean(x)
- mean(x, na.rm=TRUE) #argumento utilizado para deletar Na, o qual não é aceito pela mean, impossibilitando o cálculo. qualquer operação contendo NA resultará em NA, pois trata de uma informação incompleta e o resultado não pode ser conhecido.
may 7 2021 ∞
aug 27 2021 +