Cap 12 Mini Projeto
# Mini-Projeto 2
# Limpeza e Transformação de Dados com Power Query e Linguagem R
# Definindo a pasta de trabalho
# Substitua o caminho abaixo pela pasta no seu computador
setwd("C:/Users/bruno/OneDrive/PowerBI/CursoPowerBI2/Cap12")
getwd()
# Instala os pacotes
install.packages("dplyr")
install.packages("data.table")
install.packages("ggplot2")
# Carrega os pacotes
library(dplyr)
library(data.table)
library(ggplot2)
# Carrega os dados
# Fonte de dados: https://archive.ics.uci.edu/ml/datasets/iris
dados_iris <- iris
View(dados_iris)
# Tarefa 1 - Sumarizar os dados com as médias de cada coluna de um dataset.
library(dplyr)
medias_iris <- summarize(group_by(dados_iris, Species),
media_sepal_length = mean(Sepal.Length),
media_sepal_width = mean(Sepal.Width),
media_petal_length = mean(Petal.Length),
media_petal_width = mean(Petal.Width))
View(medias_iris)
# Tarefa 2 - Extrair o valor inteiro de uma das colunas decimais.
library(data.table)
dados_iris_id <- data.table(dados_iris)
View(dados_iris_id)
dados_iris_id$Sepal.Length <- as.integer(dados_iris_id$Sepal.Length)
View(dados_iris_id)
# Para executar no Power Query
library(data.table)
dados_iris_id <- data.table(dados_iris)
dados_iris_id$Sepal.Length <- as.integer(dados_iris_id$Sepal.Length)
# Tarefa 3 – Construir um gráfico mostrando a relação de duas variáveis numéricas para as 3 categorias de uma variável categórica.
library(ggplot2)
ggplot(data = dados_iris, aes(x = Petal.Width, y = Petal.Length)) +
geom_point(aes(color = Species), size = 3) +
ggtitle("Largura e Comprimento das Pétalas") +
labs(x = "Largura da Pétala",
y = "Comprimento da Pétala") +
theme_bw() +
theme(title = element_text(size = 15, color = "turquoise4"))
# Cores disponÃveis na Linguagem R
colors()
Comentários
Postar um comentário