MtCars

O conjunto de dados mtcars é um conjunto incorporado no R e oferece informações detalhadas sobre diferentes modelos de carros, abrangendo características relacionadas ao desempenho, eficiência e design. Este conjunto de dados é frequentemente utilizado em análises exploratórias e estudos estatísticos devido à sua simplicidade e relevância para questões automotivas.

Estrutura do Conjunto de Dados

O conjunto de dados mtcars contém 32 observações (linhas) e 11 variáveis (colunas), fornecendo uma amostra diversificada de veículos. Cada linha representa um modelo específico de carro, enquanto as colunas representam diferentes atributos associados a esses modelos.

# Carregar o conjunto de dados mtcars
data(mtcars)

# Remover linhas com valores ausentes
mtcars <- na.omit(mtcars)

# Verificar e remover duplicatas
mtcars <- unique(mtcars)

# Padronizar nomes de colunas (exemplo: converter para minúsculas)
colnames(mtcars) <- tolower(colnames(mtcars))

summary(mtcars)
##       mpg             cyl             disp             hp       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##       drat             wt             qsec             vs        
##  Min.   :2.760   Min.   :1.513   Min.   :14.50   Min.   :0.0000  
##  1st Qu.:3.080   1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000  
##  Median :3.695   Median :3.325   Median :17.71   Median :0.0000  
##  Mean   :3.597   Mean   :3.217   Mean   :17.85   Mean   :0.4375  
##  3rd Qu.:3.920   3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000  
##  Max.   :4.930   Max.   :5.424   Max.   :22.90   Max.   :1.0000  
##        am              gear            carb      
##  Min.   :0.0000   Min.   :3.000   Min.   :1.000  
##  1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  
##  Median :0.0000   Median :4.000   Median :2.000  
##  Mean   :0.4062   Mean   :3.688   Mean   :2.812  
##  3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :1.0000   Max.   :5.000   Max.   :8.000

Tabela interativa

datatable(mtcars, options = list(pageLength = 10))

Equações Matemáticas

Equação da Regressão Linear Simples

\[ y = \beta_0 + \beta_1x + \epsilon \]

A equação descreve a relação linear entre uma variável dependente (y), uma variável independente (x), e um termo de erro (ϵ) em uma análise de regressão linear simples.

Equação da Distribuição Normal

\[ f(x|\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]

A equação representa a função de densidade de probabilidade de uma distribuição normal. Ela descreve a probabilidade de observar um valor específico (x) dado a média (μ) e a variância (σ2).

Equação da Regressão Logística

\[ P(Y=1) = \frac{1}{1 + e^{-(\beta_0 + \beta_1x)}} \]

A equação é a função logística usada em modelos de regressão logística binária. Ela modela a probabilidade de um evento binário (Y=1) em termos de uma variável independente (x), intercepto (β0), e coeficiente (β1).

Teorema de Bayes

\[ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} \]

O teorema descreve a probabilidade condicional de uma hipótese (A) dado um evento (B). É calculado em termos da probabilidade inversa condicional (P(B∣A)), da probabilidade da hipótese (P(A)), e da probabilidade marginal do evento (P(B)).

Equação da Média Ponderada

\[ \bar{x} = \frac{\sum_{i=1}^{n} w_i \cdot x_i}{\sum_{i=1}^{n} w_i} \]

A equação calcula a média ponderada de um conjunto de valores (xi) usando pesos correspondentes (wi). É útil quando algumas observações têm mais influência do que outras na média final (x).

Imagens

Primeira imagem

Primeira Figura
Primeira Figura

Segunda imagem

Segunda Figura
Segunda Figura

Referências

Rezende Francisco (2017)

Gouveia (2015)

Morettin and Singer (2020)

Kaufman (2019)

Gomes (2010)

Gomes, Dennis dos Santos. 2010. “Inteligência Artificial: Conceitos e Aplicações.” Revista Olhar Cientı́fico 1 (2): 234–46.
Gouveia, Luı́s Borges. 2015. “O Que é a Ciência de Dados (Data Science). Discussão Do Conceito.”
Kaufman, Dora. 2019. A Inteligência Artificial Irá Suplantar a Inteligência Humana? ESTAÇÃO DAS LETRAS E CORES EDI.
Morettin, Pedro A, and Julio M Singer. 2020. “Introduçaoa Ciência de Dados.” Introdução à Ciência de Dados: Fundamentos e Aplicações.
Rezende Francisco, Eduardo de. 2017. “Big Data Analytics e Ciencia de Dados: Pesquisa e Tomada de Decisao.” RAE 57 (2): 199–200.