Você está na página 1de 66

ESTATÍSTICA APLICADA À

ENGENHARIA

Roberto Carlos Lourenço


SUMÁRIO

1 ANÁLISE COMBINATÓRIA E PROBABILIDADES ......................................... 3


2 PRINCÍPIOS BÁSICOS DE ESTATÍSTICA .................................................... 15
3 GRÁFICOS ESTATÍSTICOS ....................................................................... 25
4 MEDIDAS ............................................................................................... 31
5 TESTE DE HIPÓTESE ............................................................................... 47
6 FERRAMENTAS ESTATÍSTICAS ................................................................ 55

2
1 ANÁLISE COMBINATÓRIA E PROBABILIDADES

Neste bloco, estudaremos a Análise Combinatória e Probabilidades. Onde será possível


compreender como realizar cálculo dos números de arranjos, permutação,
combinação e fatorial.

Ainda nesse bloco, vamos estudar Teoria das probabilidades, probabilidade


condicional e total, conhecendo a definição dos conjuntos denominados como Espaço
Amostral e Evento, para assim, compreender como calcular a probabilidade de um
determinado Evento diante de um Espaço Amostral. E para terminar, conheceremos a
definição da Distribuição de Probabilidades, uma tabela muito importante que é
utilizada na Estatística.

1.1 Cálculo dos números de arranjo, permutação, combinação e fatorial

Fatorial de um número

Nesse infográfico vamos estudar Análise Combinatória, sendo um tópico muito


importante da Matemática e fundamental para desenvolver muitos problemas da
Probabilidade e Estatística.

Para começar, vamos entender como funciona o número fatorial.

Para um número natural qualquer, n ϵ N, temos:

n! = n . (n – 1) . ( n – 2) . (n – 3). ... . 1

1! = 1

Considera-se 0! = 1

Exemplos:

5! = 5 . (5 – 1) . (5 – 2) . (5 – 3). (5 – 4) = 5 . 4 . 3. 2. 1 = 120

7! = 7 . 6 . 5. 4. 3. 2. 1 = 5040

3
10! = 10. 9. 8. 7. 6. 5. 4. 3. 2. 1 = 3 628 800

Podemos indicar:

n! = n . (n – 1)!

12! = 12 . 11. 10!

7! = 7. 6!

Permutações simples e com elementos repetidos

Quando temos n elementos de um determinado grupo e todos são utilizados, onde


ocorre uma troca de posicionamento, trabalhamos com a permutação, indicado por:

Pn = n!

Exemplos

1. Quantos são os anagramas da palavra ANTIGO?

Importante: Anagramas são diferentes posições das letras de uma palavra.

Resolução: Para resolver esse problema trabalhamos com P6 = 6! .

P6 = 6!= 6.5!= 6.120 = 720

Isso ocorre, pois são 6 letras distintas e cada letra pode mudar de posição, gerando
palavras com significado ou não. Dessa forma, podemos afirmar que existem 720
anagramas da palavra ANTIGO.

Como por exemplos: ANTIOG, ANTGIO, GIOANT, ...

2. Com os elementos do conjunto A = {1, 2, 3, 4} podemos formar quantos números de


quatro algarismos distintos?

4
Resolução:

M C D U
4 opções 3 opções 2 opções 1 opções

Novamente para resolver trabalhamos com P4 = 4!

P4 = 4!= 4.3.2.1 = 24

1234 1243 1324 1342 1423 1432


2134 2143 2314 2341 2413 2431
3124 3142 3214 3241 3412 3421
4123 4132 4213 4231 4312 4321

Portanto, existem 24 números.

Agora, quando existem elementos repetidos trabalhamos com:

n!
Pnb1 ,b2 ,..,bk =
b1!.b2 !...bk !

Onde n é a quantidade de elementos do conjunto e b1!.b2 !...bk ! indica quantas vezes

um determinado elemento está se repetindo.

Exemplo

3. Apresente os anagramas da palavra ARARA:

AAARR AARAR ARAAR RAAAR RAARA


RARAA RRAAA ARRAA AARRA ARARA

Repare que o R repete 2 vezes e o A repete 3 vezes, dessa forma temos:

5! 5.4.3.2.1 120
P52,3 = = = = 10
2!.3! 2.1.3.2.1 12

5
Arranjos simples

Arranjos simples de n elementos tomados k a k, onde n ≥ k, são os agrupamentos


ordenados diferentes que se podem formar com k dos n elementos dados.

n!
Fórmula: An ,k =
(n − k )!

Exemplos

1. Um cofre possui um disco com 26 letras. A combinação do cofre é formada por 3


letras distintas em uma certa ordem. Se o dono esquecesse essa combinação, qual o
número máximo de tentativas que ele precisaria fazer para abrir o cofre?

Resolução:

Como nesse caso a senha é composta por 3 letras distintas que seguem uma ordem,
podemos resolver esse problema utilizando arranjos simples.

26! 26! 26.25.24.23!


A26,3 = = = = 26.25.24 = 15600
(26 − 3)! 23! 23!

Portanto, se o dono esquecesse a senha, o número máximo de tentativas para


conseguir abrir o cofre seria de 15 600.

Combinações simples

Combinações simples de n elementos tomados k a k, onde n ≥ k, são os subconjuntos


com exatamente k elementos que se podem formar com os n elementos dados.

n!
Fórmula: C n ,k =
k!(n − k )!

Exemplo:

1. Num encontro internacional composto por 12 homens e 13 mulheres, cada qual de


um país diferente, deve ser feita a escolha de uma comissão de 5 pessoas. Determine o
número de possíveis comissões, se a comissão deve composta:

6
a) sem nenhuma restrição.

Resolução:

Como não existe nenhuma restrição, podemos afirmar que a comissão pode ser
composta por 5 mulheres e nenhum homem, ou ainda, 4 mulheres e 1 homem, ou 3
mulheres e 2 homens, e assim por diante.

Pensando assim, temos 5 das 13 + 12 = 25 pessoas no total para escolher.

Como não pode ter uma repetição e não existe uma ordem na escolha, trabalhamos
com combinações simples.

25! 25! 25.24.23.22.21.20!


C 25,5 = = = = 5.23.22.21 = 53130
5!(25 − 5)! 5!.20! 5.4.3.2.1.20!

Portanto, existem 53 130 maneiras de formar uma comissão com as 25 pessoas.

b) de 2 homens e 3 mulheres.

Resolução:

Nesse caso, a comissão precisa ter 2 homens e 3 mulheres. Sendo assim, trabalhamos
com combinações simples da seguinte forma:

Para escolher 2 homens Para escolher 3 mulheres

12! 12! 13! 13.12.11.10!


C12, 2 = = C13,3 = =
2!.(12 − 2)! 2!.10! 3!.10! 3.2.1.10!
12.11.10!
= = 6.11 = 66
2.1.10! = 13.2.11 = 286

Agora multiplicamos os dois resultados para obter o total de possibilidades de


comissões:

66. 286 = 18 876

7
Portanto, existem 18 876 maneiras de formar uma comissão escolhendo 2 homens e 3
mulheres.

1.2 Teoria das probabilidades, probabilidade condicional e total

Para conhecer a definição de probabilidades é necessário conhecer os conjuntos


Espaço Amostral e Evento.

Espaço amostral

Espaço amostral S: conjunto de todos os resultados possíveis de experimento ou


situação.

Exemplo: Lance uma moeda três vezes e observe a sequência de caras (K) e coroas (C)
que ocorre. Apresente um espaço amostral para esse experimento.

S = {(KKK), (KKC), (KCK), (CKK), (CCK), (CKC), (KCC), (CCC)}

Evento

Evento A: subconjunto de S é qualquer conjunto de resultados possíveis relativamente


ao experimento ou situação referidos no espaço amostral.

Exemplo: Ao lançar três vezes uma moeda, foi possível obter o espaço amostral S =
{(KKK), (KKC), (KCK), (CKK), (CCK), (CKC), (KCC), (CCC)}. Para esse experimento, qual é o
evento onde ocorrem duas faces caras?

A = {(KKC), (KCK), (CKK)}

Definição de probabilidades

Chamamos de probabilidade de um evento A (com A contido em S) o número real P(A),


tal que:

8
Onde:

n(A) é o número de elementos do evento A;

n(S) é o número de elementos do espaço amostral S.

Ou seja, Probabilidade de um Evento A é o NÚMERO REAL resultante da RAZÃO


(divisão) entre o número de elementos do evento n(A) e o número de elementos do
espaço amostral n(S).

Certeza e Impossibilidade, pelo que vimos até agora podemos concluir que a
probabilidade de um evento E qualquer é P(E), tal que 0 ≤ P(E) ≤ 1.

Isso significa que a probabilidade só pode assumir valores de zero a 1.

Eventos complementares

Sabemos que um evento pode ocorrer ou não.

Sendo “p” a probabilidade de que ele ocorra (sucesso) e “q” a probabilidade de que ele
não ocorra (fracasso), para um mesmo evento existe sempre a relação:

p + q = 1 ⇒ q = 1- p

Probabilidade condicional

Denotamos por A/B “o evento A condicionado ao fato de que o evento B já ocorreu” e


por P(A/B) a probabilidade condicional de ocorrer A, tendo ocorrido B.

9
Exemplos

1. Considerando o lançamento de uma moeda e o evento A “obter cara”, obter a


probabilidade de ocorrência do evento A:

a) Espaço Amostral S = { K , C }

b) Número de elementos do espaço amostral n(S) = 2

c) Evento A = { K }

d) Número de elementos do Evento A n(A) = 1

n( A) 1
e) P(A) = =
n( S ) 2

2. Considerando um baralho com 52 cartas, sendo 13 cartas de cada um dos quatro


naipes e o evento C “obter um 3”. Sorteia-se uma carta ao acaso. Qual a probabilidade
de ocorrer o número 3?

a) n(S) = 52

b) n(C) = 4

c) P (C ) =
n (C)
=
4
n (S) 52

3. Lançamos dois dados simultaneamente. Qual a probabilidade de obtermos 2 no


primeiro lançamento e 3 no segundo?

10
4. No experimento do lançamento de dois dados, se a soma dos pontos deu maior que
6, qual a probabilidade de que tenha ocorrido em ambos os dados um número par?

1º momento temos: Espaço Amostral S = {(1; 1), (1; 2), (1; 3), ..., (6; 6)}

2º momento temos: A soma dos pontos deu maior que 6, gerando o evento A = {(1; 6),
(2; 5), (2; 6), (3; 4), (3; 5), (3; 6), (4; 3), (4; 4), (4; 5), (4; 6), (5; 2), (5; 3), (5; 4), (5; 5), (5;
6), (6; 1), (6; 2), (6; 3), (6; 4), (6; 5), (6; 6)}

3º momento temos: Em ambos os dados um número par, quando a soma dos pontos
deu maior que 6, gerando o evento B = {(2; 6), , (4; 4), (4; 6), (6; 2), (6; 4), (6; 6)}

6 2
P ( B / A) = =
21 7

Portanto, a probabilidade de que tenha ocorrido em ambos os dados um número par


2
se a soma dos pontos deu maior que 6 é igual a .
7

1.3 Distribuição de probabilidades

Definição

Seja X uma variável aleatória que pode assumir os valores:

x1 , x2 , x3 ,..., xn

A cada valor correspondem pontos do espaço amostral. Associamos, então cada valor
xi a probabilidade pi de ocorrência de tais pontos no espaço amostral.

Assim, temos

∑p i = p1 + p2 + p3 + ... + pn = 1

11
Exemplo

A tabela a seguir informa o número de acidentes diários em um estacionamento:

Com os dados da tabela desenvolva cada item:

a) Em um dia, qual a probabilidade de não ocorrer acidente?

18
p1 = = 0,6
30

b) Em um dia, qual a probabilidade de ocorrer um acidente?

6
p2 = = 0,2
30

c) Em um dia, qual a probabilidade de ocorrer dois acidentes?

4
p3 = = 0,13
30

d) Em um dia, qual a probabilidade de ocorrer três acidentes?

2
p4 = = 0,07
30

12
Com os resultados obtidos podemos formar a Distribuição de Probabilidade:

A função probabilidade é definida por

f ( x) = P( X = xi )

A função probabilidade determina a distribuição de probabilidade da variável aleatória


X.

Para o lançamento de um dado, a variável X, definida por valor da face do dado, pode
ser indicado por 1, 2, 3, 4, 5, 6.

Formando a tabela:

13
Conclusão

Neste bloco, estudamos Análise Combinatória e Probabilidades, passando pelos


tópicos envolvendo o cálculo dos números de arranjos, permutação, combinação e
fatorial, Teoria das probabilidades, probabilidade condicional e total, definições do
Espaço Amostral, Evento, a probabilidade de um determinado Evento diante de um
Espaço Amostral e Distribuição de Probabilidades.

REFERÊNCIAS

CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.

DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.

DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.

LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.

SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.

______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.

14
2 PRINCÍPIOS BÁSICOS DE ESTATÍSTICA

Neste bloco, vamos iniciar os tópicos indicados por diversos autores como princípios
básicos de estatística, começando com as regras de arredondamento de dados,
passando pela caracterização de População e Amostra.

Vamos seguir nossos estudos falando sobre tipos de variáveis e representação de


dados amostrais e concluímos com Distribuição de Frequências.

2.1 Arredondamento de dados e caracterização de População e Amostra

Nesse tópico vamos compreender as regras para realizar o arredondamento de dados


e a caracterização de população e amostra.

De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE), temos:

i. Quando o primeiro algarismo a ser retirado é 0, 1, 2, 3 ou 4, não altera o último algarismo a


permanecer.

Exemplos

Aproximação de uma casa decimal:

73,74 73,7

Aproximação de duas casas decimais:

34,913453 34,91

ii. Quando o primeiro algarismo a ser retirado é 6, 7, 8 ou 9, aumenta uma unidade o


algarismo a permanecer.

15
Exemplos

Aproximação de uma casa decimal:

72,3823 72,4

25,0712 25,1

35,9951 36,0

iii. Quando o primeiro algarismo a ser retirado é 5, temos duas soluções:

1º Se ao 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma


unidade ao algarismo que permanecer.

Exemplos

Aproximação de uma casa decimal:

71,352 71,4

25,65001 25,7

2º Se ao 5 o número que se seguir for o último algarismo ou se ao 5 só se seguirem


zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for
ímpar.

Exemplos

Aproximação de uma casa decimal:

24,75 24,8

24,65 24,6

16
Porcentagem

População e amostra

População é o conjunto de todos os elementos envolvidos no fenômeno a ser


estudado.

Amostra é o conjunto de elementos retirados da população para a realização do


estudo.

Exemplos:

1. Queremos obter informações sobre os alunos da escola Educação de Qualidade.

População: é o conjunto de todos os alunos matriculados na escola Educação de


Qualidade.

Amostra: é o conjunto dos alunos que serão entrevistados.

17
2. Em uma escola existem 300 alunos matriculados, sendo 60 do 1º ano, 50 do 2º ano,
40 do 3º ano, 80 do 4º ano e 70 do 5º ano. Obtenha uma amostra de 60 alunos
preenchendo a tabela a seguir:

O resultado é a tabela:

2.2 Tipos de variáveis e representação de dados amostrais

Nesse tópico vamos estudar os tipos de variáveis, sendo importante entender que
variável é o conjunto de resultados possíveis de um fenômeno.

Variável qualitativa: quando seus valores são expressos por atributos, como: cor de
pele, gênero, hábito de fumar, grau de instrução etc.

Na variável qualitativa nominal não existe ordenação em seus possíveis resultados.


Exemplos: sexo, hábito de fumar, turma, nacionalidade, cor da pele etc.

Na variável qualitativa ordinal existe certa ordem em seus possíveis resultados.


18
Exemplos: grau de instrução, tamanho (P, M, G, GG), classe social etc.

Variáveis quantitativas: seus valores são números e resultantes de uma contagem ou


mensuração, como: idade, salário, distância de um local até outro local, número de
filhos, número de pessoas por família etc.

Na variável quantitativa discreta seus possíveis valores formam um conjunto finito de


números que resultam frequentemente de uma contagem.

Exemplos: número de alunos de uma escola, número de torcedores em uma partida de


futebol, número de moradores de um condomínio etc.

Na variável quantitativa contínua seus possíveis valores formam um intervalo de


números reais que resultam de uma mensuração.

Exemplos: peso, altura, valor de um produto, distância entre dois corpos etc.

Representação de dados amostrais

Em pesquisas realizadas, normalmente, trabalhamos com amostra de uma população,


isso ocorre por impossibilidade ou inviabilidade econômica ou temporal, onde reduz o
estudo de uma determinada população para uma parte da mesma.

Amostragem

Os métodos de escolha da amostra devem garantir a representatividade do grupo.

Desse modo, podemos recorrer a diferentes formas de amostragem: amostragem


aleatória simples, amostragem sistemática e amostragem estratificada proporcional.

Amostragem aleatória simples

Esse tipo de amostragem é equivalente a um sorteio lotérico.

Exemplo: Para uma pesquisa sobre rendar familiar de um grupo composto por 500
pessoas, vamos escolher uma amostra com, no mínimo, 50 pessoas (sendo 10% de
500), selecionadas através de amostragem aleatória simples, onde em primeiro lugar,
é necessário elaborar uma lista com todas as pessoas do grupo numeradas de 1 a 500,

19
para em seguida serem submetidos a um sorteio. Ao mesmo tempo utilizamos bolas
ou cartões numerados de 1 a 500.

241 001 137 421 ... 094

Ao sortear os 50 números distintos, podemos selecionar essas pessoas para


participarem da pesquisa.

Amostragem sistemática

Quando os elementos da população já se acham ordenados, como prontuários


médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes
casos, a escolha dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador.

Exemplo: Para uma pesquisa sobre rendar familiar de um grupo composto por 500
pessoas, vamos escolher uma amostra com, no mínimo, 50 pessoas (sendo 10% de
500), selecionadas através de amostragem sistemática, onde em primeiro lugar, é
necessário elaborar uma lista com todas as pessoas do grupo numeradas de 1 a 500,
para em seguida serem submetidos a um sorteio da seguinte maneira:

Sorteamos um número de 1 a 10, ao acaso. Supondo que o número sorteado seja 7,


ele será o primeiro elemento da amostra e os demais serão determinados em
intervalos de dez unidades. Formando essa relação de pessoas:

007 017 027 037 ... 497

Amostragem estratificada proporcional

Em muitos casos uma pesquisa estuda uma população que possui subpopulações, pois
a mesma se divide em grupos denominados como estratos.

Dessa forma, quando empregamos a amostragem estratificada proporcional, que,


além de considerar a existência dos estratos, obtém os elementos da amostra
proporcional ao número de elementos dos mesmos.

20
Exemplo:

Precisa realizar uma pesquisa da estatura de 90 alunos de uma escola. Desses, 54 são
meninas e 36 são meninos. Com o objetivo de entrevistar 10% dos alunos, temos uma
amostragem estratificada proporcional formada da seguinte maneira:

1º Passo

Sexo População 10% Amostra


F 54 0,1 . 54 = 5,4 5
M 36 0,1 . 36 = 3,6 4
Total 90 0,1 . 90 = 9 9

2º Passo

Ao numerar cada aluno de 01 a 90, onde de 01 a 54 são as meninas e de 55 a 90, os


meninos.

3º Passo

Realizamos o sorteio dos números para escolher as 5 meninas e os 4 meninos.

13 41 25 37 52
61 55 72 85 ---------------

2.3 Distribuição de frequências

Nesse tópico vamos compreender e realizar a organização dos dados realizando a


distribuição de frequências.

Denominamos frequência o número de elementos que fica relacionado a um


determinado valor da variável. A tabela que apresenta os dados organizados utilizando
as frequências é chamada de distribuição de frequências.

21
Exemplo

22
Resolução

Conclusão

Neste bloco, estudamos os princípios básicos de estatística, conhecendo as regras de


arredondamento de dados, População e Amostra, os tipos de variáveis, representação
de dados amostrais e concluímos com Distribuição de Frequências.

23
REFERÊNCIAS

CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.

DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.

DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.

LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.

SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.

______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.

24
3 GRÁFICOS ESTATÍSTICOS

Neste bloco, estudaremos uma ferramenta muito importante da Estatística, onde os


dados coletados em determinada pesquisa são representados por meio de gráficos.
Por isso, vamos conhecer os tipos de gráficos, passando pelo Histograma e Polígono de
Frequência e concluímos esse bloco com o Digrama de Ramo-e-folhas.

3.1 Tipos de gráficos

Nesse momento será possível entender que o gráfico estatístico é uma ferramenta que
apresenta os dados estatísticos, colaborando para uma melhor compreensão do
fenômeno em estudo.

3.2 Histograma e polígono de frequência

Nesse tópico vamos desenvolver e compreender os dados representados em


histograma e polígono de frequência.

Histograma

Por definição temos que o histograma é um tipo de gráfico formado por retângulos
justapostos, onde cada base fica localizada sobre o eixo horizontal, e dessa forma,
seus pontos médios coincidem com os pontos médios dos intervalos de classe.

25
Exemplos

1. Veja um exemplo de histograma:

2. Apresente um histograma utilizando os dados da tabela a seguir.

Resolução:

26
Polígono de frequência

O polígono de frequência é um gráfico em linhas, sendo as frequências marcadas sobre


perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de
classe.

Veja um exemplo:

Exemplo

Apresente o polígono de frequência para os dados da tabela a seguir:

Resolução:

27
3.3 Diagrama de Ramo-e-folhas

Por definição temos que um diagrama de ramo-e-folhas é um gráfico de frequências


construído para pontos amostrais de dois ou três algarismos, onde utilizamos o último
algarismo como um contador para a classe de frequência correspondente aos algarismos
iniciais. Em geral, os gráficos ramo-e-folhas são traçados com o ramo (algarismos iniciais)
disposto verticalmente, e os últimos algarismos (que formam as folhas) dispostos
horizontalmente. É normal identificar o comprimento de cada folha informando à esquerda do
ramo.

Exemplo:

(3) 3 147

(5) 4 35679

(2) 6 28

(1) 8 5

Exemplo

1. Um professor aplicou uma atividade para 25 alunos. Os valores a seguir são as notas
dos alunos:

24 79 98 47 45
27 48 59 58 62
61 73 92 49 55
57 61 69 65 91
74 64 63 28 77

Apresente um diagrama de Ramo-e-folhas para representar as notas desses alunos.

28
Resolução

1º Passo

Identifique o primeiro algarismo de cada número, gerando o ramo:

2º Passo

Identifique o segundo algarismo de cada número, gerando as folhas:

2 478

4 8795

5 7985

6 1149352

7 4937

9 821

29
3º Passo

Informamos a frequência de cada linha, concluindo a construção do Diagrama de


Ramo-e-folhas para os dados apresentados:

(3) 2 478

(4) 4 8795

(4) 5 7985

(7) 6 1149352

(4) 7 4937

(3) 9 821

Conclusão

Neste bloco, estudamos os tipos de gráficos, uma ferramenta muito importante na


Estatística, conhecemos o Histograma e Polígono de Frequência e concluímos esse
bloco com o Digrama de Ramo-e-folhas.

REFERÊNCIAS

CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.

DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.

DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.

LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.

SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.

______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.

30
4 MEDIDAS

Neste bloco, estudaremos os métodos para calcular a média aritmética simples, a


mediana, a moda e os quatis, que são as medidas de posição.

Dando sequência aos nossos estudos, vamos conhecer as medidas de dispersão,


ferramenta fundamental na Estatística, sendo assim, o cálculo de Amplitude Total,
Variância, Desvio padrão, Coeficiente de Variação e intervalos interquartil, estarão
complementando nossos estudos.

4.1 Medidas de posição – média, mediana, moda e quartil

Média Aritmética Simples ou Média - x

Para dados não agrupados é a soma dos valores da variável dividida pelo total de
observações.

Exemplo:

Após realização de uma pesquisa sobre qual quantia, em reais, cada pessoa estava
disposta a pagar em um lanche de rua, foram coletados os valores: 9, 13, 6, 12 e 5.

Qual é a média referente os valores coletados?

31
Para dados agrupados:

Mediana (md)

Para dados não agrupados: é o valor da variável que ocupa a posição central dos dados
ordenados.

Exemplo:

Calcular a mediana dos valores 9, 12, 8, 6, 14, 11, 5.

Primeiro: coloque os números em ordem, seja, crescente ou decrescente.

5, 6, 8, 9, 11, 12, 14

Segundo: se o número de elementos é ímpar, temos como mediana o único elemento


central: md = 9

Outro caso

Calcular a mediana dos valores 9, 12, 8, 6, 14, 11.

Primeiro: coloque os números em ordem, seja, crescente ou decrescente.

6, 8, 9, 11, 12, 14

32
Depois, calculamos a média dos dois valores centrais, por se tratar de quantidade par
de elementos:

Para dados agrupados

Exemplo

33
Moda (mo)

Para dados não agrupados: é o valor da variável mais frequente da distribuição.

Exemplo

1. Determine a moda para o seguinte conjunto de dados:

65, 87, 49, 58, 65, 60, 80, 65, 90

mo = 65 (por aparecer 3 vezes)

34
2. Determine a moda para o seguinte conjunto de dados:

65, 80, 87, 49, 58, 65, 80, 65, 90, 80,

mo = 65 (por aparecer 3 vezes)

mo = 80 (por aparecer 3 vezes)

Temos duas modas, sendo uma distribuição bimodal.

Para dados agrupados

Exemplo

35
Os quartis

Temos como definição que os quartis são os valores de uma série que a dividem em
quatro partes iguais.

Existem três quartis

Primeiro quartil Q1 – valor situado de tal modo na série que 25% dos dados são
menores que ele e 75% restantes são maiores.

Segundo quartil Q2 – coincide com a mediana.

Terceiro quartil Q3 – valor situado de tal modo na série que 75% dos dados são
menores que ele e 25% restantes são maiores.

Para determinar cada quartil trabalhamos da seguinte maneira:

36
Exemplo:

37
4.2 Medidas de dispersão – amplitude, variância e desvio padrão

As medidas de dispersão servem para quantificar a variabilidade dos valores da


variável, isto é, a dispersão dos dados, ou a forma como os valores de cada conjunto se
espalha ao redor das medidas de tendência central.

Exemplo

Valores de duas carteiras de ações na Bolsa de Valores:

A média em ambas carteiras, x = R$ 1,50

Mediana da carteira A, md = R$ 1,50

Mediana da carteira B, md = R$ 1,51

38
Observando os dados pelo gráfico a seguir, é possível identificar uma maior oscilação
da carteira A comparando com a carteira B, mostrando que um investidor mais
conservador iria optar pela carteira B, por apresentar uma menor oscilação de valores
dentro do período apresentado.

Além do gráfico podemos utilizar a Medida de Dispersão para estudar a variabilidade


entre os valores.

Amplitude total (R)

Diferença entre o maior e o menor valor de um conjunto de dados.

Variância (σ² ou S²)

É um estudo sobre os desvios em torno da média aritmética, determinando a média


dos quadrados dos desvios.

Σ( xi − x )² Σ( xi − x )²
s² = ( populacional ) s² = (amostral )
n n −1

39
Propriedades

1. Somando ou subtraindo um valor constante k a todos os valores de uma variável, o


desvio padrão não altera.

2. Multiplicando todos os valores de uma variável por uma constante k não nula, o
desvio padrão fica multiplicado por essa constante k.

40
Exemplo

Calcule a amplitude total, variância, desvio padrão e coeficiente de variação para a


variável Idade da tabela a seguir:

Acrescentamos uma nova coluna para colaborar:

Amplitude total

41
42
4.3 Medidas de dispersão – intervalo interquartil e coeficiente de
variação

Na estatística trabalhamos com dados que por sua vez precisam de interpretações,
onde conhecer a medida de posição (média aritmética, mediana ou moda) não é o
suficiente para uma análise mais ampla.

Dessa forma, chamando de dispersão ou variabilidade a maior ou a menor


diversificação dos valores de uma variável em torno de um valor de tendência central
tomado como ponto de comparação, a Estatística recorre às medidas de dispersão ou
de variabilidade.

Nesse tópico vamos estudar o intervalo interquartil e o coeficiente de variação.

Intervalo interquartil

Outra ferramenta útil para calcular uma medida de variabilidade é conhecida como
variação interquartil ou intervalo interquartil (IQR, do inglês inter-quartile range), onde
podemos afirmar que quanto maior a IQR, maior a distribuição ou a variabilidade.

A IQR é obtida por meio do cálculo:

IQR = Q3 – Q1

É a diferença entre o primeiro e o terceiro quartis.

Por definição, temos que a variação de interquartil inclui 50% de valores do meio na
distribuição quando estes são organizados em ordem crescente ou decrescente. Isso
acontece, pois:

43
Primeiro quartil Q1 – valor situado de tal modo na série que 25% dos dados são
menores que ele e 75% restantes são maiores.

Segundo quartil Q2 – coincide com a mediana.

Terceiro quartil Q3 – valor situado de tal modo na série que 75% dos dados são
menores que ele e 25% restantes são maiores.

Exemplo

Considere as 20 notas a seguir, obtidas em uma prova de Gestão de Negócios:

1º Passo

Encontramos Q1 e Q3

Posição de Q3 = 0,75 . (20 + 1) = 15,75

Posição de Q1 = 0,25 . (20 + 1) = 5,25

62 + 65
Q1 = = 63,5
2

84 + 85
Q3 = = 84,5
2

44
2º Passo

Calculamos IQR:

IQR = Q3 – Q1

IQR = 84,5 – 63,5 = 21

Portanto, a variação interquartil é igual a 21.

Coeficiente de variação

O Coeficiente de Variação é um cálculo que colabora no estudo de medida de


dispersão, sendo indicado como CV:

s
CV = .100%
x

Onde s é o desvio padrão e x representa a média aritmética dos valores.

Exemplo:

Tomemos os resultados das medidas das estaturas das massas de um mesmo grupo de
indivíduos:

média Desvio padrão


Estaturas (em cm) 175 5,0
Massas (em kg) 68 2,0

Verifique qual variável apresenta maior grau de dispersão.

Resolução

5
CV E = .100% ≅ 2,86% - Coeficiente de variação para a variável Estatura em cm.
175

2
CVM = .100% ≅ 2,94% - Coeficiente de variação para a variável Massa em kg.
68

45
Portanto, podemos afirmar que para esse grupo de indivíduos, as massas apresentam
maior grau de dispersão que as estaturas.

Conclusão

Neste bloco, estudamos a média aritmética simples, a mediana, a moda e os quatis,


que são as medidas de posição, que são chamadas de medidas de posição. E
completamos nossos estudos desse bloco conhecendo as medidas de dispersão, que
são Amplitude Total, Variância, Desvio padrão, Coeficiente de Variação e intervalos
interquartil.

REFERÊNCIAS

CRESPO, A. A. Estatística Fácil. São Paulo: Saraiva, 2009.

DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.

DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.

LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.

SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.

______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.

46
5 TESTE DE HIPÓTESE

Neste bloco, estudaremos o Teste de Hipótese, conhecendo a Aplicação de Teste de


Hipótese após definições da Hipótese Nula e Hipótese Alternativa, passando pelas
possibilidades para teste de hipóteses e complementando com os Erros do Tipo 1 e
Tipo 2.

Ainda nesse bloco, teremos a oportunidade de estudar a Significância e poder do Teste


de hipótese e concluímos esse momento com o Intervalo de confiança para média
populacional.

5.1 Aplicação de Teste de Hipótese

A Hipótese Nula (H0) e a Hipótese Alternativa (Ha)

Nesse momento teremos a oportunidade de estudar o teste de hipóteses, sendo um


conteúdo teórico, mas fundamental para realizar um estudo profundo e detalhado
com os dados coletados em uma determinada pesquisa.

Podemos pensar que ao trabalhar com duas amostras extraídas da mesma população,
onde a média (M1) da amostra A ser diferente da média (M2) referente amostra B, será
que esta diferença é consequência da casualidade na escolha da amostra, ou será que
esta diferença representa a diferença entre os dois grupos pesquisados?

Dessa forma, ocorrem duas hipóteses:

Hipótese Nula (H0): Não há diferença entre as médias. Considerando a diferença


apresentada como um erro amostral. Onde M1 = M2.

Hipótese Alternativa (Ha): Existe uma diferença entre as médias. Implicando em os


grupos A e B serem diferentes mediante algum fator ou até mesmo por serem
amostras de populações diferentes. Onde M1 ≠ M2.

47
Possibilidades para teste de hipóteses

Uma hipótese estatística que contém uma afirmação indicada pelos sinais = (igual), ≥
(maior ou igual) ou ≤ (menor ou igual) é denominada Hipótese Nula (H0).

Se, para toda afirmação existe um complemento, temos que para uma Hipótese Nula
existe uma Hipótese Alternativa (Ha ou H1), em outras palavras, para a Hipótese Nula
ser falsa a Hipótese Alternativa precisa ser verdadeira, ou para H0 ser verdadeira logo
Ha é falsa. Em Ha temos os sinais ≠ (diferente), > (maior) ou < (menor).

Esquema para estudar as hipóteses, onde µ representa a média populacional e k é um


número real:

H 0 : µ=k
 Teste bilateral
H a : µ≠k

H 0 : µ=k
 Teste unilateral
H a : µ>k

48
H 0 : µ=k
 Teste unilateral
H a : µ<k

H 0 : µ≥k
 Teste unilateral
H a : µ<k

H 0 : µ≤k
 Teste unilateral
H a : µ>k
49
Erros do Tipo 1 e Tipo 2

Estudando as duas hipóteses (H0 e Ha) concluímos que podemos acertar de duas
maneiras, seja aceitando a hipótese quando ela é verdadeira, ou rejeitando-a quando
ela é falsa. Por outro lado, temos duas possibilidades de estarmos errados: rejeitando
a hipótese quando ela é verdadeira, ou aceitando-a quando ela é falsa. No primeiro
caso temos o Erro Tipo 1 e no segundo caso temos o Erro Tipo 2. Observe a tabela:

5.2 Significância e poder do Teste de hipótese

A leitura indicada aborda uma explicação sobre níveis de significância e o poder do


Teste de Hipótese, sendo uma ferramenta da estatística para verificar o resultado da
diferença de uma população real e um erro amostral.

5.3 Intervalo de confiança para média populacional

Nesse tópico o objetivo será compreender e desenvolver os cálculos para determinar o


intervalo de confiança para média populacional.

50
A média populacional

A média populacional (μ) é á média aritmética determinada pelos dados envolvendo


toda a POPULAÇÃO da pesquisa!

Em muitos casos isso é impossível de ter a plena certeza, sendo assim, trabalhamos
com:

 s s 
µ ∈  x − t. ; x + t. ⇒ n ≤ 30
 n n  Usar tabela de distribuição t

 s s 
µ ∈  x − z. ; x + z. ⇒ n > 30
 n n  Usar tabela de distribuição normal

Exemplos

1. Em uma determinada fábrica, o tempo médio, por operário, para realizar uma
tarefa, estava em 92 minutos. Após treinamentos específicos foi constatada uma
diminuição nesse tempo, e a prova disso foi um novo estudo com 81 funcionários. O
novo tempo médio foi de 84 minutos e o desvio padrão foi de 9 minutos.
Considerando um nível de confiança de 95%, podemos declarar que os resultados
trazem evidências estatísticas da melhora desejada?

Resolução

51
Para determinar o valor de z seguimos esse passo a passo:

52
2. O instituto de pesquisa Power informou que o preço médio do produto A, na cidade
X, é de R$ 14,50. Com o objetivo de verificar a informação, outro instituto selecionou
uma amostra de 8 estabelecimentos da cidade X, constatando os valores a seguir:

R$ 15,80, R$ 16,20, R$ 15,40, R$ 16,10, R$ 14,60, R$ 15,10, R$ 15,40 e R$ 15,40.

Trabalhando com 95% de confiança, use as evidências estatísticas para determinar se a


afirmação do Instituto Power está correta.

Resolução:

53
Conclusão

Neste bloco, estudamos o Teste de Hipótese, passando pela Aplicação de Teste de


Hipótese, as definições da Hipótese Nula e Hipótese Alternativa, possibilidades para
teste de hipóteses, os Erros do Tipo 1 e Tipo 2, a Significância e poder do Teste de
Hipótese e concluímos com o Intervalo de confiança para média populacional.

REFERÊNCIAS

CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.

DANTE, L. R. Matemática. São Paulo: Ática, 2009. v. único.

DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.

LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.

SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.

SMOLE, K. C. S.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.

54
6 FERRAMENTAS ESTATÍSTICAS

Neste último bloco, estudaremos a comparação entre duas médias, realizando uma
análise de variância, coeficiente de correlação de Pearson, compreendendo a
correlação entre duas variáveis, ainda a Regressão Linear e concluímos com a aplicação
das funções estatísticas do MS Excel.

6.1 Comparação entre duas médias e análise de variância

Nesse momento teremos a oportunidade de estudar a comparação entre duas médias


e análise de variância, mais uma ferramenta estatística para comparar os dados
apresentados em uma determinada pesquisa.

6.2 Coeficiente de correlação de Pearson

Correlação

Na estatística existe a necessidade de comparar dados de variáveis que possuem


unidades diferentes, como peso e altura, uso do cigarro e incidência de câncer, e
nesses casos, sendo a relação entre as variáveis de natureza quantitativa, utilizamos a
correlação como um instrumento adequado para calcular e realizar a comparação
entre as variáveis.

Portanto, quando duas variáveis estão ligadas por uma relação estatística, podemos
afirmar que existe uma correlação entre elas.

55
Diagrama de Dispersão

Nesse momento vamos analisar um exemplo de diagrama de dispersão.

A tabela a seguir apresenta notas de 10 alunos de uma turma formada por 78 alunos.

Considerando as notas de Física como xi e as notas de Cálculo como y i , geramos os

pares ordenados dados por ( xi , y i ) e dessa forma temos o diagrama de dispersão:

56
Correlação linear

Uma correlação pode ser:

i. linear positiva - isso ocorre quando os pontos do diagrama de dispersão têm como
“imagem” uma reta ascendente, como uma função linear crescente.

ii. linear negativa - isso ocorre quando os pontos do diagrama de dispersão têm como
“imagem” uma reta descedente, como uma função linear decrescente.

57
iii. não linear – isso ocorre quando os pontos do diagrama de dispersão têm como
“imagem” uma curva.

Coeficiente de correlação de Pearson

O coeficiente de correlação de Pearson (r) é uma ferramenta da Estatística para


calcular o grau de intensidade da correlação entre duas variáveis, indicando o sentido
dessa correlação como positiva ou negativa.

A fórmula para calcular o coeficiente de correlação de Pearson é:

n.∑ xi y i − (∑ xi )(
. ∑ yi )
r= , onde n é o número de observações.
[n.∑ x 2
i
2
][
− (∑ xi ) . n.∑ y i2 − (∑ y i )
2
]
Para ser possível descrever uma relação por meio do coeficiente de correlação de
Pearson é fundamental que a mesma se aproxime de uma função linear. Dessa forma
podemos afirmar que:

i. o valor de r pertence ao intervalo [-1; +1];

ii. sendo r = +1, há uma correlação perfeita e positiva entre as variáveis;

iii. sendo r = -1, há uma correlação perfeita e negativa entre as variáveis;

iv. sendo r = 0, isso indica que não há correlação entre as variáveis ou a relação entre
as variáveis não é linear.

v. se 0,3 ≤ r < 0,6 , há uma correlação relativamente fraca entre as variáveis;

58
vi. se 0 < r < 0,3 , há uma correlação é muito fraca, onde será impossível apresentar

uma conclusão sobre a relação entre as variáveis em estudo.

6.3 Regressão linear

Regressão linear

O trabalho com Regressão Linear tem como objetivo desenvolver um estudo sobre a
relação de duas variáveis partindo de n observações das mesmas. Esse tópico na
Estatística é chamado de análise de regressão, onde construímos por aproximação
uma linha reta, gerando um determinado patrão, ou conjunto, de pontos que indicam
uma relação entre as duas variáveis em estudo.

Dessa forma, sejam duas variáveis X (variável independente) e Y (variável dependente),


entre as quais exista uma correlação acentuada, e mesmo que não perfeita, mas sendo
uma correlação retilínea, de modo que é possível ajustar uma reta, sendo uma imagem
para a função dada por:

Y=a.X+b

Onde:

n.∑ xi . y i − ∑ xi .∑ y i
a= e b = y − a.x
n.∑ xi2 − (∑ xi )
2

n é o número de observações, x é a média de xi e y é a média de y i .

E para construir a reta após determinar a função Y = a . X + b, basta determinar dois


pontos distintos, pois dois pontos distintos determinam uma única reta pelo axioma da
Geometria Euclidiana.

59
Exemplo

A tabela a seguir apresenta notas de 10 alunos de uma turma formada por 78 alunos.

Apresente a função que determina a Regressão Linear para as notas dos alunos da
tabela.

Resolução:

1º Passo, adicionamos duas colunas na tabela anterior:

60
2º Passo, calculamos as médias:

65
x= = 6,5
10

65
y= = 6,5
10

3º Passo, determinamos o valor de a:

n.∑ xi . y i − ∑ xi .∑ y i 10.473 − 65.65 4730 − 4225 505


a= ⇒a= ⇔a= = ≅ 0,8632
n.∑ x − (∑ xi ) 10.481 − 65² 4810 − 4225 585
2 2
i

4º Passo, determinamos o valor de b:

b = y − a.x ⇒ b = 6,5 − 0,8632.6,5 = 0,8892

Para facilitar a construção do gráfico podemos arredondar os valores de a e b:

a = 0,86 e b = 0,89

5º Passo, determinamos a função:

Y=a.X+b

Onde Yˆ assume o papel de estimativa para a verdadeira equação da regressão linear,


temos:

Yˆ = 0,86. X + 0,89

61
6º Passo, determinamos os dois pontos distintos atribuindo dois valores para X:

7° Passo, construímos a reta que representa a Regressão Linear no diagrama de


dispersão das variáveis:

Portanto, a Regressão Linear gerada é uma reta que está entre os pontos do diagrama
de dispersão.

6.4 Aplicação das funções estatísticas do MS Excel

Na Estatística existem inúmeras funções matemáticas que denominamos como


Funções Estatísticas.

Exemplos: Medidas de Posição: média, mediana e moda; Medidas de Dispersão:


amplitude, variância, desvio padrão, coeficiente de variação e Intervalo de confiança.

Nesse momento vamos utilizar o MS Excel para determinar algumas dessas funções
utilizando suas respectivas fórmulas.

Microsoft Office Excel é um editor de planilhas produzido pela Microsoft. Trabalhando


com esse office podemos realizar inúmeras tarefas envolvendo cálculos, construção de
tabelas e gráficos.
62
Função média aritmética:

Função mediana:

Função moda:

63
Agora, sem precisar fazer um passo a passo, é possível calcular e determinar essas e
outras funções utilizando a ferramenta Análise de Dados do MS Excel.

Em seguida:

64
E concluímos com a tabela que apresenta o resumo das funções:

Portanto, podemos afirmar que o MS Excel é uma ferramenta muito importante para
desenvolver inúmeras tarefas da Estatística, mas não podemos nos esquecer da
necessidade de dominar e compreender os métodos estudados sem o uso desse
programa.

65
Conclusão

Neste bloco, estudamos a comparação entre duas médias, a análise de variância,


coeficiente de correlação de Pearson, a correlação entre duas variáveis, a Regressão
Linear e concluímos com a aplicação das funções estatísticas do MS Excel.

REFERÊNCIAS

CRESPO, A. A. Estatística Fácil. São Paulo: Saraiva, 2009.

DANTE, L. R. Matemática. São Paulo: Ática, 2009. v. único.

DOWNING, D.; CLARK, J. Estatística Aplicada. São Paulo: Saraiva, 2011.

LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.

SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.

______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.

66

Você também pode gostar