Você está na página 1de 66

banco do brasil

Matemática, Probabilidade e
Estatística
ESTATÍSTICA

Livro Eletrônico
JOSIMAR PADILHA

Professor do Gran Cursos Online. Ministra aulas


presenciais, telepresenciais e online de Matemá-
tica Básica, Raciocínio Lógico, Matemática Finan-
ceira e Estatística para processos seletivos em
concursos públicos estaduais e federais. Além
disso, é professor de Matemática e Raciocínio
Lógico em várias faculdades do Distrito Federal.
É servidor público há mais de 20 anos. Autor de
diversas obras e palestrante.
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

SUMÁRIO
Noções de Estatística...................................................................................5
Introdução.................................................................................................5
População X Amostra...................................................................................6
Censo X Estimação......................................................................................6
Dados Estatísticos.......................................................................................7
Distribuição de Frequência.......................................................................... 10
1. Representação dos Dados Discretos......................................................... 10
1.1. Frequência Simples Absoluta (fi)........................................................... 11
1.2. Frequência Relativa (Fr)....................................................................... 11
1.3. Frequência Acumulada (Fac).................................................................. 12
Amplitude Amostral a) – RANGE.................................................................. 14
Representação de Dados em Classes............................................................ 14
1. Classe.................................................................................................. 15
Amplitude da Classe c)............................................................................... 15
Ponto Médio da Classe (Pm)......................................................................... 15
Medidas de Tendência Central e Separatrizes................................................. 16
Média Aritmética....................................................................................... 16
1.1. Mediana............................................................................................. 23
1.2. Média X Mediana................................................................................. 24
1.3. Moda................................................................................................. 30
2. Medidas de Dispersão............................................................................. 32
2.1. Desvio............................................................................................... 32
2.2. Amplitude.......................................................................................... 33

https://www.facebook.com/groups/2095402907430691 3 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

2.3. Variância........................................................................................... 34
2.4. Desvio Padrão.................................................................................... 39
2.5. Coeficiente de Variação (Cv)................................................................. 43
Assimetria................................................................................................ 49
Distribuição Simétrica................................................................................ 49
Distribuições Assimétricas........................................................................... 49
Curtose.................................................................................................... 53
Coeficiente Percentílico de Curtose............................................................... 54
Coeficiente Momento de Curtose.................................................................. 55
Questões de Concurso................................................................................ 61
Gabarito................................................................................................... 66

https://www.facebook.com/groups/2095402907430691 4 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

NOÇÕES DE ESTATÍSTICA

Introdução

Olá, concurseiro(a), vamos continuar?

Bem, neste módulo, serão apresentados métodos para resolução de questões

de concursos públicos relacionados a problemas envolvendo o conteúdo de noções

de estatística, relacionados abaixo:

[1. NOÇÕES DE ESTATÍSTICA; POPULAÇÃO E AMOSTRA; ANÁLISE E IN-

TERPRETAÇÃO DE TABELAS E GRÁFICOS; ESTATÍSTICA DESCRITIVA (MÉ-

DIA, MEDIANA, VARIÂNCIA, DESVIO PADRÃO)]

Propõe-se aqui que se desenvolva, gradualmente, o raciocínio criativo, com apli-

cação de conceitos e propriedades, promovendo maior independência na busca de

soluções de problemas, aprendendo a interpretar tais questões por meio da prática

e da aplicação de métodos que facilitarão na conclusão das questões.

De uma maneira clara, simples e bem objetiva, iremos aprender como a banca

examinadora exige o assunto indicado nesta aula.

O conteúdo deste módulo é de suma importância, pois trata de assuntos cobra-

dos nas provas de concursos públicos pela banca CESGRANRIO.

Primeiramente, vamos entender o que é estatística?!

É um conjunto de métodos e processos quantitativos que serve para estudar e

medir os fenômenos coletivos, por meio da obtenção de dados e consequente or-

ganização, resumo, apresentação, análise e conclusões baseadas nos dados. É de

suma importância para tomada de decisões, sendo utilizada em diversas áreas do

conhecimento.

https://www.facebook.com/groups/2095402907430691 5 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Em estatística, temos que definir o nosso campo de estudo, até mesmo porque

alguns dos parâmetros que serão definidos dependem do lugar em que as informa-

ções (dados) são adquiridas.

População X Amostra

1. População: conjunto universo de todos os elementos (pessoas, objetos e

outros), com uma característica comum, objeto de estudo. Um parâmetro é uma

medida numérica que descreve alguma característica de uma população.

2. Amostra: é qualquer subconjunto não vazio de uma população. Uma esta-

tística (estimador) é uma medida numérica que descreve alguma característica de

uma amostra.

Vejamos um exemplo.

No fenômeno coletivo “eleição para síndico”, a população é o conjunto de todos os

moradores do condomínio. Um parâmetro é quantidade de votos recebidos pelo

candidato X. Uma amostra poderia ser um grupo de 100 eleitores selecionados ale-

atoriamente no condomínio. Uma estatística seria a proporção de votos recebidos

pelo candidato X, na amostra.

Censo X Estimação

Processos estatísticos utilizados no estudo de fenômenos coletivos.

1. Censo: é uma avaliação direta de um parâmetro, através dos dados obtidos

de todos os componentes da população.

https://www.facebook.com/groups/2095402907430691 6 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

É caro, lento, quase sempre desatualizado, admite erro processual zero e confiabi-

lidade 100%.

2. Estimação: é uma avaliação indireta de um parâmetro, com base em um

estimador, por meio do cálculo de probabilidades.

Fique atento(a)!

É barato, rápido, atualizado, admite erro processual positivo e confiabilidade menor

que 100%.

Dados Estatísticos

Para tomada de decisões, é de suma importância que os dados amostrais devam

ser coletados de modo apropriado, através de um processo de seleção aleatória. O

objetivo da estatística é, em grande parte, o uso de dados amostrais para se faze-

rem inferências (ou generalizações) sobre uma população inteira.

Desta forma, se não forem coletados de modo apropriado, podem se tornar inú-

teis, ou induzir a erro o processo decisório.

Quanto à organização dos dados, podemos ter

1. Dados Brutos: dados obtidos diretamente da observação, os quais não es-

tão numericamente organizados.

2. Rol: são dados brutos numericamente organizados, de forma crescente ou

decrescente.

https://www.facebook.com/groups/2095402907430691 7 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

É importantíssimo sabermos sobre tipo dos dados, pois, dependendo da variável

ou do atributo de estudo, aplicaremos o método adequado. Vejamos.

1. DADOS QUANTITATIVOS: possuem características numéricas, represen-

tando contagens ou medidas. Os dados aqui serão chamados de variáveis. Podem

ser classificados em:

1.1 discretos: são dados que possuem variáveis que assumem determinados

valores inteiros, 0 ou 1 ou 2 e assim por diante, em um intervalo de valores.

Exemplos: quantidade de alunos na sala, quantidade de aparelhos de TV em uma

residência, etc.

1.2 Contínuos: são dados que possuem variáveis que podem assumir qualquer

valor em um intervalo de valores.

Exemplos: altura, peso, salário, temperatura, etc.

2. DADOS QUALITATIVOS: são dados que possuem características não-nu-

méricas, podendo ser separados em diferentes categorias. Os dados aqui serão

chamados de atributos. Podem ser classificados em:

2.1. dados nominais: são dados categóricos, que consistem em nomes ou

rótulos. Possuem característica não-numérica, logo, não podem ser ordenados (tal

como do menor para o maior).

Exemplos: sexo (masculino ou feminino), cor dos olhos (pretos, castanhos, azuis,

etc.), resposta de sondagem de sim, não e indeciso.

Para serem processados estatisticamente, são atribuídos valores numéricos a

tais atributos.

https://www.facebook.com/groups/2095402907430691 8 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

2.2. dados por postos: são dados estatísticos que dependem de uma avaliação

subjetiva quanto à preferência ou desempenho em um conjunto de observações.

Por exemplo: concursos de moda, canto, etc.

Para que possamos fixar esses conceitos, vamos comentar uma questão de con-

curso, ok?!

1. (CESGRANRIO) No questionário socioeconômico que faz parte integrante do

ENADE há questões que abordam as seguintes informações sobre o aluno:

I – Unidade da Federação em que nasceu;

II – Número de irmãos;

III – Faixa de renda mensal da família;

IV – Estado civil;

V – Horas por semana de dedicação aos estudos.

São qualitativas APENAS as variáveis

a) I e III

b) I e IV

c) I, IV e V

d) II, III e V

e) I, II, IV e V

Letra b.

Vamos classificar cada uma das variáveis abaixo, conforme os conceitos vistos acima:

https://www.facebook.com/groups/2095402907430691 9 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

I – Unidade da Federação em que nasceu (qualitativa)

II – Número de irmãos (quantitativa)

III – Faixa de renda mensal da família (quantitativa)

IV – Estado civil (qualitativa)

V – Horas por semana de dedicação aos estudos (quantitativa)

Dessa forma, temos como dados qualitativos as afirmativas I e IV.

Vejamos outro conceito importantíssimo usado para a construção de gráficos,

na interpretação de situações, e na estatística inferencial.

Distribuição de Frequência

É uma representação tabular dos dados estatísticos, discretos ou contínuos,

sendo uma forma de resumir grandes conjuntos de dados. Dados representados

em uma tabela de frequência facilitam a construção de gráficos (tais como histo-

gramas), bem como a compreensão sobre a natureza dos dados.

Como podem ser representados os dados discretos?

1. Representação dos Dados Discretos

Considere a seguinte amostra de valores, relativos às idades de um grupo de 20

adolescentes: 4, 8, 8, 6, 6, 8, 5, 5, 6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5

Agora, vamos representar os dados amostrais acima em tabelas de frequências:

https://www.facebook.com/groups/2095402907430691 10 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

1.1. Frequência Simples Absoluta (fi)

A frequência simples de um elemento é o número de vezes que o elemento fi-

gura no conjunto de dados. Para os dados discretos da amostra acima, teremos a

seguinte distribuição de frequência:

Idade (x i) Frequência (f i)
4 1
5 6
6 5
7 5
8 3

TOTAL

1.2. Frequência Relativa (Fr)

É a razão entre a frequência relativa da variável e o número total (n) de ele-

mentos da série.

Idade (x i) Frequência (f i) Frequência Relativa


4 1 1/20=0,05=5%
5 6 6/20= 0,3= 30%
6 5 5/20=0,25=25%
7 5 5/20=0,25= 25%
8 3 3/20=0,15=15%

TOTAL 20/20 = 1 = 100%

https://www.facebook.com/groups/2095402907430691 11 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

1.3. Frequência Acumulada (Fac)

É o somatório da frequência simples da variável com as frequências simples dos

elementos que o antecedem.

Fac = f1 + f2 + f3+ f4 +...+ fi

Idade (x i) Frequência (f i) Frequência acumulada


4 1 1
5 6 7
6 5 12
7 5 17
8 3 20
TOTAL

Vejamos uma questão de concurso em que é necessário o conhecimento de fre-

quência acumulada para sua resolução.

2. (CESGRANRIO) A tabela abaixo apresenta as frequências acumuladas das ida-

des de 20 jovens entre 14 e 20 anos. Um desses jovens será escolhido ao acaso.

Qual a probabilidade de que o jovem escolhido tenha menos de 18 anos, sabendo

que esse jovem terá 16 anos ou mais?

a) 8/14

b) 8/16

c) 8/20

https://www.facebook.com/groups/2095402907430691 12 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

d) 3/14

e) 3/16

Letra b.

Temos uma questão de probabilidade, porém, para que possamos determinar o

espaço amostral (casos possíveis) e os casos favoráveis, não podemos trabalhar

com a frequência acumulada e sim com a frequência absoluta. Desta forma, vamos

construir mais uma coluna com as frequências absolutas, em que teremos os dados

discretos relativos a variável de estudo (idade).

Idade (anos) Frequência Relativa (fr) Frequência Absoluta (fi)


14 2 =2
15 4 (4-2) = 2
16 9 (9-4) = 5
17 12 (12-9) =3
18 15 (15-12) =3
19 18 (18-15) =3
20 20 (20-18) = 2

A questão trata de probabilidade condicional, uma vez que temos a seguinte per-

gunta: “Qual a probabilidade de que o jovem escolhido tenha menos de 18 anos,

https://www.facebook.com/groups/2095402907430691 13 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

sabendo que esse jovem terá 16 anos ou mais?”. Isso significa que o espaço amos-

tral (condição) são os jovens que têm 16 anos ou mais, ou seja, 16 jovens (5 + 3+

3+ 3+ 2). Os casos favoráveis (aquilo que serve), são os jovens que têm menos

de 18 anos, isto é, aqueles que tem menos de 18 anos (5+3) dentro dos 16 jovens

selecionados.

Vamos agora aplicar a fórmula de probabilidade:

P (n) = Casos favoráveis / Casos possíveis.

P (n) = 8 / 16

Vejamos agora um outro conceito importante em nosso estudo por estatística:

Amplitude Amostral a) – RANGE

É a diferença entre o maior e o menor valor da amostra.

Considere a seguinte amostra de valores, relativos às idades de um grupo de 20

adolescentes: 4, 8, 8, 6, 6, 8, 5, 5, 6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5

Do exemplo dado acima, A = 8 - 4 = 4.

Representação de Dados em Classes

Na representação de grandes quantidades de dados, principalmente dos contí-

nuos, utiliza-se a forma de intervalos de classe. Pode ser aplicada a dados discre-

tos, quando se tratarem de grandes amostras.

https://www.facebook.com/groups/2095402907430691 14 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

1. Classe

É cada um dos intervalos ou grupos obtidos a partir do conjunto de dados. Há

diversos métodos para se determinar o número de classes. Vamos citar dois.

1.1. Regra do quadrado: K = n , em que n é o tamanho da amostra. Utiliza-se

o valor mais próximo do quadrado perfeito.

1.2. Regra de Sturges: K = 1 + 3,3 log n

Amplitude da Classe c)

Na forma moderna, é a diferença entre os limites superior e inferior da classe.

Ls: Limite superior

Li: Limite inferior

Classe: Ls- li

Ponto Médio da Classe (Pm)

É a média aritmética simples dos limites superior e inferior de cada classe.

Pm= (Ls + Li) / 2

Classes Frequência (f i) Pm (xi) xi. fi


2 │--- 4 3 3 9
4 │--- 6 5 5 25
6 │--- 8 10 7 70
8 │--- 10 5 9 45
10 │--- 12 3 11 33
26 182

https://www.facebook.com/groups/2095402907430691 15 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Medidas de Tendência Central e Separatrizes

No estudo de uma série estatística, é conveniente o cálculo de algumas medidas

que a caracterizam. Estas medidas, quando bem interpretadas, podem fornecer-

-nos informações muito valiosas com respeito à série estatística.

Em suma, podemos reduzi-la a alguns valores, cuja interpretação fornece-nos

uma compreensão bastante precisa da série. Um destes valores é a medida de ten-

dência central.

É um valor intermediário da série, ou seja, um valor compreendido entre o me-

nor e o maior valor da série. É também um valor em torno do qual os elementos da

série estão distribuídos e a posiciona em relação ao eixo horizontal.

Em resumo, a medida de tendência central procura estabelecer um número no

eixo horizontal em torno do qual a série se concentra.

As principais medidas de tendência central são:

1. MÉDIA;

2. MEDIANA;

3. MODA.

Média Aritmética

A MÉDIA ARITMÉTICA é o somatório de todos os termos dividido pelo número

total de termos.

Dentre os parâmetros estatísticos mais usados, podemos destacar a média arit-

mética, pois muitas pessoas, de algum modo, já utilizaram ou utilizam constan-

temente os cálculos envolvendo médias. Dessa forma, é considerada uma medida

https://www.facebook.com/groups/2095402907430691 16 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

de tendência central, pois focaliza valores médios dentre os maiores e menores. A

efetuação dos cálculos pode ser considerada de forma fácil, pois consiste em dividir

a soma total dos valores pelo número de valores; o resultado dessa divisão será

considerado a média aritmética dos termos.

Me: média

S: soma dos termos

n: número de termos

Me= S / n

Podemos representar a média aritmética pela seguinte expressão:

Acredito que você não tenha dúvida quanto à média aritmética, porém, é de

suma importância sabermos algumas propriedades, vejamos:

Pulo do Gato

1ª Propriedade

A soma algébrica dos desvios em relação à média é zero (nula).

∑di = ∑ (xi – x) = 0 Onde: di são as distâncias ou afastamentos da média.

2ª Propriedade

Somando-se ou subtraindo-se uma constante c) a todos os valores de uma variá-

vel, a média do conjunto fica aumentada ou diminuída dessa constante.

3ª Propriedade

Multiplicando-se ou dividindo-se todos os valores de uma variável por uma cons-

tante (c), a média do conjunto fica multiplicada ou dividida por essa constante.

https://www.facebook.com/groups/2095402907430691 17 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

4ª Propriedade

A média das médias é a média global de 2 ou mais grupos.

5ª Propriedade

A soma dos quadrados dos afastamentos contados a partir da média aritmética é

um mínimo.

6ª Propriedade

A média aritmética é atraída pelos valores extremos.

Considere os valores originais

Xi: 2,4,6,8,10 → x=6

Se o primeiro valor xi for alterado para 0:

Xi: 0,4,6,8,10 → x = 5,6

Se o último valor xi for alterado para 12:

Xi: 2,4,6,8,12 → x = 6,4

3. (2016/IADES/PC-DF/PERITO CRIMINAL) A média das idades dos 45 empregados

de uma corporação é de 32 anos. Para os próximos meses, estão previstas as apo-

sentadorias de cinco empregados cuja média de idades é de 62 anos. Considerando

essa situação hipotética, é correto afirmar que, após a efetivação de todas as apo-

sentadorias, a média das idades da corporação passará a ser a seguinte:

a) 25,11 anos.

b) 26 anos.

c) 28,25 anos.

d) 30,75 anos.

e) 36 anos.

https://www.facebook.com/groups/2095402907430691 18 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Letra c.

A questão afirma que a média era de 32 anos para 45 funcionários. Um detalhe

importante quanto à média aritmética é com relação ao somatório, isto é, a média

aritmética, por si só, não é uma boa medida para tomada de decisão, pois, segundo

as propriedades vistas, podemos afirmar que a mesma sofre influência dos valores

extremos. Porém, com a média aritmética, podemos calcular o somatório de todos

os valores do conjunto.

Vejamos:

Me=X/quantidade de funcionários

X – corresponde ao valor da soma das idades de todos os 45 funcionários: 32=X/45

X=1440 (soma de todas as idades)

Se a média era de 62 anos para 5 funcionários, podemos calcular a soma das ida-

des desses funcionários:

Me=Y/quantidade de funcionários.

Y corresponde ao valor da soma das idades de todos os 5 funcionários: 62=Y/5

Y=310 (soma da idade dos 5 funcionários)

A diferença das somas das idades (diferença entre X e Y) será a soma das idades

dos 40 funcionários (45-5).

A soma das idades dos 40 funcionários denominada Z, que é X-Y=1440-310=1130

(novo somatório dos funcionários da corporação).

Nova média:

Me=Z/40

Me=1130/40

Me= 28,25

https://www.facebook.com/groups/2095402907430691 19 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

4. (CESGRANRIO) Analise as afirmativas a seguir.

A média aritmética nem sempre é a melhor medida de tendência central.

PORQUE

A média aritmética é influenciada por valores extremos do conjunto de dados.

Considerando-se as relações entre as afirmações, conclui-se que

a) as duas asserções são verdadeiras e a segunda é uma justificativa correta da

primeira.

b) as duas asserções são verdadeiras e a segunda não é uma justificativa correta

da primeira.

c) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição

falsa.

d) a primeira asserção é uma proposição falsa e a segunda, uma proposição ver-

dadeira.

e) tanto a primeira como a segunda são proposições falsas.

Letra a.

Essa questão só ratifica o que já temos falado aqui em nosso material, sendo as-

sim, a resposta será a letra a.

5. (CESGRANRIO PETROBRAS/2008/ADMINISTRADOR JÚNIOR) A tabela abaixo

apresenta os pesos de um grupo de pessoas e suas respectivas frequências.

https://www.facebook.com/groups/2095402907430691 20 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Não há observações coincidentes com os extremos das classes.

O peso médio do conjunto de pessoas, em kgf, é

a) 60

b) 65

c) 67

d) 70

e) 75

Letra c.

Para que possamos calcular a média aritmética em que os valores se encontram em

valores contínuos, ou seja, em intervalo de classes, temos que encontrar os pontos

médios de cada intervalo, para que possamos multiplicar pela frequência.

O ponto médio é a média aritmética dos extremos da classe. Por exemplo, o ponto

médio da primeira classe é (40+ 50) /2 = 45.

Para encontrar a média, iremos somar os valores da coluna xi fi e dividir pela quan-

tidade de observações.

https://www.facebook.com/groups/2095402907430691 21 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

6. (MPE-RO/CESGRANRIO) A tabela apresenta uma distribuição de frequência dos

salários dos 200 empregados de certa empresa.

O salário médio, aproximadamente, vale:

a) R$ 600,00

b) R$ 780,00

c) R$ 890,50

d) R$ 1 040,00

e) R$ 1430,00

Letra c.

Para calcular a média aritmética de uma distribuição de frequências, convenciona-

mos que todos os valores incluídos em um determinado intervalo de classe coinci-

dem com o seu ponto médio.

Na tabela que será construída, iremos inserir uma coluna para os pontos médios

das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas

frequências. Não se esqueça de que, para calcular o ponto médio das classes, bas-

ta calcular a média aritmética dos extremos das classes; por exemplo, o primeiro

ponto médio é (260 + 520) / 2 = 390

https://www.facebook.com/groups/2095402907430691 22 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

1.1. Mediana

A MEDIANA, é uma medida de posição do centro da distribuição dos dados, de-

finida do seguinte modo:

Colocamos os elementos da amostra em rol, ou seja, ordem crescente ou de-

crescente, e encontramos a mediana que (pertencente ou não à amostra) e divide

ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana

e os outros 50% são maiores ou iguais à mediana.

Para a determinação da mediana, utiliza-se a seguinte regra, depois de ordena-

da a amostra de n elementos:

1. Se n é ímpar, a mediana é o elemento central.

{ 1, 3, 4, 5, 7}

Elemento central e) = (n+1) /2

e = (5+1)/2

e = 6/2

e= 3ª posição

Md= 4

https://www.facebook.com/groups/2095402907430691 23 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

2. Se n é par, a mediana é a semissoma dos dois elementos médios.

{ 1,3,5,6,7,9}

Elemento central e) = (n) /2

e = (6)/2

e = 6/2

e= 3ª posição

Como n é par, devemos calcular a média aritmética entre o 3º e 4º elementos, veja:

Md= ( 3ª posição + 4ª posição ) / 2

Md = (5 + 6)/ 2

Md= 5,5

1.2. Média X Mediana

Vamos realizar algumas ponderações a respeito de média e mediana.

Como medida de posição, a mediana é mais robusta do que a média, pois não é

tão sensível aos dados, ou seja, não sofre tanto influência dos extremos.

1. Em uma distribuição simétrica, a média e a mediana coincidem.

2. A mediana não é tão sensível, como a média, às observações, que são muito

maiores ou muito menores do que as restantes (outliers). Porém, a média reflete o

valor de todas as observações, isto é, para encontrarmos mais à frente os valores

de dispersão e até mesmo realizarmos algumas inferências, a média será de suma

importância.

Como já visto, a média, ao contrário da mediana, é uma medida muito influen-

ciada por valores “muito grandes” ou “muito pequenos”, mesmo que estes valores

surjam em pequeno número na amostra. Estes valores são os responsáveis pela

https://www.facebook.com/groups/2095402907430691 24 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

má utilização da média em muitas situações em que teria mais significado utilizar

a mediana.

A partir do exposto, podemos deduzir, que se a distribuição dos dados:

1. se for aproximadamente simétrica, a média aproxima-se da mediana.

2. se for assimétrica à direita (alguns valores grandes como “outliers”), a média

tende a ser maior que a mediana.

3. se for assimétrica à esquerda (alguns valores pequenos como “outliers”), a

média tende a ser inferior à mediana.

Vamos para mais uma questão comentada, para que possamos entender a re-

lação existente entre Média e Mediana.

7. (FUNIVERSA/PCDF) A tabela abaixo mostra o resultado da renda per capta de

duas cidades, X e Y, medido em reais.

X Y
MEDIANA 4.000 1.250
MÉDIA 3.750 4.750

Com bases nessas informações, pergunta-se:

1) qual das duas cidades tem o melhor padrão de vida? (Considere que todos os

outros fatores são iguais)

2) considerando que as duas cidades têm populações de mesmo tamanho e que a

taxa de impostos é de 10% em ambas, qual a cidade tem maior arrecadação?

Assinale a alternativa que apresenta as repostas corretas às perguntas 1 e 2, res-

pectivamente.

a) Cidade X e cidade X

b) Cidade Y e cidade Y

https://www.facebook.com/groups/2095402907430691 25 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

c) Cidade X e cidade Y

d) Cidade Y e cidade X

e) Não há informações suficientes para responder às perguntas

Letra c.

Essa questão é interessante, pois mostra uma interpretação quanto à diferença da

média e mediana, e suas implicações.

O melhor padrão de vida deve refletir a real situação da população, sendo assim,

precisamos de um valor que mostre uma regularidade, independentemente dos va-

lores extremos. O melhor parâmetro para isso é a mediana, pois divide a população

em duas partes iguais (50%) para cada lado; logo, a população X possui a renda

per capita mediana de 4.000, dando a entender que temos uma população com um

valor alto bem distribuído no grupo quanto à renda. Partindo do fato de que as duas

populações têm a mesma quantidade de pessoas, a média da população X é inferior

à da população Y, significando que a arrecadação total é menor, uma vez que, para

encontrar o somatório, basta multiplicarmos a média pela quantidade de pessoas.

Dessa forma, a população Y possui maior arrecadação, uma vez que possui maior

média aritmética.

1) para a primeira pergunta: qual das duas cidades tem o melhor padrão de vida?

(Considere que todos os outros fatores são iguais)

Temos como resposta a cidade X.

2) considerando que as duas cidades têm populações de mesmo tamanho e que a

taxa de impostos é de 10% em ambas, qual a cidade tem maior arrecadação?

Temos como resposta a cidade Y.

https://www.facebook.com/groups/2095402907430691 26 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

8. (FGV) A medida de um conjunto ordenado de dados, que divide este conjunto

em duas partes de igual número de observações, denomina-se:

a) média.

b) moda.

c) mediana.

d) desvio padrão.

e) variância.

Letra c.

Essa questão trata do conceito de mediana, em que é uma medida de posição do

centro da distribuição dos dados apresentados em rol.

Treinando um pouco, vamos lá!

Para resolver as três questões abaixo, utilize as informações a seguir.

O número de ausentes, por sala, em um dos prédios de aplicação de certo exa-

me de proficiência aplicado em certa região, segue a seguinte distribuição:

9. (CESGRANRIO) O número total de salas de aplicação neste prédio foi

a) 5

b) 10

https://www.facebook.com/groups/2095402907430691 27 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

c) 11

d) 25

e) 47

Letra d.

O número total de salas é dado pelo somatório da frequência absoluta.

10. (CESGRANRIO) Qual foi o número médio aproximado de ausentes por sala?

a) 10,7

b) 5,0

c) 4,7

d) 4,3

e) 2,5

Letra d.

Para encontrarmos a média aritmética, temos que multiplicar o valor de cada va-

riável de estudo pela frequência e depois dividirmos pelo somatório da frequência.

Vamos lá!

Me = 107 / 25 = 4,28 = 4,3

https://www.facebook.com/groups/2095402907430691 28 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

11. (CESGRANRIO) A mediana do número de ausentes neste prédio é

a) 3,0

b) 3,5

c) 4,0

d) 4,5

e) 5,0

Letra c.

Para encontrarmos a mediana, primeiramente temos que colocar os valores em rol,

ordem crescente, porém, são 25 valores. Se você quiser, pode coloca-los em ordem

e determinar a mediana, mas quero aproveitar para mostrar outra maneira.

Vamos lançar mão do conhecimento de frequência acumulada e, ao calcularmos o

elemento central e com a frequência acumulada, tornar-se-á mais rápido encontrar

a mediana. Veja.

Como n é ímpar, a mediana é o elemento central.

Elemento central e) = (n+1) /2

e = (25+1)/2

e = 26/2

e= 13ª posição

Para encontrarmos o décimo terceiro termo, iremos utilizar a tabela e criarmos

mais uma coluna, essa com a frequência acumulada.

Ausência Frequência Frequência acumulada


0 1 1º
1 2 3º
2 3 6º
3 4 10 º

https://www.facebook.com/groups/2095402907430691 29 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

4 5 15 º
5 2 17 º
6 3 20 º
7 3 23 º
9 1 24 º
10 1 25 º

A linha da tabela indica que o valor de 4 ausências se repete da décima primeira

posição até a décima quinta posição.

Como a mediana está na 13ª posição, podemos inferir que a mediana são 4 ausências.

1.3. Moda

Podemos definir a moda como sendo o valor que possui maior frequência, se os

dados forem discretos, ou, o intervalo de classe com maior frequência, se os dados

forem contínuos.

Assim, da representação gráfica dos dados, obtém-se imediatamente o valor

que representa a moda ou a classe modal.

Este parâmetro é bastante útil para reduzir a informação de um conjunto de da-

dos qualitativos, apresentados sob a forma de nomes ou categorias, para os quais

não se pode calcular a média e por vezes nem a mediana.

Um exemplo bem simples é:

Os dados abaixo se referem à idade de 20 jovens de uma turma de atletas dos

jogos escolares das escolas públicas do DF.

Idade: {12, 11, 12, 13, 12, 11, 13, 12, 12, 11, 14, 13, 13, 12, 11, 12, 13, 14,

11, 14}

A moda desse conjunto de dados será a idade que mais aparece, ou seja:

Mo = 12 (pois é a idade que possui maior frequência).

https://www.facebook.com/groups/2095402907430691 30 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

 Obs.: Apesar de simples, a moda nem sempre é única. Caso, no conjunto, existam

poucas observações, muito frequentemente não haverá valores repetidos,

com o que nenhum deles satisfaz a condição de moda. Por exemplo, a idade

de nove pessoas: 15; 25; 59; 45; 60; 12; 13 e 33; estes nove dados não

possuem uma moda, sendo um conjunto amodal. Por outro lado, se a distri-

buição da idade de 15 idosos for: 63; 67; 70; 69; 81; 57; 63; 73; 68; 63;

71; 71; 71 e 83, esse grupo possui duas modas (63 e 71 anos). Neste caso,

a distribuição diz-se bimodal. Será unimodal no caso de apresentar uma só

moda e multimodal se apresentar várias modas.

Em dados discretos, percebemos que é bem tranquilo encontrarmos a moda,

porém, se os dados forem contínuos, ou seja, em intervalo de classes, como en-

contrar a moda?

Mostre que você aprendeu!!!

Um pequeno levantamento para melhorar a qualidade da produção de textos em

um escritório colheu dados sobre o número de erros de digitação por página. A ta-

bela abaixo apresenta o resultado desse levantamento.

https://www.facebook.com/groups/2095402907430691 31 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

12. (CESPE) A partir das informações apresentadas no texto, assinale a opção in-

correta.

a) O número mediano de erros de digitação por página é igual a 1 erro por página.

b) A moda do número de erros de digitação é igual a 1 erro por página.

c) A amplitude total do número de erros de digitação é igual a 4 erros por página.

d) Em média, o número de erros por página é igual a 2.

Letra d.

As medidas de tendência central, estudadas até agora, fornecem informações ape-

nas sobre o tamanho do valor central de um conjunto de valores, sendo discretos

ou contínuos, de uma distribuição de frequência dessas observações. Não há infor-

mação, porém, a respeito de como estão dispersas as observações em torno desse

valor central (representativo desse conjunto de observações). Para uma melhor

interpretação no que diz respeito à tomada de decisões, temos que calcular novas

medidas chamadas de Dispersão, que vão nos indicar, com algum detalhe, de que

forma o conjunto das observações se comporta em função dos valores de centra-

lidade.

2. Medidas de Dispersão

2.1. Desvio

Em um conjunto de valores numéricos, o desvio é a “distância” de cada uma

dessas informações até a média aritmética delas.

O desvio é obtido subtraindo cada um dos valores de um conjunto de informa-

ções da média aritmética desse conjunto.

https://www.facebook.com/groups/2095402907430691 32 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Assim, os desvios devem ser calculados para cada elemento desse conjunto.

Vejamos um exemplo: quatro alunos de engenharia obtém as seguintes notas na

prova de Cálculo 3.

N1 = 6,5, N2 = 6,5, N3 = 6,0 e N4 = 5,0.

Calculando a nota média dos alunos, temos: Me= 6,0

Em relação a nota média, temos os seguintes desvios:

d1 = 6,5 – 6,0 = 0,5

d2 = 6,5 – 6,0 = 0,5

d3 = 6,0 – 6,0 = 0

d4 = 5,0 – 6,0 = – 1,0

 Obs.: 1. O sinal nos desvios é importante, pois determina se a nota tirada é maior

ou menor que a média.

 2. A soma dos desvios é igual a zero.

2.2. Amplitude

Em um conjunto de informações numéricas, a primeira medida de tendência

central é chamada amplitude e é obtida a partir da diferença entre a maior infor-

mação da lista e a menor.

Usando o mesmo exemplo utilizado acima, das notas dos dois alunos, observe

a amplitude das notas deles:

Primeiro: Média 6,0; amplitude = 6,5 – 5,5 = 1,0

Segundo: Média 6,0; amplitude = 10,0 – 1,0 = 9,0

https://www.facebook.com/groups/2095402907430691 33 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Observando apenas esses números, é possível perceber que o primeiro aluno

estabilizou as notas de suas provas e o segundo, não. Para concluir que o segundo

aluno teve melhor desenvolvimento, ainda precisamos ver o restante de suas notas.

2.3. Variância

A variância é a soma dos quadrados dividida pelo número de observações do

conjunto menos uma, em caso de amostras. A variância é representada por S2,

sendo calculada pela fórmula:

∑ (xi – Média)2 / (n – 1)

Ou seja,

S2 = SQ / (n-1)

 Obs.: em casos em que o conjunto de valores é uma população, teremos a variân-

cia calculada da seguinte forma:

∑ (xi – Média)2 / (n)

S2 = SQ / (n)

O denominador “n – 1” da variância é determinado por graus de liberdade. O

princípio dos graus de liberdade é constantemente utilizado na estatística, uma vez

que se é comum trabalhar com amostras.

Considerando um conjunto de “n” observações (dados) e fixando uma média

para esse grupo, existe a liberdade de escolher os valores numéricos de n-1 obser-

vações, o valor da última observação estará fixado para atender ao requisito de ser

a soma dos desvios da média igual a zero.

Vejamos uma questão comentada.

https://www.facebook.com/groups/2095402907430691 34 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

13. (CESGRANRIO) A tabela abaixo, representa as frequências acumuladas das

idades de 20 jovens entre 14 e 20 anos

Uma das medidas de dispersão é a variância populacional, que é calculada por

Sabendo-se que m é a média aritmética dessas idades, qual a variância das idades

na população formada pelos 20 jovens?

a) 0,15

b) 0,20

c) 1,78

d) 3,20

e) 3,35

Letra e.

Para que possamos calcular a variância, que é média do quadrado dos desvios, va-

mos encontrar primeiramente a média aritmética.

https://www.facebook.com/groups/2095402907430691 35 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

A tabela nos forneceu a frequência acumulada, logo, é necessário que encontremos

as frequências absolutas, vamos lá:

Idade (anos) Frequência Acumulada Frequência absoluta


14 2 2
15 4 4-2=2
16 9 9-4=5
17 12 12-9=3
18 15 15-12=3
19 18 18-15=3
20 20 20-18=2

Me= (2x14) + (2x15) + (5x16) + (3x17)+ (3x18) + (3x19) + (2x20) =

20

Me= 28 + 30 + 80 + 51+ 54+ 57+ 40 = 340 /20 = 17

20

S2 = [2(14-17)2 + 2(15-17)2+ 5(16-17)2+ 3(17-17)2+ 3(18-17)2+ 3(19-17)2+

2(20-17)2]/ 20

S2= [ (2x 9)+ ( 2x 4) + (5X1) + (3 X0 ) + (3 X 1) + (3 X 1) + (3X 4)+ (2X9)]

20

S2= 18 + 8 + 5 + 0+ 3 + 3 + 12 + 18 = 67/20 = 3,35

20

A resposta é a letra “e”.

14. (FUNCAB-2013) Em estatística, existe um conceito que é definido, para um

conjunto de dados, como “a média dos quadrados das diferenças dos valores em

relação à sua média. “Essa definição conceitua:

a) amplitude.

b) desvio-padrão.

https://www.facebook.com/groups/2095402907430691 36 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

c) coeficiente de variação.
d) variância.
e) estimador

Letra d.
Conforme o conceito já visto nesta aula, podemos inferir que se trata de variância.

15. (2015/VUNESP/PREFEITURA DE SÃO PAULO-SP) Utilize o texto e as tabelas


para responder à questão.
Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a rea-
lização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram
pesadas, e o resultado está expresso nas tabelas a seguir:

Escola A Escola B
Pessoas Massa (kg) Pessoas Massa (kg)
1 62 1 73
2 63 2 66
3 65 3 70
4 60 4 71
5 64 5 72
6 63 6 71
7 66 7 72
8 61 8 73

A soma das variâncias obtidas em cada um dos grupos é igual a


a) 7.
b) 9.
c) 8.
d) 6.
e) 10.

https://www.facebook.com/groups/2095402907430691 37 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Letra c.

A média aritmética de cada escola é dada por:

Me A = (62+63+65+60+64+63+66+61)/8 = 63

Me B = (73+66+70+71+72+71+72+73)/8=71

Após encontrarmos as médias aritméticas, vamos calcular os desvios em relação

às médias:

Escola A:

d1: 62-63=-1;

d2:63-63=0;

d3: 65-63=2;

d4: 60-63=-3;

d5: 64-63=-1;

d6: 63-63=0;

d7: 66-63=3;

d8: 61-63=-3

Escola B:

d1: 73-71=2;

d2: 66-71=-5;

d3: 70-71=-1;

d4: 71-71=0;

d5: 72-71=1;

d6: 71-71=0;

d7: 72-71=1;

d8: 73-71=2

https://www.facebook.com/groups/2095402907430691 38 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Escola A:

var(x)= -1²+0²+2²+...+-3²/8

var(x)=28/8=3,5

Escola B:

var(x)=2²+-5²+...+2²/8

var(x)=36/8=4,5

Resposta: 3,5+4,5=8

2.4. Desvio Padrão

O desvio padrão é uma das mais utilizadas medidas de variação de um grupo de

dados. A vantagem que apresenta sobre a variância é de permitir uma interpretação

direta da variação do conjunto de dados, pois o desvio padrão é expresso na mesma

unidade que a variável (Kg, cm, atm...). É representado por “s” e calculado por:

s = √∑ ( xi – Média)2/ (n – 1)

Podemos entender o desvio padrão como uma média dos valores absolutos dos

desvios, ou seja, dos desvios considerados todos com sinal positivo; média essa

obtida, porém, por um processo bastante elaborado: calculamos o quadrado de

cada desvio, obtemos a média desses quadrados e, depois, obtemos a raiz quadra-

da da média dos quadrados dos desvios.

É a estatística utilizada quando se deseja comparar a variação de conjuntos de

observações que diferem na média ou que são medidos em grandezas diferentes

(unidades de medição diferentes). O coeficiente de variação (C.V.) é o desvio pa-

drão expresso como uma porcentagem média.

CV = 100. (s / Média. (%)

https://www.facebook.com/groups/2095402907430691 39 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

16. (CESGRANRIO) Um grupo é formado por 10 pessoas, cujas idades são: 17 19

19 20 20 20 20 21 22 22

Seja µ a média aritmética das idades e σ seu desvio padrão. O número de pessoas

desse grupo cujas idades pertencem ao intervalo [µ – σ, µ + σ] é (Considere √2 =

1,4)

a) 9

b) 8

c) 7

d) 6

e) 5

Letra c.

Seja µ a média aritmética das idades:

µ= (17+ 19+ 19+ 20+ 20+ 20+ 20+ 21+ 22+ 22)/10

µ = 200/10= 20

σ2 = [(17-20)2 + 2(19-20)2 + 4(20-20)2+ 1(21-20)2+ 2(22-20)2]/10

σ2 = 20/10

σ2 = 2

σ = √2 = 1,4

Substituindo no intervalo, temos:

[µ – σ, µ + σ]

[20 -1,4, 20 + σ]

[18,6; 21,4]

https://www.facebook.com/groups/2095402907430691 40 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Quais as idades que se encontram entre 18, 6 e 21,4 das 10 pessoas?

Serão: {19,19, 20, 20,20, 20, 21}. Sete pessoas.

17. (2014/VUNESP/DESENVOLVESP) Um casal tem 4 filhos com idades de 1, 6, 8

e 15 anos, respectivamente. O desvio padrão das idades dos filhos é de, aproxima-

damente,

a) 625.

b) 15.

c) 14.

d) 7.

e) 5.

Letra e.

O Desvio padrão é a raiz quadradas da variância, porém, precisamos encontrar a

média aritmética, que será:

Me = 30/4 = 7,5.

Calculando a variância:

S2= (1-7,5)2+ (6-7,5)2 +(8-7,5)2+ (15-7,5)2

S2= 101/4= 25,25

S = 5,02

Propriedades do Desvio Padrão e da Variância:

1 – somando-se (ou subtraindo-se) a cada elemento uma constante qualquer, o

Desvio Padrão e a Variância não se alteram.

https://www.facebook.com/groups/2095402907430691 41 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

2 – multiplicando-se (ou dividindo-se) cada elemento por uma constante qualquer:

–– O desvio padrão fica multiplicado (ou dividido) por essa constante; a vari-

ância fica multiplicada (ou dividida) PELO QUADRADO dessa constante.

Vamos agora resolver duas questões aplicando as propriedades da média arit-

mética, variância e desvio padrão.

18. (ESAF) Em certa empresa, o salário médio era de R$ 90.000,00 e o desvio pa-

drão dos salários era de R$ 10.000,00. Todos os salários receberam um aumento

de 10%. O desvio padrão dos salários passou a ser de:

a) R$ 10.000,00

b) R$ 10.100,00

c) R$ 10.500,00

d) R$ 10.900,00

e) R$ 11.000,00

Letra d.

Essa questão é uma aplicação das propriedades do desvio padrão, em que aumen-

tar 10% significa multiplicar por uma constante 1,1.

Segundo a propriedade:

multiplicando-se (ou dividindo-se) cada elemento por uma constante qualquer, o

desvio padrão fica multiplicado (ou dividido) por essa constante.

Dessa forma, podemos inferir que o novo desvio padrão será:

10.000,00 x 1,1 = 11.000,00

https://www.facebook.com/groups/2095402907430691 42 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

19. (CESGRARNIO) Se Y = 2X+1 e a variância de X vale 2, a variância de Y é igual a:

a) 2

b) 4

c) 5

d) 8

e) 9

Letra d.

De acordo com as propriedades da variância, temos que, se multiplicarmos cada

elemento por uma constante, a nova variância será multiplicada pelo quadrado da

constante.

Quanto à soma, a variância fica inalterável.

Dessa forma, teremos:

VY = 2VX+1

VY = (2)2VX+1

VY = (2)2.(2) +1 ( a soma fica inalterável)

VY = (2)2.(2) = 8

2.5. Coeficiente de Variação (Cv)

O coeficiente de variação é uma medida relativa de variabilidade.

Será calculada pelo coeficiente entre o desvio padrão e a média aritmética.

Na estatística descritiva, o desvio-padrão por si só apresenta algumas limita-

ções. Assim, um desvio-padrão de três unidades pode ser considerado pequeno

para uma série de valores cujo valor médio é 300; no entanto, se a média for igual

a 30, por exemplo, o desvio de 3 unidades torna-se representativo.

https://www.facebook.com/groups/2095402907430691 43 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Sabemos que o desvio-padrão é expresso na mesma unidade dos dados; desta

forma, não é possível aplicá-lo na comparação de duas ou mais séries de valores

expressas em unidades diferentes.

Para atender a essa limitação, podemos caracterizar a dispersão ou variabilida-

de dos dados em termos relativos a seu valor médio, medida essa denominada de

Coeficiente de Variação.

 Obs.: o coeficiente CV é expresso em percentual, pois o desvio padrão e a média

possuem as mesmas unidades de medidas.

Vejamos uma aplicação.

Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo

de indivíduos:

Média aritmética Desvio padrão


Estaturas 175 cm 5 cm
Pesos 68 kg 2 Kg

Qual das medidas, estatura ou peso, possui maior variação, ou seja, é mais he-

terogêneo?

Apenas com o desvio padrão não é possível responder a essa pergunta, uma

vez que estamos realizando uma comparação entre 02 grandezas. O ideal é calcu-

larmos o coeficiente de variação da estatura e do peso e realizarmos uma análise.

A série que apresentar a maior variação, ou seja, o maior valor do coeficiente CV,

será a série de maior heterogeneidade.

Vamos aplicar a fórmula em cada grandeza:

CV Estatura:

Cv= (5/175) x 100

Cv= 2,85%

https://www.facebook.com/groups/2095402907430691 44 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

CV Peso

Cv= (2/68) x 100

Cv= 2,94%

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão

que os pesos, ou seja, maior heterogeneidade.

20. (FUNDAÇÃO CARLOS CHAGAS) Seja X uma variável com média 3 e coeficiente

de variação igual a 0,5. Seja Y = -2X + 3. As variâncias de X e Y são dadas, res-

pectivamente, por

a) 1,5 e 6.

b) 2,25 e 9.

c) 1,5 e 3.

d) 2,25 e 5.

e) 2,5 e 6.

Letra b.

Para encontrarmos as variâncias de X e Y, vamos aplicar as propriedades e a fór-

mula do coeficiente de variação. Vamos lá!!!

Cvx = coeficiente de variação de x

Sx= desvio padrão de x

Xx= Média aritmética de x

CVx = Sx/Xx ( coeficiente de variação de x)

0,5 = Sx / 3

Sx= 1,5

https://www.facebook.com/groups/2095402907430691 45 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Sx2= (1,5)2
Sx2= 2,25 (variação de X)
Y= -2x + 3
Sy2=-2(Sx2) + 3 (a soma de três não altera a variância)
Sy2=-2(Sx2)
Sy2=(-2)2.(2,25) = 9

21. (ESAF) Um certo atributo W, medido em unidades apropriadas, tem média


amostral 5 e desvio-padrão unitário. Assinale a opção que corresponde ao coefi-
ciente de variação, para a mesma amostra, do atributo Y = 5 + 5W.
a) 16,7%
b) 20,0%
c) 55,0%
d) 50,8%
e) 70,2%

Letra a.
Outra questão com aplicação das propriedades, vamos lá:
Xw = média de W;
Sw = desvio padrão de W;
Xw = 5
Sw = 1
Para que possamos encontrar o coeficiente de variação de Y, precisamos do desvio
padrão e da média aritmética.
XY = 5 + 5XW.
XY = 5 + 5(5)
XY = 30 (média de y)

https://www.facebook.com/groups/2095402907430691 46 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Desvio padrão de y:

SY = 5 + 5SW.

SY = 5 + 5(1). (Somar no desvio padrão não influencia, inalterável)

SY = 0 + 5(1) = 5

Agora sim, temos a média e o desvio padrão Y, podemos encontrar o coeficiente de

variação.

Cv y= SY / XY

Cv y= 5 / 30

Cv y= 1,16666 = 16,7%

22. (ESAF) O atributo Z= (X-2)/3 tem média amostral 20 e variância amostral

2,56. Assinale a opção que corresponde ao coeficiente de variação amostral de X.

a) 12,9%

b) 50,1%

c) 7,7%

d) 31,2%

e) 10,0%

Letra c.

Temos que Z= (X-2)/3, então vamos melhorar um pouco essa expressão:

3Z = X – 2

X – = 3Z + 2

XZ=20 (média de Z)

S2z= 2,56 (variância de Z)

Sz= √2,56 = 1,6 (desvio padrão de Z)

https://www.facebook.com/groups/2095402907430691 47 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Para encontrarmos o coeficiente de variação X: Cvx= Sx/Xx

X – = 3Z + 2

Xx = 3Zz + 2

Xx = 3(20) + 2

Xx = 62

X – = 3Z + 2

Sx = 3. Sz + 2 (somar ou subtrair uma constante no desvio é inalterável)

Sx = 3. (1,6) + 0

Sx =4,8

Cvx= Sx/Xx

Cvx= 4,8/62

Cvx= 7,7%

23. (2016/VUNESP/MPE-SP) Na estatística, são considerados medidas de disper-

são:

a) média e moda.

b) percentil e coeficiente de variação.

c) amplitude total e percentil.

d) amplitude total e desvio padrão.

e) variância e média.

Letra d.

Na Estatística descritiva, dispersão mostra o quão dispersa se encontra a distri-

buição os valores em relação à média. Exemplos comuns de medidas de dispersão

estatística são a variância, o desvio padrão e a amplitude interquartil.

https://www.facebook.com/groups/2095402907430691 48 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Ainda com relação à estatística descritiva, vejamos sobre assimetria e curtose:

Assimetria

As medidas de assimetria indicam o grau de assimetria de uma distribuição de

frequências unimodal em relação a uma linha vertical que passa por seu ponto mais

elevado.

Distribuição Simétrica

Graficamente, uma distribuição simétrica tem associada a si uma curva de fre-

quências unimodal apresentando duas “caudas” simétricas em relação a uma li-

nha vertical, que passa por seu ponto mais alto (eixo de simetria).

Distribuições Assimétricas

Uma distribuição assimétrica tem associada a si uma curva de frequências uni-

modal que apresenta, a partir do seu ponto mais alto, uma “cauda” mais longa para

a direita (assimetria positiva) ou para a esquerda (assimetria negativa).

https://www.facebook.com/groups/2095402907430691 49 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Nas distribuições assimétricas, os valores da moda, da mediana e da média, di-

vergem, sendo que a média sempre estará do mesmo lado que a cauda mais longa.

Fonte: https://www.grancursospresencial.com.br/novo/upload/a419092005194957.pdf

Agora, vamos juntos comentar uma questão para que possamos entender melhor.

24. (2014/VUNESP/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) A figura abaixo

representa o gráfico relativo a uma distribuição de frequência F para uma amostra

de dados. Seja Me o valor da média, Md o valor da mediana e Mo o valor da moda,

então:

https://www.facebook.com/groups/2095402907430691 50 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

a) Me < Md < Mo

b) Md < Mo < Me

c) Mo < Md < Me

d) Me < Mo < Md

e) Md < Me < Mo

Letra c.

Independentemente se a distribuição é assimétrica, à direita ou à esquerda, a maior

frequência se encontra no ápice do gráfico, ou seja, é a moda. O gráfico da questão

trata de uma distribuição assimétrica à direita. A medida de tendência central que

sofre influência dos extremos é a média aritmética, logo, fica a dica, ela sempre

estará na calda do gráfico. Sendo assim, sobra a mediana que se encontrará entre

a moda e a média aritmética.

A reta x cresce da esquerda para a direita:

Temos que a Mo < Md < Me.

https://www.facebook.com/groups/2095402907430691 51 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

25. (CESGRANRIO) Analise as afirmações a seguir.

Numa distribuição simétrica, a média e a mediana coincidem.

PORQUE

Numa distribuição simétrica a moda nem sempre existe.

Quanto às afirmações acima, pode-se concluir que

a) as duas asserções são verdadeiras e a segunda é uma justificativa correta da

primeira.

b) as duas asserções são verdadeiras e a segunda não é uma justificativa correta

da primeira.

c) a primeira asserção é uma proposição verdadeira e a segunda, uma proposição

falsa.

d) a primeira asserção é uma proposição falsa e a segunda, uma proposição ver-

dadeira.

e) tanto a primeira como a segunda são proposições falsas.

Letra b.

Conforme os conceitos vistos nesta aula, podemos inferir que as duas asserções

são verdadeiras e a segunda não é uma justificativa correta da primeira.

26. (2015/VUNESP/TJ-SP) A distribuição de salários de uma empresa com 30 fun-

cionários é dada na tabela seguinte.

Salário (em salários mínimos) Funcionários


1,8 10
2,5 8
3,0 5

https://www.facebook.com/groups/2095402907430691 52 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

5,0 4
8,0 2
15,0 1

De acordo com a tabela, assinale a afirmação verdadeira.


a) A distribuição é simétrica.
b) A distribuição tem assimetria positiva.
c) A moda é 10.
d) A mediana é 5.
e) O menor salário é 1.

Letra b.
MODA: analisando a tabela, podemos inferir que a moda igual a 1,8, devido ao
aparecimento da maior frequência absoluta.
MEDIANA: colocando os salários em rol, podemos encontrar a mediana igual a 2,5
(ordenando os valores dos salários (n = 30), e teremos que a posição 15º e 16º
terá valores iguais a 2,5. Logo, mediana será a média aritmética (2,5 + 2,5) /2 =
2,5)
MÉDIA = 15 + (8.2) + (5.4) + (3.5) + (2, 5.8) + (1, 8.10) / 30 = 104/30 = 3,5
Analisando os valores das medidas de centralidade, temos:
Mo < Md < Me
A distribuição é assimétrica positiva.

Curtose

Denomina-se curtose o grau de “achatamento” de uma distribuição de frequên-

cias, geralmente unimodal, medido em relação ao de uma distribuição normal (de

Gauss) que é tomada como padrão.

https://www.facebook.com/groups/2095402907430691 53 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

De uma maneira mais simples, podemos dizer que curtose é o “grau de achata-

mento” de uma distribuição de frequências; o que as medidas de curtose buscam

indicar realmente é o grau de concentração de valores da distribuição em torno do

centro desta distribuição.

Numa distribuição unimodal, quanto maior for a concentração de valores em

torno do centro da mesma, maior será o valor da sua curtose.

Graficamente, isto será associado a uma curva com a parte central mais afilada,

mostrando um pico de frequência simples mais destacado, mais pontiagudo, carac-

terizando a moda da distribuição de forma mais nítida.

Dizemos que uma distribuição de frequências é

Mesocúrtica – quando apresenta uma medida de curtose igual à da distribui-

ção normal.

Platicúrtica – quando apresenta uma medida de curtose menor que a da dis-

tribuição normal.

Leptocúrtica – quando apresenta uma medida de curtose maior que a da dis-

tribuição normal.

Coeficiente Percentílico de Curtose

Este coeficiente é definido como o quociente entre a amplitude semi-interquar-

tílica e a amplitude entre o 10º e o 90º percentis.

O valor deste coeficiente para a curva normal é 0, 26367...

https://www.facebook.com/groups/2095402907430691 54 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Assim sendo, ao calcularmos o coeficiente percentílico de curtose de uma distri-

buição qualquer, teremos:

Quando Cp ≅ 0,263 →diremos que a distribuição é mesocúrtica.

Quando Cp < 0,263 →diremos que a distribuição é platicúrtica.

Quando Cp > 0,263 →diremos que a distribuição é leptocúrtica.

Coeficiente Momento de Curtose

O coeficiente momento de curtose é definido como o quociente entre o momen-

to centrado de quarta ordem (m4) e o quadrado do momento centrado de segunda

ordem (variância).

O valor deste coeficiente para a curva normal é 3,00.

Portanto:

Quando Cm ≅ 3,00 →diremos que a distribuição é mesocúrtica.

Quando Cm < 3,00 →diremos que a distribuição é platicúrtica.

Quando Cm > 3,00 →diremos que a distribuição é leptocúrtica.


Fonte: https://www.grancursospresencial.com.br/novo/upload/a419092005194957.pdf

27. (2014/VUNESP/DESENVOLVESP) A medida do “achatamento” de uma distribui-

ção de probabilidade é denominada

a) assimetria.

b) variância.

c) desvio padrão.

d) curtose.

e) desvio absoluto médio.

https://www.facebook.com/groups/2095402907430691 55 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Letra d.

Denomina-se curtose o grau de “achatamento” de uma distribuição de frequên-

cias, geralmente unimodal, medido em relação ao de uma distribuição normal (de

Gauss), que é tomada como padrão.

Vejamos algumas questões de probabilidade, blz?!

28. (2015/VUNESP/PREFEITURA DE SÃO PAULO-SP) Em um bairro da cidade, foi

feita uma enquete para verificar a preferência da comunidade em relação a dois

projetos: construção de uma árvore de natal ou um espetáculo com um cantor

popular. Os entrevistados deveriam optar por apenas uma dessas duas opções. Su-

pondo que a chance de escolha de cada uma das opções é de 50%, a probabilidade

de se conseguir 4 votos para o espetáculo e 2 votos para a construção da árvore,

em um total de 6 votos, é, aproximadamente, igual a

a) 24,5%.

b) 44,9%.

c) 33,3%.

d) 23,4%.

e) 28,1%.

Letra d.

Temos eventos sucessivos em que a chance de construção de uma árvore de natal

é igual a 50%, e de um espetáculo com um cantor popular também é de 50%.

https://www.facebook.com/groups/2095402907430691 56 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Mas a questão afirma que, em seis votos, a chance de termos 4 votos para o espe-

táculo e 2 votos para a construção da árvore é:

E (espetáculo) = 1/2

A (árvore) = 1/2

E.E.E.E.A.A

½.½.½.½.½.½. = 1/64

Não podemos esquecer a questão da ordem em que os votos podem ocorrer, sendo

assim, teremos 6!/4!.2!, ordens distintas, que é igual a 15 ordens.

29. (2015/VUNESP/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Leia o texto a seguir para

responder à questão.

Uma pesquisa com uma amostra de jovens entre 18 e 25 anos de uma comunidade

revelou que 70% deles estudam e que 50% deles trabalham. A pesquisa mostrou

ainda que 40% desses jovens trabalham e estudam.

Escolhido um jovem entre 18 e 25 anos dessa comunidade, a probabilidade de que

seja estudante, sabendo-se que não trabalha, é de

a) 30%

b) 40%

c) 50%

d) 60%

e) 70%

https://www.facebook.com/groups/2095402907430691 57 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

Letra d.

Vamos construir os diagramas para que você possa entender melhor:

Se 70% estudam e 40% estudam e trabalham, então 30% só estudam. Se 50%

trabalham, então 50% não trabalham.

P (n) = 30% / 50%

P (n) = 60%

30. (2015/VUNESP/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Leia o texto a seguir para

responder à questão.

Uma pesquisa com uma amostra de jovens entre 18 e 25 anos de uma comunidade

revelou que 70% deles estudam e que 50% deles trabalham. A pesquisa mostrou

ainda que 40% desses jovens trabalham e estudam.

Escolhendo-se, ao acaso, dois jovens entre 18 e 25 anos dessa comunidade, a pro-

babilidade de que pelo menos um deles seja estudante é de

a) 91%

b) 70%

c) 49%

https://www.facebook.com/groups/2095402907430691 58 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

d) 30%

e) 9%

Letra a.

Vamos construir os diagramas para que você possa entender melhor:

Agora, temos dois jovens, em que pelo menos um seja estudante; então pode ser

também os dois jovens estudantes.

Pela exclusão, o que não pode acontecer são os dois jovens não serem estudantes.

Vamos considerar o geral (todo =1) e subtrair o que não serve (os dois não serem

estudantes):

- (30/100 x 29/99)

1- (0,3. 0,2929)

1 - ( 0,0878787) = 0,9112 = 91%

31. (2014/VUNESP/TJ-PA/ANALISTA JUDICIÁRIO/ESTATÍSTICA) As probabilidades

de três times de futebol A, B e C vencerem seus jogos na próxima rodada de um

campeonato, considerando-se o time que cada um deles vai enfrentar, são inde-

pendentes e são dadas por: pa) = 2/5; pb) = 3/8 e pc) = 1/2. Ocorrendo os três

jogos, a probabilidade de que apenas A vença o seu jogo é:

https://www.facebook.com/groups/2095402907430691 59 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

a) 0,4%.

b) 1,25%.

c) 4%.

d) 12,5%.

e) 40%.

Letra d.

Temos que a probabilidade de A vencer: 2/5

Temos que a probabilidade de B perder: 5/8

Temos que a probabilidade de C perder: 1/2

2/5 x 5/8 x 1/2 = 10/80 = 0,125 = 12,5 %

https://www.facebook.com/groups/2095402907430691 60 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

QUESTÕES DE CONCURSO

1. (2015/PREFEITURA DE SÃO PAULO-SP) Utilize o texto e as tabelas para respon-

der à questão.

Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a rea-

lização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram

pesadas, e o resultado está expresso nas tabelas a seguir:

Escola A Escola B
Pessoas Massa (kg) Pessoas Massa (kg)
1 62 1 73
2 63 2 66
3 65 3 70
4 60 4 71
5 64 5 72
6 63 6 71
7 66 7 72
8 61 8 73

Percentualmente, a média aritmética das massas dos alunos relacionados da escola

B supera a média aritmética das massas dos alunos relacionados da escola A em,

aproximadamente,

a) 17%.

b) 13%.

c) 21%.

d) 18%.

e) 9%

https://www.facebook.com/groups/2095402907430691 61 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

2. (2015/PREFEITURA DE SÃO PAULO-SP) Utilize o texto e as tabelas para respon-

der à questão.

Duas amostras de 8 pessoas foram escolhidas em duas escolas, A e B, para a rea-

lização de um estudo sobre a obesidade entre adolescentes. As 16 pessoas foram

pesadas, e o resultado está expresso nas tabelas a seguir:

Escola A Escola B
Pessoas Massa (kg) Pessoas Massa (kg)
1 62 1 73
2 63 2 66
3 65 3 70
4 60 4 71
5 64 5 72
6 63 6 71
7 66 7 72
8 61 8 73

A variabilidade dos dados da escola B é maior do que a variabilidade obtida com

os dados da escola A. A diferença entre o desvio padrão obtido para a escola B e o

desvio padrão obtido para a escola A está no intervalo entre

a) 0,17 kg e 0,21 kg.

b) 0,29 kg e 0,33 kg.

c) 0,13 kg e 0,17 kg.

d) 0,21 kg e 0,25 kg.

e) 0,25 kg e 0,29 kg.

https://www.facebook.com/groups/2095402907430691 62 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

3. (2015/PREFEITURA DE SÃO PAULO-SP) A distorção ou o desvio que é compro-

vadamente não representativo de distorção ou desvio em uma população denomi-

na-se,

a) estratificação.

b) taxa tolerável de desvio.

c) anomalia. XX

d) amostragem estatística.

e) unidade de amostragem.

4. (2015/VUNESP/TJ-SP) A distribuição de salários de uma empresa com 30 fun-

cionários é dada na tabela seguinte.

Salário (em salários mínimos) Funcionários


1,8 10
2,5 8
3,0 5
5,0 4
8,0 2
15,0 1

A média de salários mais a mediana é, aproximadamente, igual a

a) 6,0.

b) 6,5.

c) 7,0.

d) 7,5.

e) 8,0.

https://www.facebook.com/groups/2095402907430691 63 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

5. (2015/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Considere a tabela de distribuição de

frequência seguinte, em que xi é a variável estudada e fi é a frequência absoluta

dos dados.

xi fi
30 — 35 4
35 — 40 12
40 — 45 10
45 — 50 8
50 — 55 6
TOTAL 40

A mediana dos dados é

a) 30,75.

b) 42,00.

c) 47,75.

d) 50,25.

e) 52,75.

6. (2015/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Na tabela seguinte, são anotadas as

idades de 40 pessoas inscritas para participar do júri em um julgamento.

19 19 22 22 22 27 27 28 29 29

29 30 31 33 33 34 34 34 35 35

35 36 36 37 38 38 38 38 42 44

44 44 46 48 52 58 68 68 78 82

https://www.facebook.com/groups/2095402907430691 64 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

O juiz, consultando essa tabela, decide não convocar os candidatos cujas idades es-

tão abaixo do 1º quartil, bem como aqueles cujas idades estão acima do 3º quartil.

O 1º e o 3º quartil são, respectivamente,

a) 29 e 44.

b) 29 e 42.

c) 30 e 44.

d) 30 e 50.

e) 29 e 46.

7. (2015/TJ-SP/ESTATÍSTICO JUDICIÁRIO) Dados os valores de uma variável: 5,

10, 15, 20, 25, as variâncias amostral e populacional são, respectivamente,

a) 14,7 e 15.

b) 125 e 250.

c) 62,5 e 50.

d) 29,4 e 30,8.

e) 83,3 e 85.

https://www.facebook.com/groups/2095402907430691 65 de 66
MATEMÁTICA, PROBABILIDADE E ESTATÍSTICA
Estatística
Prof. Josimar Padilha

GABARITO

1. b

2. e

3. c

4. a

5. b

6. a

7. c

https://www.facebook.com/groups/2095402907430691 66 de 66

Você também pode gostar