Escolar Documentos
Profissional Documentos
Cultura Documentos
Fádua Ferreira
CRONOGRAMA DE AULAS
1ª Avaliação
• 23/09/2019: REVISÃO;
• 30/09/2019: 1ª AVALIAÇÃO.
Estatística I Profa. Fádua Ferreira
ORGANIZAÇÃO DE DADOS
• Medidas de tendência central
Média, mediana, moda e separatrizes
MEDIDAS DE TENDÊNCIA
CENTRAL
SEPARATRIZES
MEDIDAS DE SEPARATRIZES
Definição: as medidas separatrizes são medidas de posição e
tem por finalidade dividir um conjunto de dados, relativo a um
fenômeno, em K partes iguais.
As medidas separatrizes são:
1. Mediana: Divide os dados em duas partes iguais;
2. Quartil: Divide os dados em quatro partes iguais;
3. Decil: Divide os dados em dez partes iguais;
4. Percentil: Divide os dados em cem partes iguais.
Estatística I Profa. Fádua Ferreira
MEDIDAS DE SEPARATRIZES
QUARTIS
Definição: são valores dados a partir do conjunto de observações
ordenado em ordem crescente, que dividem a distribuição em quatro
partes iguais. Denominados de 𝑄 , 𝑄 𝑒 𝑄 .
O primeiro quartil, 𝑄 , é o número que deixa, aproximadamente, 25%
das observações abaixo e, aproximadamente, 75% acima.
Enquanto que o terceiro quartil, 𝑄 , deixa, aproximadamente, 75% das
observações abaixo e, aproximadamente, 25% acima.
Já 𝑄 é a mediana, deixa 50% das observações abaixo e 50% das
observações acima.
MEDIDAS DE SEPARATRIZES
QUARTIS
Assim como na obtenção da mediana, os quartis são obtidos
através do cálculo das posições.
O cálculo para as posições dos quartis é dado por
𝑖×𝑛
𝑃𝑜𝑠 = , 𝑖 = 1,2,3.
4
em que 𝑖 indica qual é o quartil e 𝑛 é o tamanho amostral.
Exemplo: Encontre o 𝑄 para os dados de produção de cana-de-açúcar,
de uma determinada variedade, por toneladas de hectares, dispostos a
seguir:
88 89 90 91 92 93 95 96 97 99
Estatística I Profa. Fádua Ferreira
MEDIDAS DE SEPARATRIZES
DECIS
Definição: são valores dados a partir do conjunto de observações
ordenado em ordem crescente, que dividem a distribuição em dez
partes iguais. Denominados de 𝐷 , 𝑖 = 1,2,3 … , 9.
Já 𝐷 é a mediana, deixa 50% das observações abaixo e 50% das
observações acima.
MEDIDAS DE SEPARATRIZES
DECIS
Os decis são obtidos através do cálculo das posições.
O calculo para as posições dos decis usamos a seguinte
expressão:
𝑖×𝑛
𝑃𝑜𝑠 = , 𝑖 = 1,2, … , 9.
10
em que 𝑖 indica qual é o decil e 𝑛 é o tamanho amostral.
Exemplo: Encontre o 𝐷 para os dados de produção de cana-
de-açúcar, de uma determinada variedade, por toneladas de
hectares, dispostos a seguir:
88 89 90 91 92 93 95 96 97 99
Estatística I Profa. Fádua Ferreira
MEDIDAS DE SEPARATRIZES
PERCENTIS
Definição: são valores dados a partir do conjunto de
observações ordenado em ordem crescente, que
dividem a distribuição em 100 partes iguais.
Denominados de
Note que, é a mediana, éa , éa .
MEDIDAS DE SEPARATRIZES
PERCENTIS
Os percentis são obtidos através do cálculo das posições.
O cálculo para as posições dos decis usamos a seguinte
expressão:
𝑖×𝑛
𝑃𝑜𝑠 = , 𝑖 = 1,2, … , 99.
100
em que 𝑖 indica qual é o percentil e 𝑛 é o tamanho amostral.
Exemplo: Encontre o 𝑃 para os dados de produção de cana-
de-açúcar, de uma determinada variedade, por toneladas de
hectares, dispostos a seguir:
88 89 90 91 92 93 95 96 97 99
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
MEDIDAS DE VARIABILIDADE
As medidas de tendência central nos dão uma ideia da
concentração dos dados em torno de um valor.
Entretanto, é preciso também conhecer suas
características de espalhamento ou dispersão -
medidas de variabilidade (ou dispersão).
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
Sejam os seguintes conjun-
tos de dado: Importância do
uso das medidas de
variabilidade.
Observe que cada série tem
a mesma média e mediana.
No entanto, note que a
dispersão entre os valores é
bem diferente.
MEDIDAS DE VARIABILIDADE
Exemplo: Considere o exemplo de duas linha de produção de uma
peça. A média do comprimento da peça é de 75cm e ambas as linhas
estão produzindo peças com médias próximas desse valor. Podemos
considerar que as peças produzidas por ambas as linhas são
adequadas?
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
É claro que as peças produzidas pela primeira linha de produção são
melhores que a segunda.
Isso ocorre porque a dispersão dos elementos em torno da média é
menor, ou seja, os elementos estão mais concentrados em torno da
média na primeira linha de produção.
Como queremos avaliar a dispersão dos dados em torno da média, esse
valor estará relacionado com a distância dos dados em relação à
média.
MEDIDAS DE VARIABILIDADE
No exemplo da imagem anterior, temos
𝑑 +𝑑 +𝑑 +𝑑 =0
O qual nos levaria à conclusão errada de que não existe
variação entre os dados.
Desta forma, precisamos de alguns medidas estatísticas para
poder estudar a dispersão dos dados de forma correta.
Dispersão é sinônimo de variação ou variabilidade. Para
medir a dispersão, duas medidas são usadas mais
frequentemente: a amplitude e o desvio padrão. Para
definirmos desvio padrão é necessário definir variância.
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
Como uma medida de variação, a amplitude tem a vantagem
de ser fácil de calcular.
Sua desvantagem, entretanto, é que ela usa somente dois
valores do conjunto de dados.
Duas medidas de variação que usam todos os valores do
conjunto de dados são a variância e o desvio padrão.
Porém, antes de aprendermos essas medidas, precisamos
entender o que chamamos desvio de um valor no conjunto de
dados.
MEDIDAS DE VARIABILIDADE
Definição
O desvio de um valor em uma população é a
diferença entre o valor e a média do conjunto de
dados.
Desvio de .
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
AMPLITUDE TOTAL
Definição: é a diferença entre o maior valor e o menor
valor do conjunto de dados.
Utilizado para comparar dois procedimentos.
A amplitude total é expressa por:
( )
em que é o mínimo e ( ) é o máximo.
MEDIDAS DE VARIABILIDADE
AMPLITUDE TOTAL
Exemplo 1: Dosagem de colesterol, realizada por dois procedimentos.
MEDIDAS DE VARIABILIDADE
VARIÂNCIA
A variância é a medida de dispersão definida como a média do
quadrado dos desvios dos elementos em relação à média.
Populacional
∑ 𝑥 −𝜇
𝜎 = , 𝜎 >0
𝑁
Amostral
∑
𝑥 −𝑋
𝑆 = , 𝑆>0
𝑛−1
Geralmente estaremos utilizando 𝑆 por estarmos trabalhando com
amostras.
MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
Também é uma medida de variabilidade em torno da média. Está
diretamente relacionado com a variância.
Expresso pela raiz quadrada da variância, ou seja:
Populacional
∑ 𝑥 −𝜇
𝜎= , 𝜎>0
𝑁
Amostral
∑ 𝑥 −𝑋
𝑆= , 𝑆>0
𝑛−1
Geralmente estaremos utilizando 𝑆 por estarmos trabalhando com
amostras.
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
INTERPRETANDO O DESVIO PADRÃO
Ao interpretar o desvio padrão de um conjunto de dados, lembre-se de
que ele é uma medida que indica o quanto, em média, os valores se
desviam da média desse conjunto. Quanto mais espalhados estiverem
os valores, maior será o desvio padrão.
Valores de dados que se encontram a mais ou menos dois desvios
padrão da média são considerados incomuns, enquanto aqueles que
se encontram a mais de três desvios padrão da média são muito
incomuns.
Valores incomuns e muito incomuns têm uma influência maior no
desvio padrão do que aqueles que estão mais próximos da média.
Isso acontece porque os desvios são elevados ao quadrado.
MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
Muitos conjuntos de dados da vida real têm distribuições que são
aproximadamente simétricas e em forma de sino. A Regra Empírica pode
ajudá-lo a ver quão valioso é o desvio padrão como uma medida de variação.
Regra Empírica (ou Regra 68-95-99,7)
Para conjuntos de dados com distribuições que são aproximadamente
simétricas e com forma de sino, o desvio padrão tem estas características:
1. Cerca de 68% dos dados encontram-se dentro do intervalo de ± 1 desvio
padrão em relação à média.
2. Cerca de 95% dos dados encontram-se dentro do intervalo de ± 2 desvios
padrão em relação à média.
3. Cerca de 99,7% dos dados encontram-se dentro do intervalo de ± 3
desvios padrão em relação à média.
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
DESVIO PADRÃO
MEDIDAS DE VARIABILIDADE
Exemplo 1: Os preços (em dólares) de uma amostra de porta-retratos
digital estão listados a seguir. Determine variância e o desvio padrão
dos porta-retratos.
1.00 1.19 1.31 1.37 1.42 1.52 1.68 1.73
MEDIDAS DE VARIABILIDADE
Exemplo 3: Variância e desvio padrão para as alturas de brotos de
explantes de abacaxi (cm).
MEDIDAS DE VARIABILIDADE
Exemplo 4: Variância e desvio padrão para os dados de um
experimento de competição de híbridos de milho, com respeito ao
rendimento médio, por kg/ha.
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
O desvio padrão é bastante afetado pela magnitude dos
dados, ou seja, ele não é uma medida resistente.
Se quisermos comparar a variabilidade de dois conjuntos de
dados podemos usar o coeficiente de variação, que é definido
como a razão entre o desvio padrão 𝑆 e a média amostral.
O cálculo do CV é obtido usando a seguinte expressão:
Populacional: 𝐶𝑉 = ∗ 100. Amostral: 𝐶𝑉 = ∗ 100.
Útil na comparação de procedimentos, grupos ou
procedimentos, em que as médias são diferentes.
MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
Classificação:
baixo;
médio;
alto;
muito alto.
Estatística I Profa. Fádua Ferreira
MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
Exemplo 1: Calcule o coeficiente de variação para avaliar a magnitude
do desvio padrão do rendimento médio (kg/ha) de Competições de
híbridos de milho.
𝐶𝑉 = 24,92 e 𝐶𝑉 = 11,63.
Note que, o rendimento médio
para o grão do tipo semidentado,
apresentou menor variabilidade.
Note que o 𝐶𝑉 mede a variação de um
conjunto de dados em relação à média.
Ambos tipos de grão apresentaram
um CV médio.
MEDIDAS DE VARIABILIDADE
COEFICIENTE DE VARIAÇÃO (CV)
Exemplo 2: Calcule o coeficiente de variação para avaliar a magnitude
do desvio padrão do número de ciclos, em dia, de competições de
híbridos de milho.
Estatística I Profa. Fádua Ferreira
PRÓXIMA AULA:
MEDIDAS DE RESUMO PARA
DADOS AGRUPADOS