Você está na página 1de 24

Instituto Superior Politécnico Independente

ESTATÍSTICA II

UNIDADE I – Introdução à Análise Exploratória de Dados.


Conceitos de Estatística.

I.0 – Introdução

A palavra Estatística tem dois significados. O primeiro e mais


comum, refere – se a factos numéricos e está ligado à origem
latina da palavra status (estado). Exemplo: O número de acidentes
de trabalho por dia em Angola; O salário médio mensal de um
trabalhador; A percentagem de estudante do 1 Ano que reprovaram
num dado ano; O número de cursos de ensino superior em uma
universidade; A percentagem de grandes penalidades convertidas
nos jogos do gira bola de 2019. Os números que usamos para
caracterizar certas situações ou comportamentos são estatísticos

O segundo significado refere – se à área científica estatística .


Logo, a Estatística é uma área científica que tem como objectivo de
observar um fenómeno, recolher, analisar e interpretar os dados e
auxiliar a formulação de decisões.

Muitos dos problemas que pretendemos resolver na nossa vida


diária, têm uma natureza incerta, em que não conseguimos definir
completamente uma relação de causa – efeito entre as variáveis
que julgamos condicionantes e os resultados, e, por isso atribuímos
importância decisiva ao factor sorte – azar.

Os métodos estatísticos ajudam – nos a resolver estes problemas,


proporcionando – nos, os métodos matemáticos que nos permitam
prever os resultados.

Há situações em que se usa a Estatística para analisar o impacto


económico de muitas decisões. Por exemplo: é frequente as

1
empresas efectuarem sondagens para estimar o efeito de uma
campanha publicitaria ou para conhecerem as preferências dos
consumidores antes de desenvolverem e lançarem um novo
produto para o mercado.

A grosso modo, podemos dizer que a Estatística divide – se em três


grandes ramos (áreas): Estatística Descritiva; Probabilidade e
Estatística Inferencial.

Estatística Descritiva, É um conjunto de métodos com o objectivo


de sintetizar e representar de forma compreensível a informação
contida nos dados.

Para sintetizar e representar as informações usam – se


frequentemente medidas, tabelas e gráficos.

Probabilidade, pode ser pensada como a teoria matemática


utilizada para se estudar a incerteza oriunda de fenómenos de
carácter aleatórios.

Estatística Inferencial ou Inferencia Estatística, É um conjunto


de métodos que permitem fazer estimativas e tirar conclusões sobre
uma população a partir da informação contida numa amostra.

Estudos complexos que envolvem o tratamento estatístico dos


dados, usualmente, incluem as três áreas a cima mencionadas. Na
terminologia estatística, o grande conjunto de todos elementos,
objectos ou pessoas cujas características pretende – se estudar,
recebe o nome de população. Exemplo: Os alunos de uma escola;
O conjunto de pessoas que fumam no Lubango ou ainda todo o
sangue no corpo de uma pessoa.

Algumas vezes podemos a cessar toda a população para


estudarmos características de interesse, mas, em muitas situações
tal procedimento não pode ser realizado. Existem casos em que a
impossibilidade de se a cessar toda a população de interesse é
incontornável. Na análise do sangue de uma pessoa, ou em um
experimento para determinar o tempo de funcionamento das
lâmpadas produzidas por uma indústria, não podemos observar
toda população de interesse.

2
Tendo em conta as dificuldades de várias naturezas para se
observar todos elementos da população, tomaremos alguns deles
para formar um grupo a ser estudado. Estes elementos ou
subgrupos tomados da população, em geral com dimensões
sensivelmente menores, é denominado amostra.

Exercícios.

Para cada situação descrita a seguir, identifica a população e a


amostra.

a) Pretende – se estimar o rendimento médio das famílias


angolanas.

b) Pretende – se estimar a percentagem de votantes num candidato


ou partido.

c) Uma amostra de sangue foi retirada de um paciente com suspeita


de anemia.

d) Para avaliar a eficácia de uma campanha de vacinação na


Cidade do Lubango, 200 mães de recém - nascidos, durante o
primeiro semestre de um dado ano e em uma dada maternidade do
Lubango, foram entrevistadas a respeito da última vez em que
vacinaram seus filhos.

I.1 – Organização dos dados.

Nesta secção, discutiremos alguns procedimentos que podem ser


utilizados para organizar e descrever um conjunto de dados, seja de
uma população ou de uma amostra.

A grande questão é: dado um conjunto de dados, como tratar os


valores numéricos ou não, afim de se extrair informações a respeito
de uma ou mais características de interesse? Basicamente, faremos
o uso de tabelas de frequências e gráficos, notando que tais
procedimentos devem levar em conta a natureza dos dados.

Suponha, por exemplo, um questionário pedindo aos alunos as


seguintes informações: identidade, idade, raça, altura, sexo, fuma,
filhos.

3
O conjunto de informações cedidas pelos alunos, após a tabulação
do questionário, é denominada tabela de dados brutos e contem
os dados da maneira que foram colectados inicialmente. Cada uma
das características perguntadas aos alunos, tais como o peso, a
idade, a altura e entre outras, é denominada de variável. Logo,
entende – se por variável como sendo uma característica da
população que pode tomar vários valores possíveis. Por exemplo a
variável altura assume valores em metros (1,65; 2,12;….) e a
variável sexo assume valores como masculino (M) e feminino (F).
Claramente estas variáveis têm naturezas diferentes no que tange
os possíveis valores que possam assumir. Tal facto deve ser levado
em conta nas análises.

Para fixarmos ideias, as variáveis dividem – se em dois grandes


grupos ou tipos: 1. Variáveis Numéricas ou Quantitativas e as 2.
Variáveis não Numéricas ou Qualitativas.

1.Uma Variável é Qualitativa quando os possíveis valores que


assume representam atributos e/ou qualidade. Ainda, dizer que
variável qualitativa é uma característica não numerável da
população. Por exemplo: a marca de um automóvel, a beleza, fuma
(sim ou não), tamanho (grande, médio ou pequeno), turma, classe
social (baixa, média ou alta) a cor, o sexo,….etc.

Estas variáveis ainda dividem – se em ordinais e nominais.

1.1. Uma variável é qualitativa ordinal quando tem uma


ordenação natural, indicando intensidades crescentes de
realização. São exemplo delas: tamanho (grande, médio ou
pequeno), classe social (baixa, média ou alta)

1.2. Uma variável é qualitativa nominal, quando não é possível


estabelecer uma ordem natural entre seus valores. És alguns dos
exemplos: a marca de um automóvel, a beleza, fuma? (sim ou não),
turma, a cor, o sexo.

2. Uma Variável é dita Quantitativa ou numerável se é de


natureza numérica ou seja é uma característica numerável da
população. Exemplo: O dinheiro do Eduardo, o número diário de

4
acidente de viação no Lubango, a altura, o peso, a temperatura, o
número de irmãos, o número de defeitos,….etc.

Quanto ao tamanho, as variáveis quantitativas subdividem – se em


discretas e contínuas.

2.1. Variável quantitativa discreta, é aquela resultante de


contagens, assumindo assim, em geral, valores inteiros. És alguns
dos exemplos: O dinheiro do Eduardo, o número diário de acidente
de viação no Lubango, o número de irmãos, o número de defeitos…

2.2. Variável quantitativa contínua, é aquela que toma valores


num intervalo real e, geralmente são provenientes de uma
mensuração. Exemplo: a altura, o peso, a temperatura,.....etc.

Exercícios.

Faça a classificação das seguintes variáveis:

a) O tamanho ( número de pessoas) de uma família;

b) O estado civil do André;

c) A cor dos olhos da Djamila;

d) O número de automóveis de um empresário;

e) O comprimento das orelhas de um cão;

f) A temperatura mínima diária;

I.2 – Classificação dos dados

Quando se realiza uma experiencia estatística, as observações são


registadas, eventualmente, pela ordem em que são efectuadas,
sem qualquer outro tipo de preocupação. Obtendo – se assim os
dados brutos ou originais.

Dados brutos ou originais, são conjuntos de dados na sequência


em que foram registados antes de terem sidos organizados ou
tratados.

5
Estes dados brutos ( experimentais) são observações de variáveis
qualitativas ou quantitativas e, portanto, classificam – se como
dados quantitativos ou dados qualitativos.

Dados qualitativos, são obtidos através da observação de uma


característica não numerável. Estes podem ser dispostos numa
distribuição de frequência.

Por exemplo: Realizou –se um inquérito a habitantes de uma


cidade para analisar a sua preferência em termos de ocupação do
tempo livre. Verificou – se que pessoas preferiam ler, pessoas
ver televisão ou cinema, praticar exercícios físicos e outras
actividades. Elabora uma tabela com os dados organizados por
categorias ( distribuição de frequência ).

Solução:
Tipo de preferência Nº de habitantes Frequência relativa
(frequência absoluta)
Leitura

TV ou cinema
Exercícios físicos
Outras actividades
Total

A tabela apresenta os dados organizados. A variável em causa é o


tipo de preferência na ocupação do tempo livre, que é uma
variável qualitativa nominal. As categorias ou classes estão listadas
na primeira coluna e são exaustivas e mutuamente exclusivas (
cada um dos habitantes pertence a uma só categoria).

O número e a proporção de habitantes que pertencem a mesma


classe ou cada categoria, chamam – se respectivamente
frequência absoluta e frequência relativa dessa categoria e por
isso a tabela chama – se distribuição de frequência.

Obs: Categoria ou classe, é cada um dos valores que a variável


pode tomar.

6
Entende – se por frequência absoluta de uma categoria
( ) ou ( ) ao número de observações associadas a essa
categoria.

Verifica – se que ∑ ou
seja , onde denominaremos:

, como o número total de observações, tamanho ou


volume da amostra;
, como o número de categorias ou classes.
Chama – se frequência relativa da categoria ( ), ao
quociente entre a frequência absoluta dessa categoria e o numero

total de observações, isto é:

Nota: é comum exprimir a frequência relativa em percentagem,


para tal basta multiplica – lá por . No entanto verifica – se
que: ∑
Pode – se representar graficamente esta distribuição de frequência
a partir do gráfico de barras, gráficos circulares e outros.

Gráfico de barras, marcam – se as categorias no eixo horizontal e


as frequências no eixo vertical, a largura das barras deve ser igual
para todos e a altura é proporcional a frequência.

Do exemplo anterior, temos a seguinte representação gráfica:

25

20

15

10 Série1

0
Leitura
7
TV ou cinema Exercícios físicos Outras
actividades
Dados quantitativos discretos, são obtidos através das
observações de variáveis quantitativas discretas.

Exemplo: Realizou –se um inquérito a habitantes na cidade do


Lubango para se estudar o tamanho dos agregados familiares.
Verificou – se que agregados era constituídos por pessoa,
por , por , por , por e por .

Elabora a referida distribuição de frequência.

Solução:
Número de pessoas no Número de agregado Frequência Frequência acumulada
agregado (frequência Absolut - ) relativa ( ) absoluta

Total

A variável em causa é o número de agregado familiar e é


quantitativa discreta. Cada classe ou categoria tem um
número/valor característico que a identifica, cuja representação
gráfica é:

16
14
12
10
8 Série1
6 Série2
4
2
0
1 2 3
84 5 6
Obs: o gráfico em causa é o de cor pintado de vermelho (série 2).

Defini –se frequência acumulada absoluta ( ) ao número de


observações de valores inferiores ou igual ao valor característico da
classe . Esta frequência obtem – se pela soma das frequências absolutas de
todos valores da variável, menor ou igual ao valor considerado. Sua utilidade
principal é ajudar a estabelecer pontos de cortes com uma determinada
frequência nos valores das variáveis. Isto é : ∑ .
Exemplo: quantos agregados têm menos de quatro ( ) pessoas no
exemplo anterior?

Defini –se frequência acumulada relativa até a classe ( ) ao


quociente entre a frequência acumulada absoluta até a classe e o
número total de observações efectuadas Isto é :

Dados quantitativos contínuos, são dados obtidos através das


observações de uma variável numérica contínua de uma população.
Pode – se mostrar o exemplo a partir da representação da seguinte
distribuição de frequência: Um departamento do ministério de
pesca, realizou recentemente um inquérito a pescadores de uma
vila piscatória, para conhecer melhor a sua distribuição etária.
Classificou os pescadores em intervalos de anos e contaram
pescador na classe etária de a menos de anos, de a
menos de anos, de a menos de anos, de a menos
de anos, de a menos de anos, de a menos de
anos, e finalmente pescador de a menos de anos.

Mediante o problema temos a seguinte distribuição de frequência:

9
Classe etária Freq Abs ( n de Frequência Freq Acom Abs Freq Acom
pescadores ) Relativa ( ) ( ) Relat ( )
a menos de
a menos de 10
a menos de
a menos de
a menos de
a menos de
a menos de

Total

A variável em causa é a idade, que é do tipo quantitativa continua.

Obs: Para o estudo das variáveis do tipo quantitativa continua, é


fundamental realçar os seguintes aspectos:

Classe de uma variável quantitativa continua; é um intervalo do


tipo , , - - que representa um conjunto de valores que a
variável pode tomar. Onde são os limites inferiores e
superiores do intervalo respectivamente.

Amplitude da classe , , - -; é a distância ou o


comprimento desta classe, ou seja , é a distância do limite inferior
pelo limite superior. Isto é:

Centro, marca, ou valor característico; é o ponto médio da classe


e defini – se por:

Obs(2): Quando se elabora uma distribuição de frequência a que se


definir o número de classes, a amplitude da classe e o limite inferior
da primeira classe.

Número de classes; é usual escolher um número entre e ,


dependente do número de observações. Para efeito pode – ser
recorrer a regra de STURGES, onde , - em
que: indica o número de classes, o número total de observações
e a parte inteira do número.

10
Pode – se ainda recorrer a fórmula da raiz quadrada, isto é

[√ ]

No exemplo anterior, STURGES sugere clases, enquanto que a


regra da raiz quadrada sugere , no entanto foi usada classes.

Amplitude da classe; na maioria das situações, é desejável


escolher a mesma amplitude para todas as classes. Para tal:

( )

Esta aproximação deve ser arredondada para um número


conveniente, o que pode fazer variar o número de classes
inicialmente determinado.

Limite inferior da primeira classe; é qualquer número conveniente


que seja inferior ou igual a menor das observações.

Representação gráfica da distribuição etária dos pescadores

Algoritmo para a construção de uma distribuição de frequência

 Observar e recolher os dados;


 Organizar os dados;
 Determinar os valores máximo e mínimo do conjunto ou
observações;
 Determinar o número de classe;
 Estimar a amplitude da classe e decidir o seu valor;
 Determinar os limites das classes;
 Construir a distribuição de frequência;
 Representar graficamente a distribuição.

Exercícios: Numa escala percentual de , registaram –se


classificações de estudantes de um curso de Estatística.
Organiza os dados numa tabela de frequência mostrando o referido
gráfico. És a tabela de classificações a baixo:
43 56 49 80 71 66 73 65 74 49
52 57 33 79 50 61 74 53 76 51
57 32 59 56 45 87 36 69 73 53
53 44 43 59 78 65 55 77 55 44

11
41 47 49 58 64 61 52 35 60 27

2. Estatística Amostrais – Medidas Descritivas

Apresenta – se neste capítulo um conjunto de métodos para


analisar, classificar e mostrar distribuições de frequências. Estas
medidas amostrais dividem – se em: medida de posição ou
localização, medidas de variabilidade ou de dispersão e
concentração e medidas de assimetria e achatamento.

2.1- Medidas de Posição ou localização.

a) Média Aritmética ou Média Amostral

É a medida de localização central mais comum para um conjunto de


dados, é obtida, dividindo a soma de todos os valores numéricos
observados pelo número de observações, isto é:

̅ ∑ ou seja ̅

Exemplo, considera a amostra * + , calcula a média


amostral.

Solução: ̅

Para a obtenção da média amostral ou aritmética para dados


classificados/agrupados com suas respectivas frequências

absolutas ( ) teremos: ̅ , onde:

indica a classe, a frequência absoluta e o ponto médio da classe.

Exemplo, considera a seguinte distribuição de frequência ( tabela ). Calcula a média aritmética.

Intervalos Número de observações

2 _______4 5

4________6 10

12
6_________8 12

8________10 10

10________12 5

12 _______14 5

b) Mediana´

É uma medida de localização que dividi ao meio ou em duas partes


iguais o conjunto de valores observados. Dado um conjunto de
valores , a mediana é calculada pelas
. / . /
formulas ̃ para par e ̃ . /
para impar.

Obs: o calculo da mediana pressupõe a ordenação prévia dos


dados.

Exemplo, considera as observações a baixo e em cada caso calcula


a mediana.

a) * + b) * +

̃ . / . /
* +

. / . / . / . /
̃ ( ) ̃

( ) ( )
̃

Exemplo(2), calcular a mediana para a seguinte distribuição:

13
R: n é impar, logo a mediana será encontrada
por ̃ . / ( ) , vamos na coluna da

encontrar em que linha estará o sexto elemento, nesta mesma


linha encontraremos finalmente a mediana procurada que
corresponde com o valor de , no caso é , logo ̃
Cálculo da mediana para dados contínuos classificados

Quando a variável em causa é contínua e os dados estão


classificados, define – se a mediana pela relação:

. ∑ /
̃ ( ) , em que:

, é o limite inferior da classe da mediana;

, é o limite superior da classe da mediana;

, é a frequência absoluta da classe da mediana;

∑ , é a frequência acumulada absoluta anterior à classe da


mediana;

, é o tamanho, volume da amostra ou o número total de


elementos.

Exemplo, dada a distribuição amostral, calcula a mdiana.

Classes

14
1ºpasso: encontrar ;

2º passo: identificar a classe Md pela

3º passo: substituir os dados na fórmula

. ∑ /
̃ ( )

. /
̃ ( )

Exercício, Um departamento do ministério de pesca, realizou


recentemente um inquérito a pescadores de uma vila piscatória,
para conhecer melhor a sua distribuição etária. Classificou os
pescadores em intervalos de anos e contaram pescador na
classe etária de a menos de anos, de a menos de
anos, de a menos de anos, de a menos de anos,
de a menos de anos, de a menos de anos, e
finalmente pescador de a menos de anos.Calcula a
mediana desta distribuição.

c) Quartis.

Os quartis dividem um conjunto de dados em quatro partes iguais.


Onde o primeiro quartil corresponde à dos dados ( ),
o segundo quartil à dados e a mediana, isto é ( ̃
) e o terceiro quartil corresponde à dos dados ( ).

Eis as formulas para o cálculo do primeiro ( ) e terceiro ( )


quartis, isto para dados de variáveis contínuas.

Determinação do primeiro quartil ( );

1º passo: encontrar a ordem .

15
2º passo: identificar pela frequência acumulada absoluta

3º passo: aplicar a fórmula

. ∑ /
( )

Determinação do terceiro quartil ( );

1º passo: encontrar a ordem .

2º passo: identificar pela frequência acumulada absoluta

3º passo: aplicar a fórmula

. ∑ /
( )

Exercício, dada a distribuição de frequência a baixo, determina o


primeiro e terceiro quartis.

Classes
( )
( )
( )
( )
( )

d) Decis.

Os decis, são os valores que dividem um conjunto de dados em dez


partes iguais.

O cálculo para o decil ( ), é definido por:

1º passo: encontrar a ordem , em que

16
2º passo: identificar a classe pela frequência acumulada
absoluta

3º passo: aplicar a fórmula

. ∑ /
( )

e) Percentis.

Os percentis, são medidas que dividem a série em cem ( ) partes


iguais.

O cálculo para o percentis ( ), é definido por:

1º passo: encontrar a ordem , em que

2º passo: identificar a classe pela frequência acumulada


absoluta

3º passo: aplicar a fórmula

. ∑ /
( )

f) Moda.

Dentre as principais medidas de posição, destaca – se a moda. A


moda é o valor mais comum de um conjunto de observações. Pode
não existir conjunto modal e se existir pode não ser o único. Se o
polígono de frequência tiver um só pico, a distribuição diz – se
unimodal; se tiver vários picos, diz – se multimodal.

Logo, a moda, é o valor que ocorre com maior frequência num


conjunto de observações.

Numa classe de frequência, com intervalos de classes de igual


amplitude, a classe modal é a classe com maior frequência.

17
Exemplo, considera os seguintes dados da amostra a baixo e
determina a moda. * +

R: Ordenando teremos, * + , ve – se que não há


repetições de dados, portanto não existe moda.

Exemplo 2, dada a série a baixo, determina a moda.

R: ve – se que a maior frequência é


, logo a moda desta série é
.

Para dados agrupados em classes ( variáveis contínuas ), há


diversas fórmulas para o calculo da moda. Destacaremos o cálculo
da moda pela por meio da fórmula de CZUBER, que consiste em :

1. Identificar a classe modal ( classe com maior frequência );

2. Aplicação da fórmula ( ). Onde:

, é a diferença entre a frequência absoluta da classe modal e a


frequência absoluta da classe imediatamente anterior;

, é a diferença entre a frequência absoluta da classe modal e a


frequência absoluta da classe imediatamente posterior.

Exemplo, determina a moda da seguinte distribuição de frequência:

R: A classe da moda é a terceira ( 3ª) classe

( ) ( )

Exercícios.

18
1. Determina a moda da distribuição do tamanho dos agregados
familiares (exemplo anterior).

2. Determina a moda da distribuição etária dos pescadores da vila


piscatória.

2.2 - Medidas de variabilidade ou dispersão

As medidas de localização central não nos dão informações


suficientes sobre um conjunto de dados. Precisa – se no entanto de
outras medidas que nos ajudam a visualizar as distribuições de
frequências com mais precisam. Estas são as medidas de
variabilidade ou de dispersão, que são medidas estatísticas
utilizadas para avaliar o grau de variabilidade, ou dispersão, dos
valores em torno da média. Servem para medir a representatividade
da média.

Exemplo, sejam as séries * +e * +

Tem – se: ̅ e ̅

Observe que: apesar de as séries terem médias iguais, a série


não apresenta dispersão em torno da média; enquanto, os valores
da série apresentam dispersão em torno da média. Nesta secção,
serão apresentadas medidas estatísticas que avaliam o grau de
dispersão, ou de variabilidade, de uma variável.

a) Amplitude total

É uma medida de dispersão dada pela diferença entre o maior e o


menor valor da série.

Exemplo, considera a série * +, teremos:

A utilização da amplitude total como medida de dispersão é


limitada, pois, sendo uma medida que depende apenas dos valores
extremos, não capta possíveis variações entre estes limites.

19
b) Variância amostral.

Como se deseja medir a dispersão dos dados em relação à média,


é interessante analisar os desvios de cada valor ( ) em relação à
média ̅ , isto é: ̅ . Se os forem baixos, teremos pouca
dispersão; se os forem altos, teremos elevadas dispersões.

Para o cálculo da variância, consideremos os quadrados dos


desvios .

A variância de uma amostra de medidas, é igual à soma dos


quadrados dos desvios ∑ , dividida por ( ), assim:

∑( ̅)

( ) ( )

Para dados agrupados ou classificados, a variância é definida por:

∑( ̅)

( ) ( )

Quanto maior for o valor de ( variância ), maior a dispersão dos


dados amostrais ao redor da média.

c) Desvio padrão.

A par da variância temos o desvio padrão, que indica a proximidade


com que os valores estão agrupados à volta da média. Um valor
pequeno do desvio, significa que as observações estão pouco
espalhadas da média.

O desvio padrão ( ), é a raiz quadrada positiva da variância, isto é:

Exemplo, calcula a variância e o desvio padrão da seguinte


amostra: * +.

Solução: ̅

20
∑( ̅)
( )

( ) ( ) ( ) ( ) ( )

O desvio padrão será: √ √

Exercício.

Considera a distribuição etária dos pescadores do exemplo anterior,


calcula a variância amostral e o desvio padrão.

d) Coeficiente de variação.

Trata-se de uma medida relativa de dispersão. Enquanto que a


amplitude total, a variância e o desvio padrão são medidas
absolutas de dispersão, o coeficiente de variação mede a dispersão
relativa.

As medidas de variabilidades absolutas dependem das unidades


das observações. Por exemplo, se as observações estão escritas
em metros, o desvio padrão e a variância serão expressas em
metros e em metros quadrados respectivamente.

Para comparar variabilidades de distribuição de frequências


diferentes, usam – se medidas de variabilidade relativas, que são
quantidades adimensionais (sem medidas), baseadas numa medida
de variabilidade ( o desvio padrão) e noutra de localização (a
média).

A medida mais usada para a variabilidade relativa é o coeficiente de


variação, que frequentemente exprimi – se em percentagem. Isto é:

Eis algumas regras para a interpretação do coeficiente de variação:

21
 Se o , há baixa dispersão ao redor da média;
 Se o , há média dispersão;
 Se o , há elevada dispersão.

Exemplo, em uma empresa, o salário médio dos homens é


, com desvio padrão de , e o salário médio das
mulheres é , com um desvio padrão de . A
dispersão relativa dos salários é maior em que género?

Solução:

Homens, ̅ e

Mulheres, ̅ e

Para os homens: ̅

Para as mulheres: ̅

Logo, os salários das mulheres têm dispersão relativa maior que os


salários dos homens. As duas distribuições apresentam elevadas
dispersões, pois .

Exercício: uma companhia de transporte de carga, pretende


comparar a variabilidade do peso com a variabilidade do volume
das caixas que transporta habitualmente. Sabendo que as caixas
têm as características definidas na tabela.

Média Desvio padrão


Peso ( )
Volume ( )
Efectua a comparação.

2.3 - Medidas de assimetria e de curtose ou achatamento.

Denomina – se assimetria, o grau de afastamento de uma


distribuição, da unidade de simetria. Em uma distribuição simétrica,
há igualdade de valores da média, da mediana e da moda. Isto é:

22
̅ ̃

Para o estudo das medidas de assimetria e de curtuse, é


necessário entender os conceito de momentos ( momento amostral
simples e o momento amostral centrado).

Momento amostra simples de ordem , é a média dos valores


observados elevada a potência . Em que é um inteiro não
negativo. Este momento é definido por: ∑ , onde é
o valor das observações e é o volume da amostra.

O momento amostral simples para dados classificados ou


agrupados é dado por: ∑ , em que é a frequência
absoluta de cada classe.

Nota: O momento amostral simples de ordem zero ( ), é igua à


unidade, ou seja:

Momento amostral centrado de ordem , é a média dos desvios


em relação a ̅ , elevados a potência de ordem . Isto é:

∑( ̅)

O momento amostral centrado de ordem para dados classificados


ou agrupados é definido por:

∑ ( ̅)

Nota 2: A média amostral é igual ao momento amostral simples de


ordem (um).

Nota 3: A variância amostral é aproximadamente igual ao momento


amostral centrado de ordem . Pelo que ,
( ) ( )-.

Definição: Chama – se coeficiente de assimetria, o quociente do


momento centrado de ordem ( três), pelo desvio padrão de
mesma ordem, isto é:

23
Definição 2: Chama – se coeficiente de curtose ou achatamento, o
quociente do momento centrado de ordem ( quatro), pelo desvio
padrão de mesma ordem, isto é:

Exercícios: O conjunto de dados


* +, é uma amostra
que representa as classificações percentuais de estudantes num
teste de Estatística. Determina a média, mediana, moda, a
variância, o desvio padrão, o coeficiente de assimetria e o de
curtose e representa graficamente.

Exercício 2: Um pesquisador científico aborda moradores de um


bairro ao acaso, pergunta – lhes as idades e o resultado são os
obtidos na tabela a baixo. Determina a mediana, o terceiro quartil, o
quinto decil, o quadragésimo sexto percentil, o coeficiente de
variação, o coeficiente de curtose. Representa o histograma da
referida distribuição.

24

Você também pode gostar