Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA I
Curso Técnico em Contabilidade
Profº Sandro Giovani P. Viégas
ATUALIZADO EM 27/02/11
ÍNDICE
2. REPRESENTAÇÃO TABULAR
2.1. Representação Esquemática
2.2. Elementos de uma tabela
2.3. Séries Estatísticas
2.4. Distribuição de Frequência
3. REPRESENTAÇÃO GRÁFICA
3.1. Gráficos de Linhas
3.2. Gráficos de Colunas
3.3. Gráficos Circulares ou de Setores
3.4. Gráfico Pictorial – Pictograma
3.5. Gráfico Polar
3.6. Cartograma
3.7. Gráficos utilizados para análise de uma Distribuição de Frequência
1 Conceitos Bá sicos
• Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma irá depender
do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor do que 5% ela é
considerada infinita, se a freqüência relativa for maior do 5% ela é considerada finita.
• Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente
as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos
utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variáveis podem ser
classificadas dos seguintes modos:
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
- Qualitativas (ou atributos): São características de uma população que não pode ser
medidas.
Discretas: são aquelas variáveis que pode assumir somente valores inteiros num
conjunto de valores. É gerada pelo processo de contagem, como o número de
veículos que passa em um posto de gasolina, o número de estudantes nesta sala de aula.
Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo
de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o
volume de água em um reservatório ou o peso de um pacote de cereal.
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
Título
Cabeçalho
Corpo
Rodapé
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
Anos Produção
1976 9 702
1977 9 332
1978 9 304
1979 9 608
1980 10 562
Fonte: Conjuntura Econômica (fev. 1983)
Região População
Norte 3 037
Nordeste 17 568
Sudeste 42 810
Sul 11 878
Centro-Oeste 5 115
Total 80 408
Fonte: Anuário Estatístico (1984)
Localização População
Urbana 80 408
Rural 38 566
Total 118 974
Fonte: Anuário Estatístico (1984)
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
• Série Mista ou Composta: A combinação entre duas ou mais séries constituem novas
séries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da
série mista surge de acordo com a combinação de pelo menos dois elementos.
REGIÕES
Anos N NE SE S CO
1940 406 3 381 7 232 1 591 271
1950 581 4 745 10 721 2 313 424
1960 958 7 517 17 461 4 361 1 007
1970 1 624 11 753 28 965 7 303 2 437
1980 3 037 17 567 42 810 11 878 5 115
Fonte: Anuário Estatístico (1984)
Xi fi
6.3 2
8.4 3
5.3 2
9.5 3
6.5 5
Σ 15
Fonte: Departamento de Estatística (1990)
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
Altura (cm) Xi fi
150 |--- 158 154 18
158 |--- 166 162 25
166 |--- 174 170 20
174 |--- 182 178 52
182 |--- 190 186 30
190 |--- 198 194 15
Σ ---- 160
Fonte: Departamento de Estatística (1990)
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
• A amplitude do intervalo de classe deve ser constante em todo a distribuição de freqüências intervalar.
Ø Amplitude total (H): É a diferença entre o limite superior da última classe e o limite
inferior da 1ª classe, ou a diferença entre último e o primeiro elemento de um conjunto de
dados postos em ordem crescente.
H = Ls − Li
Ø Ponto médio de classe (X i): É a média aritmética simples do limite inferior com o limite
superior de uma mesma classe.
li + ls
Xi =
2
• Quando substituirmos os intervalos de classes pelos pontos médios (Xi), ter-se´-á uma distribuição de
freqüência pontual.
∑
n
Obs.: fr =1
fr = fi
∑f
n
i=1
i
i=1
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém
menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende da
variável em questão
10500
10000
Produção
9500
9000
8500
1976 1977 1978 1979 1980
Anos
20000 S
CO
15000
10000
5000
0
1940 1950 1960 1970 1980
Fonte: Anuário Estatístico (1984)
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
50000 42810
40000
30000
Pop. 17568
20000 11878
3037 5115
10000
0
N NE SE S CO
Regiões
• As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão, desde que seja
conveniente e desde que não se superponham. O número no topo de cada barra pode ou não omitido, se
forem conservados, a escala vertical pode ser omitida.
45000
40000
35000 N
30000 NE
25000 SE
20000 S
15000
CO
10000
5000
0
1940 1950 1960 1970 1980
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
100000
80000 CO
S
60000 SE
40000 N
NE
20000
0
1940 1950 1960 1970 1980
As regras usadas para o gráfico de barras são igua is as usadas para o gráfico de colunas.
CO 5115
S 11878
Regiões SE 42810
NE 17568
N 3037
• Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas.
10
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
Características:
- A área do gráfico equivale à totalidade de casos (360o = 100%);
- Cada “fatia” representa a percentagem de cada categoria
32%
Urbana
Rural
68%
Tem por objetivo despertar a atenção do público em geral, muito desses gráficos
apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados.
1500
1250
1000
750
500
250
0
1968 1974 1980 1986 1990 1994
11
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
3.631.647
1987
2.473.581
1985
1.277.107
1983
9.645
1979
Pinus
6,8%
Eucalipto
Madeira 24,4%
nativa
68,8%
12
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a série
que apresenta uma determinada periodicidade.
4) Traça -se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;
Média = 237,31 mm
13
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
3.6 Cartograma
Exemplo:
População da Região Sul do Brasil – 1990 Densidade populacional da Região Sul do Brasil – 1990
Fonte: IBGE
Fonte: IBGE
14
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
3.7.1 Histograma
15
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
3.6.3 Ogivas
Características:
- Cada barra representa a freqüência do intervalo respectivo;
- Os intervalos devem ter a mesma amplitude;
- As barras devem estar todas juntas.
16
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
17
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
Freqüência Freqüência
60 60
50 50
40 40
30 30
20 20
10 10
0 0
18
http://professorviegas.blogspot.com
Profº Sandro Viégas - Estatística I
3.7.7 Curvas em forma de sino
a) Curva simétrica
Esta curva caracteriza-se por apresentar o valor máximo no ponto central e os pontos
eqüidistantes desse ponto terem a mesma freqüência.
b) Curvas assimétricas
19
http://professorviegas.blogspot.com
Coeficiente de Correlação
Até o momento estudamos apenas uma única variável. No entanto, algumas vezes o
pesquisador está interessado em analisar a relação entre duas variáveis. Por exemplo, qual a
relação entre o preço dos alimentos e a oferta; entre a altura das pessoas e o peso. A maneira
mais simples de iniciar este estudo é através do diagrama de dispersão. Neste gráfico, cada
eixo representa uma das variáveis em estudo.
85
80
Peso (kg)
75
70
65
60
1,6 1,65 1,7 1,75 1,8 1,85
Altura (m)
20
O diagrama de dispersão também pode apresentar uma relação negativa entre as
variáveis, ou seja, à medida que uma variável aumenta a outra variável diminui. Na figura 4(a)
as variáveis apresentam uma correlação perfeita, na figura 4(b) uma correlação forte e na
figura 4(c) uma correlação fraca.
Quando as duas variáveis não possuem relação o gráfico de dispersão apresenta uma
nuvem aleatória de pontos.
O grau de associação linear entre duas variáveis pode ser medido através do
coeficiente de correlação de Pearson, que é dado por:
n ∑xy − ( ∑x ). ( ∑y )
r=
[ n∑x − ( ∑x ) ].[n∑y − ( ∑y ) ]
2 2 2 2
O valor de r, que sempre pertencerá ao intervalo [-1, 1], representa uma medida de
intensidade do inter-relacionamento entre duas variáveis. Se r = 1, há uma perfeita correlação
positiva entre as variáveis, isto é, se os valores de uma variável aumentam (ou diminuem), em
correspondência os valores da outra variável também aumentam (ou diminuem) na mesma
proporção. Se, por outro lado, r = -1, há uma perfeita correlação negativa entre as variáveis, ou
seja, os valores de uma variável variam em proporção inversa aos valores de outra variável.
Se, entretanto, r = 0, não há correlação entre as variáveis.
21
Exemplo 1: Calcule o coeficiente de correlação entre as variáveis altura e peso de oito
pessoas.
Altura (m) Peso (kg)
1,7 74
1,65 66
1,62 61
1,73 74
1,78 82
1,67 67
1,8 83
1,77 79
22