Você está na página 1de 24

ESTATÍSTICA 1º SEMESTRE Profº Sandro Viégas

ESTATÍSTICA – 1º SEMESTRE – Profº Sandro Viégas ESTATÍSTICA I Curso Técnico em Contabilidade Profº Sandro

ESTATÍSTICA I

Curso Técnico em Contabilidade

Profº Sandro Giovani P. Viégas

Técnico em Contabilidade Profº Sandro Giovani P. Viégas ATUALIZADO EM 27/02/11 BLOG:

ATUALIZADO EM 27/02/11

BLOG: http://professorviegas.blogspot.com E-mail: profviegas@gmail.com

ESTATÍSTICA I 1º SEMESTRE Profº Sandro Viégas

ESTATÍSTICA I – 1º SEMESTRE – Profº Sandro Viégas ÍNDICE 1. CONCEITOS BÁSICOS DA ESTATÍSTICA 1.1.

ÍNDICE

1.

CONCEITOS BÁSICOS DA ESTATÍSTICA

1.1.

População x Amostra

1.2.

Censo x Amostragem

1.3.

Dado x Variável

2.

REPRESENTAÇÃO TABULAR

2.1.

Representação Esquemática

2.2.

Elementos de uma tabela

2.3.

Séries Estatísticas

2.4.

Distribuição de Frequência

3.

REPRESENTAÇÃO GRÁFICA

3.1.

Gráficos de Linhas

3.2.

Gráficos de Colunas

3.3.

Gráficos Circulares ou de Setores

3.4.

Gráfico Pictorial Pictograma

3.5.

Gráfico Polar

3.6.

Cartograma

3.7.

Gráficos utilizados para análise de uma Distribuição de Frequência

4.

CORRELAÇÃO LINEAR ENTRE DUAS VARIÁVEIS

BLOG: http://professorviegas.blogspot.com SITE: http://www.professor-viegas.siteonline.com.br

Profº Sandro Viégas - Estatística I

11 CCoonncceeiittooss BBáássiiccooss

o n n c c e e i i t t o o s s B

1.1 População x Amostra

População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo ser finita ou infinita.

Finita - apresenta um número limitado de observações, que é passível de contagem. Infinita - apresenta um número ilimitado de observações que é impossível de contar e geralmente esta associada a processos.

Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta.

ùUma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma irá depender

do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor do que 5% ela é considerada infinita, se a freqüência relativa for maior do 5% ela é considerada finita.

1.2 Censo x Amostragem

Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem.

Censo: É a coleta exaustiva de informações das "N" unidades populacionais.

Amostragem: É o processo de retirada de informações dos "n" elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem).

1.3

Dado x Variável

Dados estatísticos: é qualquer característica que possa ser observada ou medida de alguma maneira. As matérias-primas da estatística são os dados observáveis.

Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos

utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y,

que pode assumir qualquer valor de um conjunto de dados. As variáveis podem ser

Z,

classificadas dos seguintes modos:

1

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

- Qualitativas (ou atributos): São características de uma população que não pode ser medidas.

Nominal : são utilizados símbolos, ou números, para representar determinado tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem. Ordinal ou por postos: quando uma classificação for dividida em categorias ordenadas em graus convencionados, havendo uma relação entre as categorias do tipo “maior do que”, “menor do que”, “igual a”, os dados por postos consistem de valores relativos atribuídos para denotar a ordem de primeiro, segundo, terceiro e, assim, sucessivamente.

- Quantitativas: São características populacionais que podem ser quantificadas, sendo classificadas em discretas e contínuas.

Discretas: são aquelas variáveis que pode assumir somente valores inteiros num conjunto de valores. É gerada pelo processo de contagem, como o número de veículos que passa em um posto de gasolina, o número de estudantes nesta sala de aula. Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o volume de água em um reservatório ou o peso de um pacote de cereal.

2

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

22 RReepprreesseennttaaççããoo ttaabbuullaarr

e e n n t t a a ç ç ã ã o o t t

Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas obedece à Resolução n o 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE).

2.1

Representação esquemática

 
 

Título

Cabeçalho

Corpo

Rodapé

2.2

Elementos de uma tabela

 

Título: O título deve responder as seguintes questões:

 

- O que? (Assunto a ser representado (Fato));

- Onde? (O lugar onde ocorreu o fenômeno (local));

- Quando? (A época em que se verificou o fenômeno (tempo)).

Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que contém uma seqüência horizontal de informações. Colunas: parte do corpo que contém uma seqüência vertical de informações.

Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos pelas colunas numéricas.

Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna.

Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as

notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.

Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral; chamada - esclarecer minúcias em relação a uma célula).

3

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

2.3 Séries Estatísticas

Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, as quais servirão posteriormente para se fazer análises e inferências.

Série Temporal ou Cronológica: É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local.

Produção de Petróleo Bruto no Brasil de 1976 a 1980 (x 1000 m³)

 

Anos

Produção

 

1976

9

702

1977

9

332

1978

9

304

1979

9

608

1980

10 562

 

Fonte: Conjuntura Econômica (fev. 1983)

Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanece constante a época e o fato.

População Urbana do Brasil em 1980 (x 1000)

Região

População

Norte

3

037

Nordeste

17

568

Sudeste

42

810

Sul

11

878

Centro-Oeste

5

115

Total

80

408

Fonte: Anuário Estatístico (1984)

Série Específica ou Qualitativa: É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a época e o local.

População Urbana e Rural do Brasil em 1980 (x 1000)

Localização

População

Urbana

80

408

Rural

38

566

Total

118 974

Fonte: Anuário Estatístico (1984)

4

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

Série Mista ou Composta: A combinação entre duas ou mais séries constituem novas séries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo com a combinação de pelo menos dois elementos.

Local + Época = Série Geográfica Temporal

População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

   

R E G I Õ E S

 

Anos

 

N

NE

SE

 

S

CO

1940

 

406

3

3 81

7 232

1

591

 

271

1950

581

4

745

10

721

2

313

424

1960

958

7

517

17

461

4

361

1

007

1970

1

624

11

753

28

965

7

303

2

437

1980

3

037

17

567

42

810

11 878

5

115

Fonte: Anuário Estatístico (1984)

2.4 Distribuição de Freqüência

É o tipo de série estatística na qual permanece constante o fato, o local e a época. Os dados são colocados em classes preestabelecidas, registrando a freqüência de ocorrência. Uma distribuição de freqüência pode ser classificada em discreta e intervalar.

a) Distribuição de Freqüência Discreta ou Pontual: É uma série de dados agrupados na qual o número de observações está relacionado com um ponto real.

Notas do Aluno "X" na Disciplina de Estatística segundo critérios de avaliação do DE da UFSM – 1990

X i

f

i

6.3

2

8.4

3

5.3

2

9.5

3

6.5

5

S

15

Fonte: Departamento de Estatística (1990)

5

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

b) Distribuição de Freqüências Intervalar: Na distribuição de freqüência, os intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto à classe a que permanece determinado elemento.

O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita, representado pelo símbolo: |---.

Altura em centímetros de 160 alunos do Curso de Administração da UFSM - 1990

Altura (cm)

X

i

f

i

150

|---

158

154

18

158

|---

166

162

25

166

|---

174

170

20

174

|---

182

178

52

182

|---

190

186

30

190

|---

198

194

15

 

S

----

160

Fonte: Departamento de Estatística (1990)

Elementos de uma Distribuição de Freqüências:

ÿ Classe ou Classe de Freqüência (i):

fenômeno.

É cada subintervalo (linha) na qual dividimos o

ÿ Limite de Classe (l i ou L s ): São os valores extremos de cada classe.

l i = limite inferior da i-ésima classe; L s = limite superior da i-ésima classe;

6

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

ÿ Amplitude do intervalo de classe (h): É a diferença entre dois limites inferiores ou superiores consecutivos.

h

= ls - li

ùA amplitude do intervalo de classe deve ser constante em todo a distribuição de freqüências intervalar.

ÿ Amplitude total (H): É a diferença entre o limite superior da última classe e o limite inferior da 1ª classe, ou a diferença entre último e o primeiro elemento de um conjunto de dados postos em ordem crescente.

H = Ls - Li

ÿ Ponto médio de classe (X i ): É a média aritmética simples do limite inferior com o limite superior de uma mesma classe.

X

i

li + ls

=

2

ùQuando substituirmos os intervalos de classes pelos pontos médios (X i ), ter-se´-á uma distribuição de

freqüência pontual.

ÿ Freqüência absoluta (f i ): É a quantidade de valores em cada classe

n =

n

Â

i

1

=

f

i

= f

1

+ f

2

+

+ f

n

ÿ Freqüência Acumulada (f a ):É o somatório da freqüência absoluta da i-ésima classe com a freqüência absoluta das classes anteriores, ou a freqüência acumulada da classe anterior.

f

a

=

n

Â

i

1

=

f

i

=

n

ÿ Freqüência Relativa (fr ): É o quociente entre a freqüência absoluta da i-ésima classe com o somatório das freqüências.

fr

f

i

= n

Â

f

i

i

1

=

Obs.:

n

Â

i 1

=

fr

1

=

ÿ Freqüência Relativa Acumulada (fr a ):É o somatório da freqüência relativa da i-ésima classe com as freqüências relativas das classes anteriores.

fr

a =

n

Â

i = 1

7

fr

1

=

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

33 RReepprreesseennttaaççããoo ggrrááffiiccaa

e e n n t t a a ç ç ã ã o o g g

Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende da variável em questão

3.1 Gráficos de Linhas

Usado para ilustrar uma série temporal.

Produção de Petróleo Bruto no Brasil de 1976 a 1980 (x 1000 m³)

Produção

11000 10500 10000 9500 9000 8500 1976 1977 1978 1979 1980 Anos
11000
10500
10000
9500
9000
8500
1976
1977
1978
1979
1980
Anos

Fonte: Conjuntura Econômica (Fev. 1983)

3 .1.1 Gráfico de linhas comparativas

População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

45000 40000 35000 30000 25000 20000 15000 10000 5000 0 1940 1950 1960 1970 1980
45000
40000
35000
30000
25000
20000
15000
10000
5000
0
1940
1950
1960
1970
1980
NE N SE S CO
NE
N
SE
S
CO

Fonte: Anuário Estatístico (1984)

8

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

3.2 Gráficos de colunas ou barras

Representação gráfica da distribuição de freqüências. Este gráfico é utilizado para variáveis nominais e ordinais. Características:

- todas as barras devem ter a mesma largura

- devem existir espaços entre as barras

3.2.1 Gráfico de Colunas

Usado para ilustrar qualquer tipo de série.

População Urbana do Brasil em 1980 (x 1000) 50000 42810 40000 30000 Pop. 17568 20000
População Urbana do Brasil em 1980 (x 1000)
50000
42810
40000
30000
Pop.
17568
20000
11878
5115
10000
3037
0
N
N
NE
NE
SE
SE
S
S
CO
CO
Regiões
Regiões

Fonte: Anuário Estatístico (1984)

ùAs larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão, desde que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou não omitido, se forem conservados, a escala vertical pode ser omitida.

3.2.2.1 Gráfico de colunas comparativas

a) Colunas Justapostas (gráfico comparativo)

População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

45000 40000 N 35000 30000 NE 25000 SE 20000 S 15000 CO 10000 5000 0
45000
40000
N
35000
30000
NE
25000
SE
20000
S
15000
CO
10000
5000
0
1940
1950
1960
1970
1980

Fonte: Anuário Estatístico(1984)

9

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

b) Colunas Sobrepostas (gráfico comparativo)

População Urbana do Brasil por Região de 1940 a 1980 (x 1000) 100000 CO 80000
População Urbana do Brasil por Região de 1940 a 1980 (x 1000)
100000
CO
80000
S
60000
SE
N
40000
NE
20000
0
1940
1950
1960
1970
1980

Fonte: Anuário Estatístico (1984)

3.2.2 Gráfico de Barras

As regras usadas para o gráfico de barras são igua is as usadas para o gráfico de colunas.

População Urbana do Brasil em 1980 (x 1000)

CO 5115 S 11878 Regiões SE 42810 NE 17568 N 3037 0 10000 20000 30000
CO
5115
S
11878
Regiões
SE
42810
NE
17568
N
3037
0 10000
20000
30000
40000
50000

População

Fonte: Anuário Estatístico (1984)

ù Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas.

3.3 Gráficos circulares ou de Setores (Pie Charts)

Representação gráfica da freqüência relativa (percentagem) de cada categoria da variável. Este gráfico é utilizado para variáveis nominais e ordinais. É uma opção ao gráfico de barras quando se pretende dar ênfase à comparação das percentagens de cada categoria. A construção do gráfico de setores segue uma regra de 3 simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja representar em relação a freqüência total que representa o total de 360 .

10

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

Características:

- A área do gráfico equivale à totalidade de casos (360 o = 100%);

- Cada “fatia” representa a percentagem de cada categoria

População Urbana e Rural do Brasil em 1980 (x 1000)

32%

População Urbana e Rural do Brasil em 1980 (x 1000) 32% 68% Urbana Rural Fonte: Anuário

68%

Urbana Rural
Urbana
Rural

Fonte: Anuário Estatístico (1984)

3.4 Gráfico Pictorial - Pictograma

Tem por objetivo despertar a atenção do público em geral, muito desses gráficos apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados.

Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)

1500 1250 1000 750 500 250 0 1968 1974 1980 1986 1990 1994 Fonte: Grandes
1500
1250
1000
750
500
250
0
1968
1974
1980
1986
1990
1994
Fonte: Grandes números da educação brasileira março de 1996

11

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

3.4.1 Exemplos de pictogramas

Evolução da frota nacional de carros à álcool de 1979 à 1987 3.631.647 1987 2.473.581
Evolução da frota nacional de carros à álcool de 1979 à 1987
3.631.647
1987
2.473.581
1985
1.277.107
1983
9.645
1979
Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canadá Goma
Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes
entrevistados no Canadá
Goma de mascar com nicotina
mais sessões de apoio psicológico
36%
Internamento em hospital
e uso de drogas relaxantes
30%
Acumpuntura
27%
Hipnose
19,5%
Injeção de Clonidina, droga que
reduz os efeitos da abstinência
18,5%
Devastação Selvagem: extração de madeiras no Brasil Pinus 6,8% Eucalipto 24,4% Madeira nativa 68,8%
Devastação Selvagem: extração de madeiras no Brasil
Pinus
6,8%
Eucalipto
24,4%
Madeira
nativa
68,8%

12

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

3.5 Gráfico Polar

É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a série que apresenta uma determinada periodicidade.

4.5.1 Como construir um gráfico polar

1) Traça-se uma circunferência de raio arbitrário (preferencialmente, a um raio de comprimento proporcional a média dos valores da série);

2) Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0 (pólo) e com uma escala (eixo polar);

3) Divide-se a circunferência em tantos arcos forem as unidades temporais;

4) Traça -se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;

5) Marca-se os valores correspondentes da variável, iniciando pela semi-reta horizontal (eixo polar);

6) Ligam-se os pontos encontrados com segmentos de reta;

7) Para fechar o polígono obtido, emprega-se uma linha interrompida.

Precipitação pluviométrica do município de Santa Maria – RS- 1999

Meses

Precipitação (mm)

Janeiro

174,8

Fevereiro

36,9

Março

83,9

Abril

462,7

Maio

418,1

Junho

418,4

Julho

538,7

Agosto

323,8

Setembro

39,7

Outubro

66,1

Novembro

83,3

Dezembro

201,2

Fonte: Base Aérea de Santa Maria

Média = 237,31 mm

Precipitação pluviométrica do município de Santa Maria – RS- 1999

pluviométrica do município de Santa Maria – RS- 1999 Fonte: Base Aérea de Santa Maria 13

Fonte: Base Aérea de Santa Maria

13

http://professorviegas.blogspot.com

3.6 Cartograma

Profº Sandro Viégas - Estatística I

É a representação de uma carta geográfica. Este tipo de gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas

Dados absolutos (população) – usa-se pontos proporcionais aos dados.

Dados relativos (densidade) – usa-se hachaduras.

Exemplo:

População da Região Sul do Brasil - 1990

Estado

População (hab.)

Área (m 2 )

Densidade

Paraná Santa Catarina Rio Grande do Sul

9.137.700

199.324

45,8

4.461.400

95.318

46,8

9.163.200

280.674

32,6

Fonte: IBGE

População da Região Sul do Brasil – 1990

Fonte: IBGE População da Região Sul do Brasil – 1990 Fonte: IBGE Densidade populacional da Região
Fonte: IBGE População da Região Sul do Brasil – 1990 Fonte: IBGE Densidade populacional da Região

Fonte: IBGE

Densidade populacional da Região Sul do Brasil – 1990

Fonte: IBGE Densidade populacional da Região Sul do Brasil – 1990 Fonte: IBGE 14 http://professorviegas.blogspot.com

Fonte: IBGE

14

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

3.7 Gráficos utilizados para a análise de uma distribuição de freqüência

3.7.1 Histograma

Altura em centímetros de 160 alunos do Curso de Administração da UFSM - 1990

de 160 alunos do Curso de Administração da UFSM - 1990 Fonte: Departamento de Estatística (1990)

Fonte: Departamento de Estatística (1990)

3.7.2 Polígono de Freqüências

Altura em centímetros de 160 alunos do Curso de Administração da UFSM - 1990

de 160 alunos do Curso de Administração da UFSM - 1990 Fonte: Departamento de Estatística (1990)

Fonte: Departamento de Estatística (1990)

15

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

3.6.3 Ogivas

Altura em centímetros de 160 alunos do Curso de Administração da UFSM – 1990

Ogiva Crescente

Ogiva Decrescente

da UFSM – 1990 Ogiva Crescente Ogiva Decrescente 3.7.4 Gráfico em segmentos de reta vertical É

3.7.4 Gráfico em segmentos de reta vertical

É

utilizado

para

representar

uma

distribuição

de

freqüência

pontual,

onde

os

segmentos de reta são proporcionais às respectivas freqüências absolutas.

Altura em centímetros de 160 alunos do Curso de Administração da UFSM - 1990

de 160 alunos do Curso de Administração da UFSM - 1990 Fonte: Departamento de Estatística (1990)

Fonte: Departamento de Estatística (1990)

3.7.5 Como se interpreta um histograma?

A representação gráfica da distribuição da variável, por histogramas. Este gráfico é utilizado para variáveis contínuas.

Características:

- Cada barra representa a freqüência do intervalo respectivo;

- Os intervalos devem ter a mesma amplitude;

- As barras devem estar todas juntas.

16

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

A simples observação da forma do

Figura 4.1 Histograma

histograma permite algumas conclusões. Veja a figura 4.1. A medida dos dados está no centro
histograma
permite
algumas
conclusões.
Veja a figura 4.1. A medida dos dados está
no centro do desenho. As freqüências mais
altas também estão no centro da figura.
Nos processos industriais, esta é a forma
desejável.
60
50
40
30
20
10
0
A
figura
4.2
apresenta
um
Figura
4.2
Histograma
com
assimetria
histograma
com
assimetria
positiva.
A
positiva
média dos dados está localizada à esquerda
do centro da figura e a cauda à direita é
60
50
alongada.
Esta
ocorre
quando
o
limite
40
inferior
é
controlado
ou
quando
não
30
podem
determinado limite.
ocorrer
valores
abaixo
de
20
10
0
A
figura
4.3
apresenta
um
Figura
4.3
Histograma
com
assimetria
histograma
com
assimetria
negativa.
A
negativa
média dos dados está localizada à direita do
centro da figura e a cauda à esquerda é
alongada. Esta forma ocorre quando o
limite superior é controlado ou quando não
podem ocorrer valores acima de certo
limite
60
50
40
30
20
10
0

17

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

Figura 4.4 Histograma em plateau

A figura 4.4 mostra um histograma 60 em plateau, Isto é, com exceção das primeiras
A
figura 4.4 mostra um histograma
60
em plateau, Isto é, com exceção das
primeiras e das últimas classes, todas as
outras têm freqüências quase iguais. Essa
forma ocorre quando se misturam várias
distribuições com diferentes médias.
50
40
30
20
10
0
A figura 4.5 mostra um histograma com dois picos, ou duas modas. As freqüências são
A
figura 4.5 mostra um histograma
com dois picos, ou duas modas. As
freqüências são baixas no centro da figura,
mas existem dois picos fora do centro. Esta
forma ocorre quando duas distribuições
com médias bem diferentes se misturam.
Podem estar misturados, por exemplo, os
produtos de dois turnos de trabalho.
Figura 4.5 Histograma com dois
picos
60
50
40
30
20
10
0

Os histogramas também mostram o grau de dispersão da variável. Veja a figura 4.6. O histograma à esquerda mostra pouca dispersão, mas o histograma à direita mostra grande dispersão.

Figura 4.6 Histogramas com dispersões diferentes

Freqüência Freqüência 60 60 50 50 40 40 30 30 20 20 10 10 0
Freqüência
Freqüência
60
60
50
50
40
40
30
30
20
20
10
10
0
0

18

http://professorviegas.blogspot.com

Profº Sandro Viégas - Estatística I

3.7.7 Curvas em forma de sino

As curvas em forma de sino caracterizam-se pelo fato de apresentarem um valor máximo na região central.

Distinguem-se as curvas em forma de sino em: simétrica e assimétrica

a) Curva simétrica

Esta curva caracteriza-se por apresentar o valor máximo no ponto central e os pontos eqüidistantes desse ponto terem a mesma freqüência.

eqüidistantes desse ponto terem a mesma freqüência. b) Curvas assimétricas Na prática, não se encontram

b) Curvas assimétricas

Na prática, não se encontram distribuições perfeitamente simétricas. As distribuições obtidas de medidas reais são mais ou menos assimétricas, em relação à freqüência máxima. Assim, as curvas correspondentes a tais distribuições apresentam a cauda de um lado da ordenada máxima mais longa do que o outro. Se a cauda mais longa fica a direita é chamada assimétrica positiva ou enviesada à direita, se a cauda se alonga a esquerda, a curva é chamada assimétrica negativa ou enviesada à esquerda.

Assimétrica Positiva

negativa ou enviesada à esquerda . Assimétrica Positiva 19 Assimétrica Negativa http://professorviegas.blogspot.com

19

Assimétrica Negativa

negativa ou enviesada à esquerda . Assimétrica Positiva 19 Assimétrica Negativa http://professorviegas.blogspot.com

http://professorviegas.blogspot.com

Coeficiente de Correlação Até o momento estudamos apenas uma única variável. No entanto, algumas vezes

Coeficiente de Correlação

Até o momento estudamos apenas uma única variável. No entanto, algumas vezes o pesquisador está interessado em analisar a relação entre duas variáveis. Por exemplo, qual a relação entre o preço dos alimentos e a oferta; entre a altura das pessoas e o peso. A maneira mais simples de iniciar este estudo é através do diagrama de dispersão. Neste gráfico, cada eixo representa uma das variáveis em estudo.

Exemplo: No gráfico abaixo é apresentado o diagrama de dispersão entre as variáveis altura e peso de um grupo de oito pessoas.

85 80 75 70 65 60 1,6 1,65 1,7 1,75 1,8 1,85 Altura (m) Peso
85
80
75
70
65
60
1,6
1,65
1,7
1,75
1,8
1,85
Altura (m)
Peso (kg)

Figura 2 – Correlação entre as variáveis peso e altura

O diagrama de dispersão pode apresentar uma relação positiva entre as variáveis, ou seja, à medida que uma variável aumenta a outra variável também aumenta. Na figura 3 (a) as variáveis apresentam uma correlação perfeita, na figura 3(b) uma correlação forte e na figura 3(c) uma correlação fraca.

correlação forte e na figura 3(c) uma correlação fraca. (a) (b) (c) Figura 3 – correlação

(a)

forte e na figura 3(c) uma correlação fraca. (a) (b) (c) Figura 3 – correlação positiva

(b)

forte e na figura 3(c) uma correlação fraca. (a) (b) (c) Figura 3 – correlação positiva

(c)

Figura 3 – correlação positiva entre as duas variáveis

O diagrama de dispersão também pode apresentar uma relação negativa entre as variáveis, ou seja,

O diagrama de dispersão também pode apresentar uma relação negativa entre as

variáveis, ou seja, à medida que uma variável aumenta a outra variável diminui. Na figura 4(a) as variáveis apresentam uma correlação perfeita, na figura 4(b) uma correlação forte e na figura 4(c) uma correlação fraca.

correlação forte e na figura 4(c) uma correlação fraca. (a) Figura 4 – correlação negativa entre
correlação forte e na figura 4(c) uma correlação fraca. (a) Figura 4 – correlação negativa entre
correlação forte e na figura 4(c) uma correlação fraca. (a) Figura 4 – correlação negativa entre

(a)

Figura 4 – correlação negativa entre as duas variáveis

(b)

(c)

Quando as duas variáveis não possuem relação o gráfico de dispersão apresenta uma nuvem aleatória de pontos.

de dispersão apresenta uma nuvem aleatória de pontos. O grau de associação linear entre duas variáveis

O grau de associação linear entre duas variáveis pode ser medido através do

coeficiente de correlação de Pearson, que é dado por:

r =

 

n

xy

(

)

x .

(

y

)

[ n ∑ 2 x − ( ∑ x ) ][ 2 .n y ∑

[

n

2

x

(

x

) ][

2

.n y

2

(

y

2

)

]

O valor de r, que sempre pertencerá ao intervalo [-1, 1], representa uma medida de

intensidade do inter-relacionamento entre duas variáveis. Se r = 1, há uma perfeita correlação positiva entre as variáveis, isto é, se os valores de uma variável aumentam (ou diminuem), em correspondência os valores da outra variável também aumentam (ou diminuem) na mesma proporção. Se, por outro lado, r = -1, há uma perfeita correlação negativa entre as variáveis, ou seja, os valores de uma variável variam em proporção inversa aos valores de outra variável. Se, entretanto, r = 0, não há correlação entre as variáveis.

Exemplo 1: Calcule o coeficiente de correlação entre as variáveis altura e peso de oito
Exemplo 1: Calcule o coeficiente de correlação entre as variáveis altura e peso de oito

Exemplo 1: Calcule o coeficiente de correlação entre as variáveis altura e peso de oito pessoas.

Altura (m)

Peso (kg)

1,7

74

1,65

66

1,62

61

1,73

74

1,78

82

1,67

67

1,8

83

1,77

79

Solução: Utilizando a tabela para auxiliar nos cálculos

Altura (m) - x

Peso (kg) - y

 

x.y

 

X

2

 

Y

2

1,7

74

 

125,8

2,89

5476

1,65

66

 

108,9

2,72

4356

1,62

61

 

98,82

2,62

3721

1,73

74

 

128,02

2,99

5476

1,78

82

 

145,96

3,17

6724

1,67

67

 

111,89

2,79

4489

1,8

83

 

149,4

3,24

6889

1,77

79

 

139,83

3,13

6241

=13,72

= 586

. =1.008,62

= 23,56

= 43372

r =

 

n

xy

(

)

x .

(

y

)

[ n ∑ 2 x − ( ∑ x ) ][ 2 . n ∑

[

n

2

x

(

x

) ][

2

.

n

2

y

(

y

)

2

]

=

8. 1008,62

13.72.586

[ 2 ] [ 2 ] 8.23,56 13,72 − . 8.43372 586 −
[
2
]
[
2
]
8.23,56 13,72
. 8.43372 586

= 0,987

Interpretação: As variáveis altura e peso apresentam uma forte relação positiva, portanto, à medida que uma variável aumenta a outra também aumenta.