Você está na página 1de 124

CURSO DE PÓS-GRADUAÇÃO “LATO SENSU” (ESPECIALIZAÇÃO) A DISTÂNCIA GESTÃO DE EMPRESAS COM ÊNFASE EM QUALIDADE

INTRODUÇÃO À ESTATÍSTICA BÁSICA COM R

Eric Batista Ferreira Marcelo Silva de Oliveira

Universidade Federal de Lavras - UFLA

Fundação de Apoio ao Ensino, Pesquisa e Extensão - FAEPE Lavras - MG

2008

ii

EDITORA - UFLA/FAEPE - Gestão de empresas com ênfase em qualidade

Parceria Universidade Federal de Lavras - UFLA Fundação de Apoio ao Ensino, Pesquisa e Extensão - FAEPE Reitor Antônio Nazareno Guimarães Mendes Vice-Reitor Elias Tadeu Fialho Diretor da Editora Marco Antônio Rezende Alvarenga Pró-Reitor de Pós-Graduação Joel Augusto Muniz Pró-Reitor Adjunto de Pós-Graduação “Lato Sensu” Marcelo Silva de Oliveira Coordenador do Curso Daniel Carvalho de Rezende Presidente do Conselho Deliberativo da FAEPE Luiz Antônio Lima Editoração Centro de Editoração/FAEPE Impressão Gráfica Universitária/UFLA

Ficha Catalográfica Preparada pela Divisão de Processos Técnicos da Biblioteca Central da UFLA

Ferreira, Eric Batista; Oliveira, Marcelo Silva de Introdução à Estatística Básica com R / Eric Batista Ferreira. Marcelo Silva de Oliveira. −− Lavras : UFLA/FAEPE, 2008, 1ª Edição. 124 p. : il. - Curso de Pós-Graduação “Lato Sensu” (Especialização) a Distância - Gestão de Empresas com Ênfase em Qualidade.

Bibliografia.

1. Qualidade. 2. Gestão. 3. Método estatístico. i. Ferreira, E. B.; Oliveira, M. S. de. ii. Universidade Federal de Lavras. iii. Fundação de Apoio ao Ensino, Pesquisa e Extensão. iv. Título.

CDD-658

Nenhuma parte dessa publicação pode ser reproduzida, por qualquer meio ou forma, sem a prévia autorização da FAEPE.

Sumário

LISTA DE TABELAS

 

vi

LISTA DE FIGURAS

viii

1 INTRODUÇÃO

1

1.1 Introdução ao R .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

1

 

1.1.1 Baixando e instalando

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

1

1.1.2 Iniciando o R

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

1.1.3 Objetos

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

1.1.4 Lendo arquivos

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

8

1.1.5 Funções básicas

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

8

1.1.6 Pedindo ajuda .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

9

1.2 Alguns conceitos importantes

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

10

1.3 Principais aplicações da Estatística

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

12

1.4 Bibliografia consultada e recomendada

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

14

2 TÉCNICAS DE SOMATÓRIO

 

15

3 ESTATÍSTICA DESCRITIVA

 

19

3.1 Introdução

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

19

3.2 Variáveis qualitativas

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

20

3.3 Variáveis quantitativas discretas

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

23

3.4 Variáveis quantitativas contínuas

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

25

3.5 Medidas de posição

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

30

 

3.5.1 Média (Me)

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

30

3.5.2 Mediana (Md)

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

32

3.5.3 Moda (Mo)

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

34

3.6 Medidas de dispersão

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

36

 

3.6.1 Amplitude (A)

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

36

3.6.2 Variância e Desvio Padrão

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

37

3.6.3 Coeficiente de Variação (CV)

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

40

4 PROBABILIDADE

 

43

4.1

Distribuições de probabilidade discretas

 

47

4.1.1 Distribuição Binomial

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

48

4.1.2 Distribuição Poisson

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

49

iv

EDITORA - UFLA/FAEPE - Gestão de empresas com ênfase em qualidade

4.2

Distribuições de probabilidades contínuas

 

50

4.2.1 Distribuição Normal de probabilidades

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

51

4.2.2 Outras distribuições contínuas

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

57

5 AMOSTRAGEM

 

59

5.1 Amostragens não-aleatórias

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

59

5.2 Amostragens aleatórias

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

60

 

5.2.1 Amostragem aleatória simples (AAS)

 

60

5.2.2 Amostragem aleatória estratificada (AAE)

 

60

5.2.3 Amostragem aleatória por conglomerado (AAC)

 

61

5.2.4 Amostragem aleatória sistemática (AS)

 

61

6 INFERÊNCIA ESTATÍSTICA

 

63

6.1 Distribuição de amostragem

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

63

 

6.1.1

Distribuição de funções da média amostral (populações normais)

 

63

6.2 Estimação

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

66

 

6.2.1 Estimação por ponto

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

66

6.2.2 Estimação por intervalo

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

66

6.3 Testes de hipóteses

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

70

 

6.3.1 Teste de homogeneidade de Variâncias (teste F):

 

70

6.3.2 Teste sobre µ (populações infinitas)

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

72

6.3.3 Teste sobre proporções (p)

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

74

7 CORRELAÇÃO E REGRESSÃO

 

75

7.1 Correlação

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

75

 

7.1.1 Coeficiente de correlação linear (r ou ρ)

 

75

7.1.2 Coeficiente de determinação (r 2 ou ρ 2 )

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

75

7.2 Regressão

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

77

 

7.2.1 Regressão Linear Simples

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

77

7.2.2 Regressão Múltipla

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

84

8 APÊNDICE A: EXERCÍCIOS PROPOSTOS

 

85

9 APÊNDICE B: TABELAS

 

101

Lista de Tabelas

3.1

3.2

3.3

3.4

5.1

6.1

7.1

7.2

8.1

8.2

9.1

9.2

9.3

9.4

9.5

Distribuição de freqüências absolutas (f a), relativa (fr) e percentual (fp) da ati-

vidade em propriedades de uma região.

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

20

Distribuição de freqüências absolutas (f a), relativa (fr) e percentual (fp) do nú-

 

mero de filhos por casal de uma

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

23

Distribuição de freqüências absoluta (f a), relativa (fr) e percentual (fp) do peso

 

observado em potinhos de canela em pó.

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

27

Freqüências absolutas acumuladas abaixo (Fa) e acima de (Fa).

.

.

.

.

.

.

.

.

.

29

Diferenças básicas entre a amostragem aleatória estratificada (AAE) e a amostra-

 

gem aleatória por conglomerado (AAC).

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

61

Representação tabular dos resultados possíveis em um teste de hipóteses e os erros

 

e

acertos que eles

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

72

Volume de polpa (cm 3 ), volume de água (cm 3 ) e teor de cálcio (mg/100ml) em 20 .

cocos

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

80

Tabela auxilar para cálculo dos coeficientes do modelo

 

82

Distribuição de freqüência de rendas familiares de 100 entrevistados, em Lavras, MG. 87

Distribuição de freqüências das médias diárias de produção de leite no período de lactação de 201 vacas da raça holandesa, de um rebanho pertencente ao Núcleo de

Criadores de Gado Holandês do Sul de Minas Gerais. Lavras,

88

Probabilidades (α) da distribuição normal padrão N (0, 1) para valores do quantil Z t padronizado de acordo com o seguinte evento: P (0 < Z < Z t ) =

Probabilidades (α) da distribuição normal padrão N (0, 1) para valores do quantil Z t padronizado de acordo com o seguinte evento: P (Z > Z t ) =

Quantis superiores da distribuição de qui-quadrado (χ α ) com ν graus de liberdade

e para diferentes valores da probabilidade (α) de acordo com o seguinte evento:

.

P (χ 2 > χ α ) = α.

Quantis superiores da distribuição de qui-quadrado (χ α ) com ν graus de liberdade

e para diferentes valores da probabilidade (α) de acordo com o seguinte evento:

.

P (χ 2 > χ α ) = α.

Quantis superiores da distribuição de F (F 0,10 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador, valor da probabilidade (α) de 10% de acordo com o seguinte evento:P (F > F 0,10 ) = 0,

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

2

102

103

104

105

106

vi

EDITORA - UFLA/FAEPE - Gestão de empresas com ênfase em qualidade

9.6 Quantis superiores da distribuição de F (F 0,10 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador, valor da probabilidade (α) de 10% de acordo com o seguinte evento: P (F > F 0,10 ) = 0,

 

107

9.7 Quantis superiores da distribuição de F (F 0,05 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 5% de acordo com o seguinte evento: P (F > F 0,05 ) = 0,

108

9.8 Quantis superiores da distribuição de F (F 0,05 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador, valor da probabilidade (α) de 5% de acordo com o seguinte evento: P (F > F 0,05 ) = 0,

109

9.9 Quantis superiores da distribuição de F (F 0,025 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 2,5% de acordo com o seguinte evento: P (F > F 0,025 ) = 0,

110

9.10 Quantis superiores da distribuição de F (F 0,025 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 2,5% de acordo com o seguinte evento: P (F > F 0,025 ) = 0,

111

9.11 Quantis superiores da distribuição de F (F 0,01 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 1% de acordo com o seguinte evento: P (F > F 0,01 ) = 0,

112

9.12 Quantis superiores da distribuição de F (F 0,01 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 1% de

 

acordo com o seguinte evento:P (F > F 0,01 ) = 0,

 

113

9.13 Quantis superiores da distribuição de F (F 0,005 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 0,5% de acordo com o seguinte evento:P (F > F 0,005 ) = 0,

 

114

9.14 Quantis superiores da distribuição de F (F 0,005 ) com ν 1 graus de liberdade do nume- rador e ν 2 graus de liberdade do denominador valor da probabilidade (α) de 0,5%

 

de acordo com o seguinte evento:P (F > F 0,005 ) = 0, 005.

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

115

9.15 Quantis superiores da distribuição t de Student (t α ) com ν graus de liberdade

 

e para diferentes valores da probabilidade (α) de acordo com o seguinte evento:

P (t > t α ) = α.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

116

Lista de Figuras

1.1

Tela inicial do R em ambiente Windows.

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

3

1.2

Mensagem ao tentar sair do R, em ambiente Windows.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

3

1.3

Esquema de um

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

4

1.4

Gráfico ilustrativo do comportamento do peso de suínos (kg) em função de sua ingesta diária de ração ao longo do período de

13

2.1

Esquema ilustrativo dos elementos típicos de um somatório.

 

.

.

.

.

.

.

.

.

.

.

.

.

15

3.1

(a)

Gráfico de colunas das principais atividades em propriedades rurais. (b) Gráfico

 

de barras da mesma situação.

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

21

3.2

Setograma ou gráfico de

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.