Você está na página 1de 30

ESTATSTICA

1. CONCEITOS BSICOS
Populao - o conjunto de elementos (pessoas, coisas, objetos) que tm em
comum uma caracterstica em estudo. A populao pode ser:
i. Finita: quando apresenta um nmero limitado de indivduos.
Ex.1 a populao constituda por todos os parafusos produzidos em
uma fbrica em um dia.
Ex. 2 nascimento de crianas em um dia em Novo Hamburgo.
ii.Infinita: quando o nmero de observaes for infinito.
Ex. a populao constituda de todos os resultados (cara e coroa) em
sucessivos lances de uma moeda.
Amostra - o conjunto de elementos retirados da populao, suficientemente
representativos dessa populao. Atravs da anlise dessa amostra estaremos
aptos para analisar os resultados da mesma forma que se estudssemos toda a
populao.

Obs. A amostra sempre finita. Quanto maior for a amostra mais significativa o
estudo.
Parmetro - uma caracterstica numrica estabelecida para toda uma
populao.
Estimador - uma caracterstica numrica estabelecida para uma amostra.
Dado Estatstico - sempre um nmero real.
a- Primitivo ou Bruto: aquele que no sofreu nenhuma transformao
matemtica. Nmero direto.
b- Elaborado ou secundrio: aquele que sofreu transformao
matemtica. Ex. porcentagem, mdia, etc.
1. ARREDONDAMENTO DE DADOS
Quando o primeiro algarismo aps aquele que vai ser arredondado for 0, 1, 2, 3
e 4 despreza-se este algarismo e conserva-se o anterior.
Exemplo: 5,733958 = 5,73; 78,846970 = 78,8.
Quando o primeiro algarismo aps aquele que vai ser arredondado for 5, 6, 7, 8
e 9 aumentamos uma unidade no algarismo anterior.
Exemplo: 5,735958 = 5,74; 78,886970 = 78,9.
1. DIVISO DA ESTATSTICA
Podemos dividir a Estatstica em duas reas:
Estatstica Descritiva parte da Estatstica que tem por objetivo
descrever os dados observados e na sua funo dos dados, tem as seguintes
atribuies.
i. A obteno ou coleta de dados normalmente feita atravs de um
questionrio ou de observao direta de uma populao ou amostra.
ii.A organizao dos dados consiste na ordenao e crtica quanto
correo dos valores observados, falhas humanas, omisses,
abandono de dados duvidosos.
iii.A representao dos dados os dados estatsticos podem ser mais
facilmente compreendidos quando apresentados atravs de tabelas e
grficos, que permite uma visualizao instantnea de todos os
dados.
Estatstica Indutiva parte da Estatstica que tem por objetivo obter e
generalizar concluses para a populao a partir de uma amostra, atravs do
clculo de probabilidade. A tais concluses esto sempre associados a um
grau de incerteza e conseqentemente, a uma probabilidade de erro.
1. VARIVEIS
Uma varivel qualquer caracterstica de um elemento observado (pessoa,
objeto ou animal).
Algumas variveis, como sexo e designao de emprego, simplesmente enquadram
os indivduos em categorias. Outras, como altura e renda anual, tomam valores numricos
com os quais podemos fazer clculos.
Os exemplos acima nos dizem que uma varivel pode ser:
a Qualitativa: quando seus valores so expressos por atributos: sexo (masculino
feminino), cor da pele (branca, preta, amarela, vermelha);
b Quantitativa: quando seus valores so expressos em nmeros (salrios dos
operrios, idade dos alunos de uma escola, nmero de filhos, etc.). Uma varivel
quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o
nome de varivel contnua (altura, peso, etc.); uma varivel que s pode assumir valores
pertencentes a um conjunto enumervel recebe o nome de varivel discreta (nmero de
filhos, nmero de vitrias).
APRESENTAO DE DADOS ESTATSTICOS
APRESENTAO TABULAR
A apresentao de dados estatsticos na forma tabular consiste na reunio ou
grupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los de modo
ordenado, simples e de fcil percepo e com economia de espao.
Componentes Bsicos
Em termos genricos, uma tabela se compe dos seguintes elementos
bsicos:
Ttulo
Cabealho
Indicadora
de
Coluna
C
o
Casa l Linha
u
n
a
Rodap
Exemplo:
Brasil - Estimativa de Populao
1970 76
Ano Populao
(1000 habitantes)
1970
1971
1972
1973
1974
1975
1976
93.139
95.993
98.690
101.433
104.243
107.145
110.124
Fonte: Anurio Estatstico do Brasil
Principais Elementos de uma Tabela
Ttulo: Conjunto de informaes, as mais completas possveis, localizado no
topo da tabela, respondendo s perguntas: O qu? Onde? Quando?
Cabealho: Parte superior da tabela que especifica o contedo das colunas.
Coluna Indicadora: Parte da tabela que especifica o contedo das linhas.
Linhas: Retas imaginrias que facilitam a leitura, no sentido horizontal, de
dados que se inscrevem nos seus cruzamentos com as colunas.
Casa ou Clula: Espao destinado a um s nmero.
Rodap: so mencionadas a fonte se a srie extrada de alguma publicao e
tambm as notas ou chamadas que so esclarecimentos gerais ou particulares relativos aos
dados.
SRIES ESTATSTICAS
toda tabela que apresenta a distribuio de um conjunto de dados
estatsticos em funo de trs elementos:
a. Da poca;
b. Do local;
c. Da espcie.
Esses elementos determinam o surgimento de quatro tipos fundamentais de sries
estatsticas:
Sries Temporais ou Cronolgicas: so aquelas nas quais os dados so
reunidos segundo o tempo que varia, permanecendo fixos o local e a espcie.
Exemplo: Produo de petrleo bruto Brasil
1966 1970.
Anos Quantidade (cm)
1966
1967
1968
1969
1970
6.748.889
8.508.848
9.509.639
10.169.531
9.685.641
Fonte Brasil em dados.
Sries Geogrficas: so aquelas nas quais os dados so reunidos segundo o
local que varia permanecendo fixos o tempo e a espcie.
Exemplo: Rebanhos bovinos Brasil
1970.
Regies Bovinos (1000)
Norte
Nordeste
Sudeste
Sul
Centro-oeste
2.132
20.194
35.212
18.702
15.652
Fonte Brasil em dados.
Sries Especficas: so aquelas nas quais os dados so reunidos segundo o
espcie que varia permanecendo fixos o tempo e o local.
Exemplo: Produo pesqueira (mar) Brasil
1969.
Itens Produo (ton.)
Peixes 314
Crustceos 62
Moluscos 3
Mamferos 12
Fonte Brasil em dados.
Sries Composta ou Mista: a combinao de dois ou mais fundamentais de
sries estatsticas.
Exemplo: Geogrfica Temporal.
Evoluo do transporte de carga martima nas 4 principais bacias brasileiras
Brasil -1968 1970.
Bacias
Anos
1968 1969 1970
Amaznica
Nordeste
Prata
So Francisco
233.768*
16.873
177.705
53.142
324.350
20.272
203.966
48.667
316.557
20.246
201.464
57.948
Fonte Brasil em dados.
* Os dados esto em toneladas.
A apresentao tabular de dados estatsticos normalizada pela resoluo n 886
de 26-10-1966 do Conselho Nacional de Estatstica a fim de uniformizar a
apresentao de dados.
DISTRIBUIO DE FREQUNCIA
o tipo de srie estatstica na qual permanece constante o fato, o local e a poca. Os
dados so colocados em classes pr-estabelecidas, registrando freqncia.
Divide-se em duas partes:
Distribuio de Freqncia Intervalar (Var. Contnua)
Distribuio de Freqncia Pontual (Var. Discreta)
Distribuio de Freqncia Intervalar
um mtodo de tabulao dos dados em classes, categorias ou intervalos, onde
teremos uma melhor visualizao e aproveitamento dos dados.
Exemplo:
Notas do curso de
Cincia da Computao na disciplina de
Programao I de uma dada Faculdade
Notas N de Estudantes
5 |-- 6 18
6 |-- 7 15
7 |-- 8 12
8 |-- 9 03
9 |--10 02
Elementos Principais:
a) Classe cada um dos intervalos em que os dados so agrupados.
b) Limites de classes so os valores extremos de cada classe.
l
i
= limite inferior de uma classe;
L
i
= limite superior de uma classe.
c) Amplitude a diferena entre o maior valor e o menor valor de certo conjunto de
dados. Pode ser referida ao total de dados ou a uma das classes em particular.
Amplitude Total (A
t
) calculada pela seguinte expresso:
A
t
= Max. (rol) Min.(rol).
Amplitude das classes (h) a relao entre a amplitude total e o nmero de
classes, conforme mostra a expresso a seguir:
n
rol Mn rol Mx
h
) .( ) (

, onde n o nmero de intervalos de classe.


d) Ponto mdio de classe (x
i
) - calculado pela seguinte expresso:
2
i i
i
l L
x
+

e) Freqncia absoluta (f
i
) - freqncia absoluta de uma classe de ordem i, o nmero de
dados que pertencem a essa classe.
f) Freqncia relativa (fr
i
) - freqncia relativa de uma classe de ordem i, o quociente da
freqncia absoluta dessa classe (f
i
), pelo total, ou seja,
Total
f
fr
i
i

Obs: a soma de todas as freqncias absolutas igual ao total.
g) Freqncia acumulada (F
i
) - freqncia acumulada de uma classe de ordem i, a soma
das freqncias at a classe de ordem i.
h) Freqncia relativa acumulada (Fr
i
) - freqncia relativa acumulada de uma classe de
ordem i, a soma das freqncias relativas at a classe de ordem i.
ORGANIZAO DE UMA DISTRIBUIO DE FREQUNCIA:
Para organizar um conjunto de dados quantitativos em distribuio de freqncias,
aconselha-se seguir a seguinte orientao:
1
o
Organizar o rol colocar os dados em ordem crescente ou ordem decrescente.
2
o
Calcular (ou adotar) o nmero conveniente de classes o nmero de classe deve ser
escolhido pelo pesquisador, em geral, convm estabelecer de 5 a 15 classes. Existem
algumas frmulas para estabelecer quantas classes devem ser construdas. Nos usaremos,
N n
onde
N
a quantidade total de observaes.
3
o
Calcular (ou adotar) a amplitude do intervalo de classes conveniente - a amplitude
do intervalo de classes deve ser o mesmo para todas as classes.
n
rol Mn rol Mx
h
) .( ) (

onde
n
o nmero de intervalos de classe.
4
o
Obter os limites das classes Usualmente as classes so intervalos abertos direita. Os
limites so obtidos fazendo-se.
Limite inferior da 1
a
classe igual ao mnimo do rol, isto ,
l
1
= Min.(rol)
Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do
intervalo de classes aos limites da 1
a
classe.
5
o
Obter as
i
f
- contar o nmero de elementos do rol, que pertencem a cada classe.
6
o
Apresentar a distribuio construir uma tabela com ttulo, subttulo, ...
Distribuio de Freqncia Pontual
uma srie de dados agrupados na qual o nmero de observaes est relacionados
com um ponto real.
Ex.: Notas do Aluno "X" na Disciplina de Estatstica 1990
Nota Alunos
6.3 2
8.4 3
5.3 2
9.5 3
6.5 5
Total 15
GRFICOS ESTATSTICOS
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais
rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido compreenso
que as sries.
A representao grfica de um fenmeno deve obedecer a certos requisitos
fundamentais para ser realmente til:
a) Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, assim como de traos desnecessrios que possam levar o observador
a uma anlise com erros.
b) Clareza o grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo.
c) Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.
Tipos de grficos
Histograma, Polgono de Freqncia e Ogiva: So utilizados para representar a
distribuio de freqncia.
Histograma e Polgono de Freqncia:
Exemplo:
Notas obtidas na disciplina de
Programao I
Notas fi
5 |-- 6 18
6 |-- 7 15
7 |-- 8 12
8 |-- 9 03
9 |--10 02
FONTE: Dados hipotticos.
Ogiva ou polgono de freqncia acumulada:
Exemplo:
Grfico em linha: um dos mais importantes grficos; representa observaes feitas ao
longo do tempo. Tais conjuntos de dados constituem as chamadas sries histricas ou
temporais.
Grfico em setores: um grfico construdo no crculo, que dividido em setores
correspondentes aos termos da srie e proporcionais aos valores numricos dos termos da
srie. mais utilizado para sries especficas ou geogrficas com pequeno nmero de
termos e quando se quer salientar a proporo de cada termo em relao ao todo.
Exemplo:
Grficos em Barras (ou em colunas). a representao de uma srie por meio de
retngulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas).
Quando em barras, os retngulos tm a mesma altura e os comprimentos so
proporcionais aos respectivos dados.
Quando em colunas, os retngulos tm a mesma base e as alturas so proporcionais
aos respectivos dados.
OS DEZ ESTADOS EM QUE A COLETA DE LIXO URBANO
MAIS PRECRIA - EM % DA POPULAO ATENDIDA
26,5
51,5
55
68
71
75
76
62
66,5
48
0
10
20
30
40
50
60
70
80
MA PI PA TO AP AC CE AM RR BA
ESTADOS
Cartograma. representao sobre uma carta geogrfica.
Este grfico empregado quando o objetivo o de figurar os dados
estatsticos diretamente relacionados com as reas geogrficas ou polticas.
Pictograma. Constitui um dos processos grficos que melhor fala ao pblico, pela
sua forma ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras.
Ex.: Populao Urbana do Brasil em 1980 (x 10)
Fonte: Anurio Estatstico (1984)
MEDIDAS ESTATSTICAS
Estudaremos dois tipos fundamentais de medidas estatsticas: medidas de tendncia
central e medidas de disperso.
As medidas de tendncia central mostram o valor representativo em torno do qual os
dados tendem a agrupar-se, com maior ou menor freqncia. So utilizadas para sintetizar
em um nico nmero o conjunto de dados observados.
As medidas de disperso mostram o grau de afastamento dos valores observados em
relao quele valor representativo.
MEDIDAS DE TENDNCIA CENTRAL
A mdia aritmtica simples
A mdia aritmtica simples de um conjunto de valores o valor obtido somando-se
todos eles e dividindo-se o total pelo nmero de valores. denotada por
x
(leia-se x
barra)
n
x
x

, onde x so os valores observados.

i
i i
f
f . x
x
, se os dados estiverem organizados em distribuio de freqncia.
Onde x
i
e f
i
so os valores do ponto mdio e da freqncia absoluta da classe i-sima
respectivamente.
Exemplos:
1) Calcule a mdia aritmtica dos valores abaixo:
a. X = {0, 6, 8, 7, 4, 6}
b. Y = {25, 16, 29, 19, 17}
c. Z = {105, 123, 98, 140}
2) Encontre a mdia para o salrio destes funcionrios.
Salrios semanais para 100 operrios no especializados
Salrios
semanais
f
i
x
i
x
i
.f
i
140 |-- 160 7
160 |-- 180 20
180 |-- 200 33
200 |-- 220 25
220 |-- 240 11
240 |-- 260 4

100
Moda
Seja X um conjunto de dados estatsticos. Define-se Moda de X, denotada por Mo
como sendo o elemento mais freqente no conjunto.
Um conjunto de dados pode ter:
Nenhuma moda (amodal);
Uma moda (unimodal);
Duas ou mais modas (multimodal).
Exerccios: Calcule a moda para os conjuntos abaixo:
a) X= {2, 3, 4, 3, 7, 8, 9, 14}.
b) Y= {2, 4, 6, 2, 8, 4, 10}.
c) Z= {32, 56, 76, 4, 8, 97}.
OBSERVAES:
No h regra para se dizer qual a melhor medida de tendncia central. Em cada
situao especfica o problema deve ser analisado pelo estatstico, que concluir pela
medida mais adequada a situao. Assim que:
a) A MA a medida mais adequada quando no h valores errticos ou
aberrantes.
b) A mediana deve ser usada sempre que possvel como medida
representativa de distribuies com valores dispersos, como distribuio
de rendas, folhas de pagamentos, etc.
MEDIDAS DE DISPERSO
Servem para verificarmos a representatividade das medidas de posio, pois muito
comum encontrarmos sries que, apesar de terem a mesma mdia, so compostas de
maneira distinta.
Assim, para as sries:
a) 25, 28, 31, 34, 37
b) 17, 23, 30, 39, 46
temos
31
b a
x x
.
Nota-se que os valores da srie a esto mais concentrados em torno da mdia 31,
do que a srie b. Precisamos medir a disperso dos dados em torno da mdia, para isto
utilizaremos as medidas de disperso:
Desvio Padro
Coeficiente de Variao
Desvio Padro:
a raiz quadrada positiva da mdia aritmtica dos quadrados das diferenas entre cada
valor e a mdia aritmtica do conjunto e denotada por

. Assim,
n
) x x (

2
i

i
i
2
i
f
f ) x x (

, se os dados estiverem organizados em distribuio de freqncia.


Exemplo 1:
Encontre o desvio padro para os dados das sries a), e b) acima.
Exemplo 2:
Salrios semanais para 100 operrios no especializados
Salrios
semanais
f
i
x
i
(x
i
-
x
)
2
(x
i
-
x
)
2
f
i
140 |-- 160 7
160 |-- 180 20
180 |-- 200 33
200 |-- 220 25
220 |-- 240 11
240 |-- 260 4

100
Encontre o desvio padro para o salrio destes funcionrios.
CORRELAO E REGRESSO
Introduo:
J trabalhamos com a descrio de valores de uma nica varivel. Quando, porm,
consideramos observaes de duas ou mais variveis surge um novo problema: as relaes
que podem existir entre as variveis estudadas.
Assim, quando consideramos variveis como peso e estatura de um grupo de
pessoas, uso do cigarro e incidncia do cncer, procuramos verificar se existe alguma
relao entre as variveis de cada um dos pares e qual dessa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma funo
matemtica. A regresso o instrumento adequado para determinao dos parmetros
dessa funo. Se todos os valores das variveis satisfazem exatamente uma equao, diz-se
que elas esto perfeitamente correlacionadas ou que h correlao perfeita entre elas.
Quando esto em jogo somente duas variveis, fala-se em correlao e regresso
simples. Quando se trata de mais de duas variveis, fala-se em correlao e regresso
mltipla.
Diagrama de Disperso
Para desenhar um diagrama de disperso, primeiro traa-se o sistema de eixos
cartesianos. Depois se representa uma das variveis no eixo x e a outra no eixo y
Colocam-se, ento os valores das variveis sobre os respectivos eixos e marca-se um ponto
para cada par de valores. Consideremos uma amostra aleatria, formada por dez dos 98
alunos de uma classe da Universidade A e pelas notas obtidas por eles em Matemtica e
Estatstica:
N
o
Notas
Matemtica
(X)
Estatstica
(Y)
01
02
03
04
05
06
07
08
09
5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
10 2,0 2,0
Representando, em um sistema cartesiano
coordenado cartesiano ortogonal, os pares
ordenados (x,y), obtemos uma nuvem de
pontos que denominamos diagrama de
disperso. Esse diagrama nos fornece
uma idia grosseira, porm til da
correlao existente:
DEFINIO 1: Correlao
Dizemos que duas ou mais variveis expressam a relao de causa e efeito ou se elas
variam concomitantemente, so variveis consideradas correlacionadas.
O grau de relacionamento para dados amostrais dado pela seguinte expresso:

,
_

,
_

,
_

,
_

,
_

,
_





n
1 i
2
n
1 i
i
2
i
n
1 i
2
n
1 i
i
2
i
n
1 i
n
1 i
i
n
1 i
i i i
Y Y n X X n
Y X Y X n
r
Onde: n o nmero de observaes;
r o coeficiente de correlao linear para uma amostra.
EXEMPLO 1: Encontre o coeficiente de correlao para os dados da tabela anterior.
(X) (Y)
XY X
2
Y
2
5 6
30 25 36
8 9
72 64 81
7 8
56 49 64
10 10
100 100 100
6 5
30 36 25
7 7
49 49 49
9 8
72 81 64
3 4
12 9 16
8 6
48 64 36
2 2
4 4 4
65 65 473 481 475
911 , 0
525 585
505
65 475 . 10 65 481 . 10
65 . 65 473 . 10
r
2 2

PROPRIEDADE DO COEFICIENTE DE CORRELAAO LINEAR r.


1. O valor de r est sempre entre 1 e 1.
2. O valor de r no varia se todos os valores de qualquer uma das variveis so
convertidos para uma escala diferente.
3. O valor de r no afetado pela escolha de x ou y.
4. r mede a intensidade, ou grau, de um relacionamento linear. No serve para medir a
intensidade de um relacionamento no-linear.
CORRELAO POSITIVA E CORRELAO NEGATIVA
Se as variveis x e y crescem no mesmo sentido, isto , quando x cresce, y tambm
cresce, diz-se que as duas variveis tm correlao positiva.
Ento, notas de matemtica e notas de estatstica dos alunos tem correlao
positiva, porque quando uma das variveis cresce, a outra , em mdia, tambm cresce.
Se as variveis x e y variam em sentido contrrio, isto , quando x cresce, em mdia
y decresce, diz-se que as duas variveis tm correlao negativa. Observe os dados da
Tabela abaixo:
Consumo individual de protenas de origem animal, em gramas, e coeficiente de natalidade,
em 14 pases, 1961.
Pas Consumo
de
protenas
Coef. de
natalidade
Formosa 4,7 45,6
Malsia 7,5 39,7
ndia 8,7 33,0
Japo 9,7 27,0
Iugoslvia 11,2 25,9
Grcia 15,2 23,5
Itlia 15,2 23,4
Bulgria 16,8 22,2
Alemanha 37,3 20,0
Irlanda 46,7 19,1
Dinamarca 56,1 18,3
Austrlia 59,9 18,0
Estados Unidos 61,4 17,9
Sucia 62,6 15,0
Fonte: Castro(1961)

Eixo x = consumo de protenas
Eixo y= coeficiente de natalidade
ANLISE DE REGRESSO
Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais
atributos ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada
elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada
uma das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores
(X
i
; Y
i
). O objetivo visado quando se registra pares de valores (observaes) em uma
amostra, o estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos em que a variao de
um atributo sensivelmente dependente do outro atributo.
O problema consiste em estabelecer a funo matemtica que melhor exprime a
relao existente entre as duas variveis. Simbolicamente a relao expressa por uma
equao de regresso e graficamente por uma curva de regresso.
REGRESSO LINEAR SIMPLES
Modelo: Y
i
= + x
i
+
i
Pressuposies:
a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais
em Y e a razo de crescimento constante).
b) Os valores de X so fixados arbitrariamente ( X no uma varivel aleatria ).
c) Y uma varivel aleatria que depende entre outras coisas dos valores de X.
d)
i
o erro aleatrio, portanto uma varivel aleatria com distribuio normal, com
mdia zero e varincia
2
. [
i
N (0,
2
)].
i
representa a variao de Y que no
explicada pela varivel independente X.
e) Os erros so considerados independentes.
Estimativas dos Parmetros e
As estimativas dos parmetros e dadas por a e b, sero obtidas a partir de
uma amostra de n pares de valores (x
i
, y
i
) que correspondem a n pontos no diagrama de
disperso. Exemplo:
(X) (Y)
5 6
8 9
7 8
10 10
6 5
7 7
9 8
3 4
8 6
2 2
Obtemos ento:
b ax y
i i
+
Para cada par de valores (x
i
, y
i
) podemos estabelecer o desvio:
i i i
y y e
= y
i
-( ax
i
+ b)
Mtodo dos Mnimos Quadrados
O mtodo dos mnimos quadrados consiste em adotar como estimativa dos
parmetros os valores que minimizem a soma dos quadrados dos desvios.
b] - ax - [y = e S
n
1 i
2
i i
n
1 i
2
i

S = f(a, b)
Essa soma, funo de a e de b, ter mnimo quando suas derivadas parciais em
relao a a e b forem nulas.
Para facilitar a escrita, considera-se

n
1 i
[ ]( )
[ ]( )

'

0 x b ax y 2
a
z
0 1 b ax y 2
b
z
i i i
i i
[ ]
[ ]( )

'

0 x b ax y
0 b ax y
i i i
i i

'





0 x b x a y x
0 nb x a y
i
2
i i i
i i

'



0 x a x b y x
n
x a y
b
2
i i i i
i i

Resolvendo-se esse sistema, obtemos as estimativa para o clculo de:
( )

2
i
2
i
i i i i
x x n
y x y x n
a
e a partir da 1 equao
x a y b
No exemplo:
(X) (Y) X.Y X
2
Y
2
5 6
30 25 36
8 9
72 64 81
7 8
56 49 64
10 10
100 100 100
6 5
30 36 25
7 7
49 49 49
9 8
72 81 64
3 4
12 9 16
8 6
48 64 36
2 2
4 4 4
65 65 473 481 475
8632 , 0
585
505
65 481 . 10
65.65 - 10.473
a
2

8892 , 0
10
65
. 8632 , 0
10
65
b
8892 , 0 x 8632 , 0 y
i i
+
PROBABILIDADE
1.1. INTRODUO
Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios.
Os fenmenos determinsticos so aqueles em que os resultados so sempre os mesmos,
qualquer que seja o nmero de ocorrncias.
Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um grande
nmero de repeties do mesmo fenmeno.
Nos experimentos aleatrios, mesmo que as condies iniciais sejam as mesmas, os
resultados finais de cada tentativa do experimento, sero diferentes e no previsveis, por isso,
conveniente dispormos de uma medida para o estudo de tais situaes. Esta medida a
probabilidade.
1.2. EXPERIMENTO ALEATRIO. ESPAO AMOSTRAL. EVENTO
Antes de passarmos definio de probabilidade, necessrio fixarmos os conceitos de
experimento, espao amostral e evento.
Um experimento aleatrio o processo de coleta de dados relativos a um fenmeno que
acusa variabilidade em seus resultados.
EXEMPLOS:
a) lanamento de uma moeda honesta;
b) lanamento de um dado;
c) determinao da vida til de um componente eletrnico;
Espao amostral o conjunto de todos os resultados possveis de um experimento. Vamos
denot-lo por .
EXEMPLOS:
1) No caso do lanamento de um dado, =
2) Uma lmpada ligada e observada at queimar anotando-se os tempos decorridos,
=
Quando o espao amostral consiste em um nmero finito ou infinito numervel de
eventos, chamado espao amostral discreto; e quando for todos os nmeros reais de
determinado intervalo, um espao amostral contnuo.
Um evento um subconjunto de um espao amostral
EXEMPLO: Nos exemplos anteriores 1 e 2. Qual seria um possvel evento para cada um
dos exemplos?
1.1. DEFINIES DE PROBABILIDADE
Seja A um evento de um experimento aleatrio, definimos a probabilidade de A,
denotada por P(A),
que a definio clssica de probabilidade.
EXEMPLO: Na jogada de um dado, qual a probabilidade de aparecer face 3 ou face 5?
Soluo:
EXEMPLO: Consideremos o experimento que consiste em lanar uma moeda 15 vezes.
Suponhamos que o nmero de caras obtido tenha sido 10. Determine a probabilidade do evento
cara:
Soluo:
1.2. OPERAES COM EVENTOS ALEATRIOS
Consideremos um espao amostral finito . Sejam A e B dois eventos de . As
seguintes operaes so definidas.
a) UNIO
O evento unio de A e B equivale ocorrncia de A, ou de B, ou de ambos. Contm os
elementos do espao amostral em que esto em pelo menos um dos dois conjuntos. Denota-se por
AB. A rea hachurada da figura abaixo ilustra a situao.
EXEMPLO: Se A o conjunto dos alunos de um Estabelecimento que freqentam o curso
de Contabilidade e B o conjunto de alunos do mesmo estabelecimento que fazem Cincia da
Computao, ento:
AB =

b) INTERSECO
O evento interseco de dois eventos A e B equivale ocorrncia de ambos. Contm
todos os pontos do espao amostral comuns a A e a B. Denota-se por AB. A interseco
ilustrada pela rea hachurada do diagrama abaixo.
EXEMPLO: Seja A o conjunto de alunos de uma Instituio que freqentam o 2

grau, e B
o conjunto dos que freqentam um curso facultativo de interpretao musical. A interseo AB
dada por:
AB =
c) EXCLUSO
veis casos poss Nmero de
rveis casos favo Nmero de
P(A)
Dois eventos A e B dizem-se mutuamente exclusivos ou mutuamente excludentes quando
a ocorrncia de um deles impossibilita a ocorrncia do outro. Os dois eventos no tm nenhum
elemento em comum. Exprime-se isto escrevendo AB = . O diagrama a seguir ilustra esta
situao.
EXEMPLO: Na jogada de um dado, seja A o evento aparece nmero par e B o evento
aparece nmero mpar. Ento AB =
d) NEGAO
EXEMPLO: Se, na jogada de um dado, o evento A consiste no aparecimento de face par,
seu complementar dado por:
A
REGRAS BSICAS
Se A e B so dois eventos do espao amostral , ento valem as seguintes regras bsicas:
0 P(A) 1
P(A) = 0 o evento impossvel e P(A) = 1 o evento certo.
P( ) = 1
Se A e B so eventos mutuamente excludentes, AB = , ento: P(AB)
= P(A) + P(B).
Se AB

, ento: P(AB) = P(A) + P(B) P(AB).


P(A) = 1- P(A).
Se o vazio, ento P() =0.
EXERCCIO : Consideremos os alunos matriculados na disciplina de Estatstica. Temos
_____ homens com mais de 25 anos, _____ homens com menos de 25 anos, ____ mulheres com
mais de 25 anos, ____ mulheres com menos de 25 anos. Uma pessoa escolhida ao acaso dentre
os ____. Os seguintes eventos so definidos:
A: a pessoa tem mais de 25 anos; C: a pessoa um homem;
B: a pessoa tem menos de 25 anos; D: a pessoa uma mulher.
Calcular: P(BD) e P(AC).
Testes de Hipteses
Nesta seo, vamos admitir um valor hipottico para o parmetro desconhecido - as
hipteses estatsticas - e, depois utilizar a informao da amostra para aceitar ou rejeitar
esse valor hipottico.
Por exemplo, com base na produtividade de uma hortalia cultivada em uma rea,
onde for usado um novo fertilizante, e em outra rea onde se utiliza o fertilizante
padro, temos de decidir se o novo fertilizante , ou no, melhor. A dificuldade aqui - e
da a necessidade de dados estatsticos - que a produtividade varia de planta para
planta.
abaixo. figura na hachurada
parte na ilustrada . de ar complement evento chamada por denotada , evento do negao A A A A
Os testes de hipteses permitem-nos tomar decises em presena da variabilidade, ou
seja, verificar se estamos diante de uma diferena real (significativa) ou de uma
diferena devida simplesmente flutuao aleatria inerente ao processo.
Na realizao de um teste, so feitas duas hipteses: a hiptese nula (H
0
), que ser
testada, e a hiptese alternativa (H
1
), que ser aceita caso nosso teste indique a rejeio
da hiptese nula.
Exemplos :
1- Indique as hipteses nula e alternativa para cada uma das situaes:
a) Tubos galvanizados devem ter mdia de 2 polegadas para serem aceitveis.
b) Um fabricante de conservas deseja evitar excesso no enchimento de potes de 12
oz. De gelia.
2- Para cada um dos casos seguintes, decida se adequado um teste unilateral ou um
teste bilateral, trace a curva normal para ilustrar o teste.
a) H
0
: =10 , H
1:
10, =0,02
b) H
0
: =0,037 , H
1:
>0,037, =0,05
c) H
0
: =3,2 , H
1:
<3,2, =0,01
Tipos de Erros
O esquema a seguir mostra os erros que podemos cometer:
Concluso do teste H
0
verdadeira H
0
falsa
No rejeitar H
0
Correto Erro tipo II
Rejeitar H
0
Erro tipo I Correto
Procedimento para se efetuar um teste de hiptese
1) Enunciar as hipteses H
0
e H
1
;
2) Fixar-se o limite de erro e identificar-se a varivel do teste;
3) Determinar-se a regio crtica em funo da varivel tabelada;
4) Calcular o valor da varivel do teste, obtido na amostra;
5) Aceitar ou rejeitar a hiptese nula de acordo com a estimativa obtida no item 4,
em comparao com a regio crtica estabelecida no 3) passo.
Valores crticos de z em testes de hipteses
Nvel de
significncia
Tipo de teste
unilateral bilateral
5% +1,65 ou
-1,65
t 1,96
1% +2,33 ou
-2,33
t 2,58
Teste para a mdia (
2
conhecido)
1) Enunciar as hipteses:
H
0
: =
0
H
1
:


>
<

'

0
0
0



( )
( )
( )
a
b
c
2) Fixar o nvel de significncia .
Admitindo-se que conhecemos a varincia populacional a varivel do teste ser a
distribuio Normal (Z)
3) Regio crtica
4) Calcular:
onde:
X
= mdia amostral

0
= valor da hiptese nula
= desvio padro da populao
n = tamanho da amostra
5) Concluses:
a) Se Z > z rejeita-se H
0
(para um teste bicaudal)
b) Se Z > z rejeita-se H
0
(para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H
0
(para um teste unicaudal a esquerda).
Exemplo 2: Uma mquina automtica de encher pacotes de erva mate, enche-os
segundo uma distribuio normal com mdia e desvio padro de 20g. A mquina foi
regulada para =500g. Desejamos verificar se a produo esta sob controle, para isto
analisamos uma amostra de 30 pacotes. Se uma amostra apresentar mdia
X
=492g,
voc pararia ou no a produo para verificar se a mquina deve ser regulada? Use
=1%.
1
o
Passo:
2
o
Passo:
3
o
Passo:
4
o
Passo:
n
X
Z

5
o
Passo:
Teste para a mdia (
2
desconhecido; n < 30)
Neste caso usaremos a distribuio tde Student. Logo no 4
o
e 5
o
passo teremos:
4) Calcular:
onde:
X
= mdia amostral

0
= valor da hiptese nula
S = desvio padro da amostra
n = tamanho da amostra
5) Concluses:
b) Se T > t rejeita-se H
0
(para um teste bicaudal)
b) Se T > t rejeita-se H
0
(para um teste unicaudal a direita).
c) Se T < -t rejeita-se H
0
(para um teste unicaudal a esquerda).
Exemplo 3: Um fabricante afirma que a mdia de vida til das lmpadas por ele
fabricadas de 4.200 horas. A mdia da vida til para uma amostra de N=10 lmpadas
de 4.000 horas com um desvio padro de amostral de S=200 horas. A vida til das
lmpadas segue uma distribuio normal. Teste a afirmao do fabricante a um nvel de
significncia de 5%.
1
o
Passo:
2
o
Passo:
3
o
Passo:
4
o
Passo:
5
o
Passo:
Teste de diferena entre mdias:
Amostras Dependentes.
Neste caso usaremos a distribuio tde Student. Logo no 4
o
e 5
o
passo teremos:
4) Calcular:
n
S
X
T
0

onde:
d
= valor mdio das diferenas d para os
dados
amostrais emparelhados( dependentes)
d

= mdia das diferenas d para a


populao de dados emparelhados.
S
d
= desvio padro das diferenas d para os
dados amostrais emparelhados
n = nmero de pares de dados.
Graus de liberdade = n-1.
5) Concluses:
c) Se T > t rejeita-se H
0
(para um teste bicaudal)
b) Se T > t rejeita-se H
0
(para um teste unicaudal a direita).
c) Se T < -t rejeita-se H
0
(para um teste unicaudal a esquerda).
Exemplo: Utilizando um cronometrador de reao foi obtido a tabela abaixo, no nvel de
0,05 de significncia, teste a afirmao de que h uma diferena entre a mdia dos
tempos de reao da mo direita e da mo esquerda.
Pessoa A B C D E F G H I J K L M N
Direita 191 97 116 165 116 129 171 155 112 102 188 158 121 133
Esquerd
a
224 171 191 207 196 165 177 165 140 188 155 219 177 174
d -33 -74 -75 -42 -80 -36 -6 -10 -28 -86 33 -61 -56 -41
1
o
Passo:
2
o
Passo:
3
o
Passo:
4
o
Passo:
5
o
Passo:
Amostras Grandes e Independentes.
Neste caso usaremos a distribuio Normal. Logo no 4
o
e 5
o
passo teremos:
4) Calcular:
n
S
d
T
d
d

2
2
2
1
2
1
2 1 2 1
n

) ( ) x x (
Z
+

OBS: Se no conhecemos os valores de


1
e
2
, podemos substitu-los por s
1
e s
2
,
desde que ambas as amostras sejam grandes.
5) Concluses:
d) Se Z > z rejeita-se H
0
(para um teste bicaudal)
b) Se Z > z rejeita-se H
0
(para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H
0
(para um teste unicaudal a esquerda).
Exemplo:
1) Os alunos de uma faculdade selecionaram aleatoriamente 217 carros de
estudantes e constataram que a mdia de suas idades era de 7,89 anos, com desvio
padro de 3,67 anos. Selecionaram tambm, aleatoriamente, 152 carros do corpo
docente e do pessoal da administrao, constatando uma mdia de 5,99 anos e um
desvio padro de 3,65 anos. No nvel de significncia de 0,05, teste a afirmao de que
os carros dos estudantes so mais velhos do que os dos professores e demais
funcionrios.
1
o
Passo:
2
o
Passo:
3
o
Passo:
4
o
Passo:
5
o
Passo:
Amostras Pequenas e Independentes.
Neste caso usaremos a distribuio Normal. Logo no 4
o
e 5
o
passo teremos:
4) Calcular:
2
2
p
1
2
p
2 1 2 1
n
s
n
s
) ( ) x x (
T
+

Onde
) 1 n ( ) 1 n (
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
p
+
+

e o grau de liberdade gl = n
1
+n
2
-2.
5) Concluses:
e) Se Z > z rejeita-se H
0
(para um teste bicaudal)
b) Se Z > z rejeita-se H
0
(para um teste unicaudal a direita).
c) Se Z < -z rejeita-se H
0
(para um teste unicaudal a esquerda).
Exemplo:
Os dados amostrais a seguir apresentam os nveis de concentrao de lcool no sangue
por ocasio da priso de criminosos selecionados aleatoriamente, e que foram condenados
por dirigirem embriagados. Os dados so categorizados por tipo de bebida consumida.
Cerveja Usque
0,129 0,154 0,187 0,185 0,225 0,247
0,146 0,155 0,19 0,19 0,226 0,253
0,148 0,164 0,203 0,22 0,227 0,257
0,224 0,241
Com o nvel de 0,05 de significncia, teste a hiptese de que os bebedores de cerveja e os de
usque e semelhantes tm os mesmos nveis concentrao de lcool no sangue.
02427 , 0 s e 164 , 0 x
1 1

e
02317 , 0 s e 227 , 0 x
2 2

1
o
Passo:
2
o
Passo:
3
o
Passo:
4
o
Passo:
5
o
Passo:
Teste para uma proporo
Devemos calcular:
onde:
p
= proporo amostral
p
0
= valor da hiptese nula
n = tamanho da amostra
Exemplo: Uma estao de televiso afirma que 60% dos televisores estavam ligados no
seu programa especial do ltimo sbado. Uma rede competidora deseja contestar essa
afirmao e decide, para isso, usar uma amostra de 200 famlias. Destas 200 famlias
104 responderam afirmativamente. Ao nvel de 5% de significncia qual a sua
concluso?
1
o
Passo:
n
p p
p p
Z
) 1 (
0

2
o
Passo:
3
o
Passo:
4
o
Passo:
5
o
Passo:
Teste para duas propores
Devemos calcular:
onde:
1
p
=
1
1
n
x
(proporo
amostral)
p
1
= proporo populacional
n
1
= tamanho da amostra
2 1
2 1
n n
x x
p
+
+

e
p 1 q
.
Exemplo: Pesquisadores fizeram um estudo de empregadas da IBM que estavam
grvidas. De 30 empregadas que lidavam com ter-glicol, 10 (ou 33,33%) tiveram
aborto (espontneo), mas, de 750 que no estavam expostas ao ter-glicol, apenas 120
(ou 16%) abortaram. No nvel de 0,01 de significncia, teste a afirmao de que as
mulheres expostas ao ter-glicol apresentam maior taxa de aborto.
1
o
Passo:
2
o
Passo:
3
o
Passo:
4
o
Passo:
5
o
Passo:
2 1
2 1 2 1
n
q . p
n
q . p
) p p ( ) p

(
Z
+

Você também pode gostar