Você está na página 1de 58

Unidade I

MATEMTICA INTEGRADA

Prof. Gastn Henriquez

Agenda
Apresentao
Introduo
Amostragem
Correlao linear
Regresso linear
Estimativa de parmetros

Introduo
A estatstica apresenta um referencial
terico para a coleta, a organizao e o
tratamento de informaes no mbito da
Cincia, dos processos industriais e
comerciais, bem como de situaes
cotidianas.
cotidianas

Amostragem
A escolha do mtodo a ser utilizado na
amostragem deve garantir uma amostra
representativa da populao em relao
ao interesse que se tem sobre ela, tanto
em gnero como em nmero.
A utilizao de amostras na realizao de
pesquisas justificada pelo fato de que
as populaes (universo) nem sempre
so totalmente acessveis.
Tempo e custo so fatores decisivos na
opo pela amostragem.

Tipos de amostragem
Amostragem probabilstica:
Neste caso, cada elemento da populao
tem probabilidade conhecida e diferente
de zero de pertencer amostra.
Amostragem no probabilstica:
Neste mtodo, feita uma escolha
deliberada dos elementos que iro
comp-la.
Os resultados dessa amostra no podem
ser generalizados para a populao; a
confiabilidade diminui.

Tcnicas de amostragem (I)


Amostragem aleatria simples:
Todos os elementos da populao tm a
mesma probabilidade de pertencer
amostra.
A determinao dos elementos pode ser
feita por tabela de nmeros aleatrios e
sorteios.
Seja N o nmero de elementos da
populao e n o no de elementos de
uma amostra A = {a1, a2,..., an}. Cada
elemento da populao tem
probabilidade n/N de pertencer
amostra.
Assim, p(an) = n/N.
Por definio, 0 < p(A) < 1.

Tcnicas de amostragem (II)


Amostragem aleatria estratificada:
Utilizada quando a populao em
questo heterognea. Ela se divide em
subpopulaes homogneas, chamadas
de estratos. Dessa forma, a varivel em
estudo pode apresentar comportamento
homogneo dentro de cada estrato.
Exemplo: selecionar uma amostra com
nmeros de homens e mulheres
proporcionais composio de homens
e mulheres existentes na populao, por
classe social.

Tcnicas de amostragem (III)


Amostragem por conglomerados:
Existem alguns casos em que pode ser
muito fcil a identificao dos elementos
em alguns subgrupos (conglomerados)
dessa populao. Pode ser realizada
nessa situao uma amostra aleatria
simples desses conglomerados. Em
cada conglomerado sorteado, faz-se a
contagem completa dos elementos.
Exemplos comuns de conglomerados:
turmas de escolas, quarteires de
bairros etc.
O IBGE utiliza muito esse tipo de
amostragem.

Tcnicas de amostragem (IV)


Amostragem sistemtica:
Utilizada quando os elementos da
populao se apresentam ordenados de
acordo com algum critrio. Um exemplo
seria a retirada de elementos de uma
amostra, periodicamente, a partir de
listas.
Amostragem em mltiplas etapas:
Tcnica utilizada para produzir uma
amostra representativa de uma
populao muito espalhada. Similar
tcnica por conglomerados, mas nesse
caso, o processo s finalizado quando
h seleo de unidades individuais de
amostragem.

Dados de uma amostra


As formas que os dados de uma amostra
so explorados podem mudar
completamente um estudo.
Em um estudo, o cuidado na escolha da
amostra importante para o emprego
adequado dos mtodos estatsticos.
Existem vrias tcnicas de amostragem
que podem ser utilizadas para facilitar o
trabalho de pesquisa, evitando, dessa
forma, um custo excessivo e
desnecessrio na caracterizao de
todos os elementos de uma populao.

Interatividade
A Secretaria de Educao de um municpio
deseja investigar os casos de fraude e burla
da fila de espera para matrcula de alunos
na rede municipal de ensino. Assim,
analisam-se (1) as listas de espera com
ordenao por data de insero dos
candidatos; (2) listas de alunos
matriculados, ordenados por data de
matrcula. A tcnica de amostragem
adotada :
a) Amostragem aleatria simples
simples.
b) Amostragem aleatria estratificada.
c) Amostragem sistemtica.
d) Amostragem em mltiplas etapas.
e) Amostragem no probabilstica.

Correlao linear
O significado do termo correlao a
existncia da relao em dois sentidos
(co + relao). O termo usado em
estatstica para demonstrar a fora da
relao entre dois conjuntos de dados.
Verificar se a possvel existncia e o
grau de relao entre as variveis so
objetos de estudo da correlao.
Exemplo: a estatura de uma pessoa e o
seu peso. Para uma estatura maior,
corresponde, em geral, a um peso maior.
Dizemos, por isso, que entre as variveis
peso e estatura existe correlao.

Coeficiente de correlao de
Pearson
O coeficiente de correlao linear, ou
coeficiente de Pearson, indica se existe
correlao entre as variveis analisadas.
Existir correlao linear se esse
coeficiente estiver entre -1 e + 1, o que
em porcentagem representa um valor
entre -100% e + 100%.

Coeficiente de correlao de
Pearson: clculo
Esse coeficiente calculado assim:
r = coeficiente de correlao
x = varivel independente
y = varivel dependente
n = nmero de possveis correlaes
entre as variveis

r=

Tipo de correlao, segundo o


coeficiente de correlao r

Correlao positiva
Dizemos que existe uma correlao
positiva entre duas variveis quando o
aumento da varivel independente
resulta no aumento da varivel
dependente.
Exemplo:
Se o aumento de horas extras (varivel
independente) corresponder ao
crescimento da produtividade de uma
empresa (varivel dependente), ento
ocorre correlao positiva.

Diagrama de disperso
Os diagramas de disperso mostram o
comportamento da relao entre
variveis em decorrncia do coeficiente
de correlao linear.

Correlao negativa
Dizemos que existe uma correlao
negativa entre duas variveis quando o
aumento da varivel independente
resulta no decrscimo da varivel
dependente.
Exemplo:
Se o aumento das horas de atividades
fsicas (varivel independente)
corresponder diminuio do peso dos
pacientes (varivel dependente), ento
ocorre correlao negativa.

Diagrama de disperso

Exemplo de aplicao
Deseja-se estudar as despesas com
investimentos em treinamento de
pessoal e a produtividade (toneladas)
durante certo perodo de uma empresa.
Pede-se:
a) Verificar se existe correlao entre as
variveis.
b) Em caso afirmativo, que tipo de
correlao: positiva ou negativa?
Fraca, forte ou moderada? Justifique.

Tabela: investimento (R$) x


produtividade (toneladas)

Clculo das somatrias


Primeiro passo, calcular as somatrias:
x, y, x, y e x.y

Clculo do coeficiente de
correlao r

r=

r=
r=
r=

= 0,95

Concluso
a) Existe correlao entre as variveis.
b) A correlao linear forte e positiva,
uma vez que o coeficiente r se encontra
dentro do intervalo 0,8 r < 1, conforme
classificao.
Pode-se concluir que:
o aumento do investimento em
treinamento de pessoal aumenta a
produtividade.

Interatividade
Um empresrio analisou 6 registros dos
gastos com manuteno e o nmero de
lotes produzidos de determinado
componente de uma fbrica. Depois de
tabulados os dados, obteve-se x = 33,
y = 152
152, xy = 714,
714 x = 199
199, y = 5386
5386. O
coeficiente de correlao entre as variveis
:
a) r = 0,75
b) r = 0,70
c) r = -0,74
d) r = -0,75
e) r = 0,80

Regresso linear
O uso da anlise de regresso tem como
prioridade fazer previses, estimativas
ou projees.
O objetivo desenvolver um modelo
estatstico que ser usado para estimar
valores de uma varivel dependente y em
funo de uma varivel independente x.

Conceito de regresso linear


A regresso linear um mtodo para se
estimar valores da varivel y, dados
outros valores das variveis x, ou seja,
trata-se de uma tcnica estatstica em
que se deseja estimar um valor
condicional esperado
esperado.
O modelo de regresso linear chamado
linear porque levamos em considerao
que a relao entre as variveis uma
funo linear de alguns parmetros.

Diagrama de disperso
Um instituto de pesquisa administra o
desenvolvimento de seus pesquisadores
de acordo com o nmero de entrevistas
realizadas por eles e com os respectivos
tempos de experincia.
Sendo assim, esse instituto de pesquisa
deseja desenvolver um modelo para
prever o nmero de entrevistas em um
certo dia. Acredita-se que a experincia
do entrevistador (medida em semanas
trabalhadas) determinante em relao
ao nmero de entrevistas realizadas.
Uma amostra de 10 entrevistadores
revelou os seguintes dados:

Tabela e diagrama de disperso

Sendo y = nmero de entrevistas


realizadas e x = semanas de experincia
experincia,
inicialmente construmos o diagrama de
disperso.

Diagrama de disperso

A anlise do grfico indica uma relao


entre as variveis. Quando o nmero de
semanas trabalhadas aumenta
(aumentando a experincia do
entrevistador), o nmero de entrevistas
realizadas tambm aumenta.

Determinao da equao de
regresso linear simples
Em que:
y = valor previsto para um valor dado de x

y = a + bx: b = inclinao da reta


x = valor dado
a=

Sendo:

=
=

-b

b=

n= nmero

de
d possveis
i
correlaes entre x e y

Aplicao prtica
Em um exemplo j estudado, calculamos
o coeficiente de correlao entre as
despesas com investimentos em
treinamento de pessoal e a produtividade
(toneladas) investigada durante certo
perodo de uma empresa
empresa. Obter a
equao da reta para o investimento em
treinamento de pessoal e a produtividade
da empresa.
Vamos usar as somatrias calculadas:
n = 10;

x = 80;

x2 = 756;

y2 = 7097;

y = 255;

x.y = 2289.

Soluo da aplicao prtica


Equao da reta de regresso: y = a + bx
Clculo da inclinao da reta: b

b=

b=
b=

b = 2,15

Clculo das mdias x e y e a:

=8

= 25,5

a=

-b

a = 25,5 2,15.8
a = 25,5 17,2
a = 8,3

Substituindo a e b na equao da reta:


y = a + bx
b
Logo:
y = 8,3 + 2,15x

Estimativa de parmetros
O mtodo de estimao de parmetros
utilizado para se obter estimadores em
casos especficos, por exemplo, quando
fazemos alguma hiptese sobre algum
parmetro relativo distribuio da
populao Esse processo utiliza dados
populao.
da amostra para fazer a estimativa de
valores de parmetros populacionais.
Estimativa e o valor numrico assumido
pelo estimador, ou seja, valor
aproximado do parmetro,
parmetro calculado
com base na amostra.

Parmetros (populao) e
estatsticas (amostra)
Entre os estimadores mais comuns esto:
Amostras
Mdia amostral:

Desvio padro amostral: s

Populao
Mdia populacional:
Desvio padro populacional:

Teorema do limite central


Para entender o Teorema do Limite
Central, preciso ter claros os conceitos
de distribuio amostral e de
distribuio amostral de mdias das
amostras.
Assim:
Distribuio amostral pode ser definida
como a distribuio de probabilidade de
uma estatstica qualquer da amostra,
formada a partir de repetidas amostras
de tamanho n coletadas de uma
populao.
Distribuio amostral de mdias
das amostras quando a estatstica da
amostra sua mdia.

Distribuio amostral
Considere todas as amostras possveis
de tamanho n que podem ser retiradas
de uma populao de tamanho N (com
ou sem reposio).
Para cada amostra, possvel calcular
uma grandeza estatstica, como a mdia,
mediana, varincia, desvio padro etc.;
que ir sofrer uma variao de uma
amostra para outra.
Assim, obtm-se uma distribuio da
grandeza calculada de cada amostra
possvel de ser extrada, denominada
distribuio amostral.

Propriedades das distribuies


amostrais de mdias das amostras
A mdia das mdias das amostras (x)
considerada igual mdia
populacional .
O desvio padro das mdias das
amostras (x) igual razo do desvio
padro populacional pela raiz
quadrada de N.

O desvio padro da distribuio amostral


de mdias das amostras chamado de
erro padro da mdia.

Interatividade
Um empresrio analisou 6 registros de
gastos com manuteno e o nmero de
lotes produzidos de determinado
componente de uma fbrica. Depois de
tabulados os dados, obteve-se x = 33,
y = 152
152, xy = 714,
714 x = 199
199, y = 5386
5386. A
equao da reta de regresso linear :
a) y = 63,67x 6,97
b) y = -38,67x 6,97
c) y = -63,67x
63,67x 6,97
d) y = -6,97 x 38,67
e) y = -6,97x + 63,68

Intervalo de confiana para a mdia


populacional (n30)
A distribuio das mdias amostrais se
aproxima de uma distribuio normal.
= nvel de significncia populacional:
(mais usados so 1% e 5%).

Diagrama: regio de aceitao e


regio crtica
- Zc e + Zc so valores crticos obtidos a
partir da tabela de distribuio normal.

Zc

1 - = nvel de confiana do intervalo.

Intervalo de confiana para a mdia


populacional (n30)
Para amostras grandes, temos:
P( -ZC < Z < +ZC ) = (1 - )
Se o desvio padro populacional for
conhecido:

P( -z .

<<

+z

) = (1
( ))

Amostragem de populao infinita ou


amostragem de populao finita com
reposio:

P ( zc . < <

+ zc . = (1 )

Intervalo de confiana para a mdia


populacional (n30)
Se o desvio padro populacional for
desconhecido e n 30:
Normalmente, o desvio padro da
populao no conhecido e
necessrio, ento, em substituio a ,
usar a estimativa do desvio padro S
obtida da amostra, com a condio de
que n 30.

Intervalo de confiana para mdia


populacional (n<30)
Caso n < 30, a aproximao pela curva
normal no ser suficiente, devendo ser
feita uma correo usando-se a varivel t
de Student.

Clculo de tc: distribuio t-Student


Temos a varivel com distribuio t de
Student (tc), com grau de liberdade.

tc =
O grau de liberdade definido como:
g.l = n 1.

P ( - tc .

+ tc .

) = (1 )

Exemplo
Uma amostra de 10 medidas do dimetro de
uma esfera apresenta mdia de 4,38 e
desvio padro de 0,06. Determine os limites
de confiana de 99% para o dimetro
efetivo (populao infinita).
Soluo:
x = 4,38
n = 10 (n < 30) (Distribuio t-Student)
S = 0,06
g.l. = n - 1 = 10 -1 = 9
1 - = 0,99, ento = 0,01

Consulta tabela (Distr. T-Student)


Consultando a tabela de distribuio t
Student com = 0,01 e g.l. = 9:

Valor tabelado encontrado : tc = 3,250

Soluo (continuao)
Clculo do intervalo de confiana:
P ( - tc .

<<

P (4,38 3,25 .

+ tc .

) = (1 )

< < 4,38 + 3,25.

) = (1 - 0,01)

P (4,32 < < 4,44) = 0,99


P (4,32 < < 4,44) = 99%
Resposta:
Pelo resultado encontrado,
encontrado com 99% de confiana,
confiana
podemos admitir que a verdadeira mdia populacional
() esteja contida no intervalo 4,32 4,44.

Intervalo de confiana para a


varincia e o desvio padro
A construo do intervalo de confiana
para a varincia feita utilizando-se a
distribuio de X (l-se qui-quadrado),
sendo definido por:

= (1 ))

O valor de X tabelado sendo:


com ; ( n- 1) graus de liberdade (g.l.)
(g l ) e
com 1- ; ( n- 1) g.l.

Exemplo de aplicao
A amostra a seguir refere-se s vendas
em kg de uma amostra de produtos
hortigranjeiros de certo estabelecimento.
Construa um intervalo de confiana para
o desvio padro populacional das
vendas com nvel de confiana de 90%
vendas,
90%.
Vendas - xi: 2, 2, 4, 4, 5, 7, 8, 8, 8, 9, 9
Soluo:
Mdia aritmtica das vendas.

= 6,0 kg

Soluo (continuao)
Determinao do desvio padro amostral
das vendas.

=
s =

s = 7,2

Clculo do intervalo de confiana

= (1 )

com

= 5% = 0,05 e

g.l.:
l ( n- 1) = (11 1) = 10
= 18,307
com 1-

=1-

g.l.
l ( n- 1) = (11-1)
(11 1) = 10
= 3,940

= 95% = 0,95 e

Clculo do intervalo de confiana

P(

= (1 )

) < <

) = (1- 0,10)

P(

< <

) = 0,90

P(

< <

) = 0,90

P (3,933 18,274) = 0,90

Soluo (continuao)
Intervalo de confiana para a varincia:

P (3,933 18,274) = 0,90


Intervalo de confiana para o desvio padro:
P(

< <

) = 0,90
0 90

Resposta
O desvio padro populacional com uma
confiana de 90%, est situado no
i t
intervalo
l 1,983
1 983 e 4,275.
4 275

Concluso
Um Intervalo de Confiana (IC) um
intervalo estimado a respeito de um
parmetro estatstico.
Em vez de fazermos a estimativa do
parmetro por apenas um valor, dado
um intervalo de estimativas provveis.
O quanto sero provveis essas
estimativas, ou seja, o quanto podemos
confiar nelas, determinado pelo
coeficiente de confiana ().

Interatividade
Sabe que a vida til de uma pea de
equipamento tem = 5h. Uma amostra de
100 unidades dessas peas forneceu
x = 500h.
O intervalo de confiana com nvel de 95%
para mdia :
a) 499,42 < < 500,98
b) 498,32 < < 499,98
c) 499,12 < < 500,78
d) 499,02 < < 500,98
e) 501,02 < < 501,98

AT A PRXIMA!