Você está na página 1de 33

UNIVERSIDADE FEDERAL DE SO PAULO UNIFESP

ENGENHARIA QUMICA NOTURNO


UC: Estatstica

Experimento:
Estudo do lanamento de um avio de papel e probabilidade envolvida
na retirada das cartas de copas de um baralho.

Prof. Dr. Jos Ermrio Ferreira de Moraes

Alunas:
Eslaine Shirlei da Rocha - 78220
Isabela Pinheiro Leme - 85178
Nadia Santanna Barbosa - 85237
Thais dos Santos Nazareth - 78467

2015
Sumrio

Resumo
O experimento relatado a seguir, refere-se ao estudo do lanamento de um
avio de papel, bem como a probabilidade envolvida na retirada das cartas de
copas de um baralho. Utilizando-se um avio simples de papel, o mesmo foi
lanado 100 vezes a uma altura fixa. Os tempos de queda foram tabelados e
transpostos para grficos, e clculos foram feitos, tudo para melhor observao
e anlise da massa de dados. Na segunda etapa do experimento, utilizando-se
um baralho com 52 cartas, 20 cartas foram retiradas uma a uma sem reposio
durante 40 rodadas, verificando-se quantas cartas de copas eram sacadas em
cada rodada. Em seguida, o problema foi analisado para verificar o modelo
adequado para solucion-lo e clculos foram realizados para determinao da
probabilidade envolvida no evento. Por fim grficos foram montados para
complementar a anlise.

Introduo
A palavra "Estatstica" tem origem latina e significa estado. Ela era utilizada
pelos governantes dos Estados como um meio de administrao.
"Desde a Antiguidade vrios povos j registravam o nmero de habitantes, de
nascimento, de bitos, faziam estimativas das riquezas individual e social,
distribuam equitativamente terras ao povo, cobravam impostos e at
realizavam inquritos quantitativos por processos que, hoje, se chama de
Estatstica" (Anlise Exploratria de Dados, 2011).
Hoje, a estatstica abrange todas as reas do conhecimento, sendo definida
como um conjunto de mtodos e processos quantitativos que servem para
estudar e medir os fenmenos coletivos.
Ela no se limita exclusivamente em construir grficos e calcular mdias, ela
vai muito alm, por meio desta ferramenta informaes numricas podem ser
coletadas e avaliadas, auxiliando a tomada de decises. Assim, a estatstica
pode ser enxergada como um conjunto de tcnicas para planeja experimentos,
obter dados, organiz-los, resumi-los, analis-los e deles obter concluses.
O engenheiro aquela pessoa que utilizando mtodos cientficos, solucionam
problemas de interesse da sociedade, tendo por mtodo abordar e resolver
problemas, sendo formado por vrias etapas:
- Desenvolvendo uma descrio objetiva e resumida do problema;
- Identificar os fatores que influenciam este problema ou que tenham um papel
importante na soluo deste problema;
- Utilizando o conhecimento cientfico, propor uma soluo para o mesmo;
- Conduzir experimentos, coletando dados para analis-los e assim validar o
modelo ou tirar concluses das etapas anteriores;
- Refinar o modelo com base nos dados coletados;
- Manipular o modelo, tendo em vista obter a soluo do problema;
- Conduzir o experimento de forma adequada afim de obter a soluo do
problema de forma eficiente;
- Tirar concluses ou at mesmo fazer recomendaes com base na soluo
do problema.
"Ela lida com a coleta, apresentao, anlise e uso dos dados para tomar
decises, resolver problemas e planejar produtos e processos" (Estatstica
Aplicada e Probabilidade para Engenheiros, 2012).
Os princpios bsicos de coleta de dados estatsticos so:
- Estudo retrospectivo utilizando dados histricos;
- Estudo de observao;
- Experimento planejado.
A Estatstica pode ser dividida em duas reas:
- Descritiva: est preocupada com a organizao, apresentao e sntese de
dados. Para isto ela utiliza como ferramentas grficos, tabelas e medidas
descritivas. utilizada na etapa inicial de anlise, com o objetivo de coletar
informaes que indiquem possveis modelos que possam ser utilizados na
fase final (inferncia estatstica).

- Inferencial (Indutiva): postula conjunto de tcnicas que iro permitir a


utilizao de dados originados de uma amostra para generalizao para toda a
populao. As tcnicas que a constituem so:
Determinao do nmero de observaes (tamanho da amostra);
Seleo dos dados observados;
Clculo das medidas estatsticas;
Determinao da confiana nas estimativas
Significado dos testes estatsticos;
Preciso das estimativas;
etc.
A generalizao feita por meio do processo de estimao das medidas
estatsticas (por meio de clculos). No entanto, necessrio ter um grau de
certeza de que a amostra fornea dados que seriam obtidos caso toda a
populao fosse estudada.
importante que se saiba distinguir a diferena entre amostra e populao. A
populao pode ser definida como: "o conjunto constitudo por todos os
indivduos que representam pelo menos uma caracterstica comum, cujo
comportamento interessa analisar (inferir)" (Anlise Exploratria de Dados,
2011).
J a amostra pode ser definida como: "subconjunto, uma parte selecionada da
totalidade de observaes abrangidas pela populao, atravs da qual se faz
inferncia sobre as caractersticas da populao." (Anlise Exploratria de
Dados, 2011). Assim, ela deve ser representativa, requerendo cuidados para o
manuseio para que os resultados no sejam distorcidos.
importante saber diferenciar a exatido da preciso:
Exatido: indica o quo prximo do valor real (do valor normalmente aceito
como referncia), est o valor medido.
Preciso: indica o quanto as medidas repetidas esto prximas umas das
outras.

Figura 4 - Distino entre exatido e preciso.


Fonte: Mundo Educao

No primeiro, o atirador foi exato, mas no foi preciso, porque apesar de


estarem perto do alvo central, os dardos esto distantes uns dos outros. No
segundo, ele foi preciso, mas no foi exato, porque os dardos esto prximos
uns dos outros, mas esto distantes do ponto central. O terceiro est exato e
preciso, e, no ltimo, o atirador no foi preciso nem exato.
As variveis envolvidas podem ter carter quantitativo ou qualitativo. As
variveis qualitativas podem ser entendidas como aquelas variveis que
assumem uma categoria, uma classe ou mesmo rtulo. Por sua vez, as
variveis quantitativas so aquelas que assumem valores numa escala mtrica
tendo uma origem e uma unidade.
Abaixo apresentada uma tabela de classificao das variveis:

Tabela 1 - Classificao das variveis


Fonte: Anlise Exploratria de Dados, 2011
As medidas de tendncia central so aquelas medidas que geram um valor em
torno do qual os dados observados se distribuem, visando resumir em um
nico nmero o conjunto de dados. So elas: mdia aritmtica, mediana e
moda.
A mdia aritmtica obtida a partir da soma de todos os valores da srie pelo
nmero de observaes. A frmula pode ser assim expressa:

ou

A mediana o valor que ocupa o valor central em um conjunto de valores


ordenados, dividindo o conjunto de dados ordenados em duas partes iguais.
Por exemplo:
13,1 13,1 13,1 13,2 13,3 13,5 13,5 13,7 13,7 13,8
Neste exemplo, a a srie possui um nmero par de observaes. Assim, tmse dois valores centrais: 13,3 e 13,5. Logo, a mediana 13,4 cm. Para esta
segunda srie:
13,1 13,1 13,1 13,2 13,3 13,5 13,5 13,7 13,7 13,8 14,0
A srie possui um nico valor central. Assim, a mediana igual a 13,5 cm.
A moda o valor que se repete com maior frequncia. Se no ocorre repetio
de valores, no existe moda. Tomando os exemplos acima, 13,1 a moda pois
em ambas as sries o valor que se repete com maior frequncia.
Para se medir o grau de disperso dos valores em torno da mdia vlido
analisar o comportamento de cada valor em relao a mdia:

Para um conjunto de dados pode ser expressado como:

Para evitar que este somatrio seja igual a zero, deve-se utilizar o mdulo.
Assim, pode ser reescrita da seguinte forma:

Desvio mdio da amostra Desvio mdio da populao


Apesar de utilizarmos o mdulo, o desvio mdio no vlido para discriminar
pequenos de grandes afastamentos. Assim, se em vez de utilizar valores
absolutos eleva-se ao quadrado, os problemas de sinais sero no somente
eliminados, como tambm potencializa os afastamentos, enfatizando os
grandes desvios em relao as observaes mais prximas da mdia, sendo
denominada de varincia. Ela pode ser expressa da seguinte forma:

Varincia da amostra

Varincia da populao

O fator n-1 utilizado em vez de n para a varincia da amostra, pois


utilizando-se n tender-se-ia obter valores reduzidos de varincia, o fator n-1
corrige esta discrepncia. Para facilitar a interpretao da varincia, utiliza-se o
desvio padro, que a raiz quadrada da varincia:
Desvio

padro da amostra
padro da populao

Desvio

Mdia, varincia e desvio padro de uma varivel aleatria contnua:

Mdia, varincia e desvio padro de uma varivel aleatria discreta:

Probabilidade:
A probabilidade o ramo da matemtica que tem como objetivo principal o
clculo, ou seja, a quantificao, da frequncia de ocorrncia de um
determinado fenmeno em relao a todas as alternativas possveis.
Experimentos aleatrios podem ser definidos como fenmenos que se
repetidos, mesmo em condies semelhantes, apresentaro
resultados imprevisveis.
Assim, se em um fenmeno aleatrio as possibilidades so provveis, ento a
probabilidade de ocorrer um evento A :

No lanamento de um dado, por exemplo, um nmero par pode ocorrer de 3


maneiras diferentes dentre 6 igualmente provveis, portanto, P(A) = 3/6 = 1/2 =
50%.
Def.: Uma funo massa de probabilidade ou distribuio de probabilidades,
P(x), uma descrio da probabilidade para cada valor da varivel aleatria.
Ela frequentemente expressa na forma de um grfico, de uma tabela ou de
uma frmula.
Requisitos para uma distribuio de probabilidade:
1. P(x) = 1
2. 0P(x) 1
Em que x assume todos os valores possveis. (a soma de todas as
probabilidades deve ser 1).
Para todo valor individual de x. (Isto , cada valor de probabilidade deve estar
entre 0 e 1, inclusive).
Funo de Probabilidade para uma varivel aleatria contnua:
dita como varivel aleatria absolutamente contnua se existe uma
funo
denominada funo densidade de probabilidade, que
satisfaz s seguintes propriedades:
1.
, para todo
2.
Alm disso, para qualquer

, com

que

Do modo como a probabilidade foi definida, a probabilidade de um ponto


isolado sempre zero, ou seja,
. Desta forma,
podemos concluir que, quando uma varivel aleatria contnua, a
probabilidade de ocorrer um valor especifico zero.
Obs.: Se uma varivel aleatria absolutamente contnua, ento:

Funo de Probabilidade para uma varivel aleatria discreta:


Seja uma varivel aleatria discreta. A cada possvel resultado
associado um
nmero
, denominado probabilidade de . Os nmeros
,
devem satisfazer as seguintes condies:
para todo ;
.
A funo
aleatria

Distribuio Binomial:

denominada

funo

de

probabilidade

da

varivel

Para se construir o modelo binomial, uma srie de condies precisam ser


satisfeitas:
1. Em cada ensaio considera-se somente a ocorrncia ou no ocorrncia
de um certo evento que ser denominado sucesso (S) e cuja no
ocorrncia ser denominada falha (F).
2. Os ensaios so independentes.
3. A probabilidade de sucesso, que denotaremos por p a mesma para
cada ensaio. A probabilidade de falha ser denotada por 1-p.
Em um experimento que consiste na realizao de ensaios independentes de
Bernoulli, o espao amostral pode ser considerado como o conjunto de n-uplas,
em que cada posio h um sucesso (S) ou uma falha (F).
A probabilidade de um ponto amostral com sucessos nos primeiros ensaios e
falhas nos
ensaios seguintes
O nmero de pontos do espao amostral que satisfaz essa condio igual ao
nmero de maneiras com que pode-se escolher
ensaios para a ocorrncia
de sucesso dentre o total de ensaios, pois nos
restantes devero
ocorrer falhas. Este nmero igual ao nmero de combinaes de
elementos tomados a , ou seja,

Ou seja, para

Def.: Seja o nmero de sucessos obtidos na realizao de ensaios de


Bernoulli independentes. Diremos que
tem distribuio binomial com
parmetros e , em que a probabilidade de sucesso em cada ensaio, se
sua funo de probabilidade for dada por:

Notao:

Diagrama de pontos:
Neste grfico, cada ponto representa uma observao com o determinado valor
da varivel. Ele til para observaes pequenas. Observaes com mesmo
valor so representadas com pontos empilhados neste valor.

Grfico 1 - Diagrama de pontos


Fonte: Portal gente que educa.
Neste grfico possvel observar como se distribui a altura de meninos e
meninas numa determinada turma. Alm disto possvel comparar como
ocorre esta distribuio entre os dois sexos. Neste exemplo, possvel verificar
que os meninos possuem uma estatura maior que as meninas.
Diagrama de ramos e folhas:
um dispositivo que estabelece uma forma de organizao e apresentao de
dados semelhante a distribuio de frequncias e ao histograma. Nessa
disposio considera somente os algarismos significativos do dado, com
eventual descarte de alguns dgitos menos significativos.
O nome ramo e folhas deriva da forma como os valores so apresentados. Um
ou mais dos dgitos mais significativos so escolhidos para compor os ramos e
um ou mais dos dgitos menos significativos correspondentes aos mesmos
ramos so denominados folhas.
O diagrama de ramo e folhas permite obter ou observar com relativa facilidade:
- A amplitude onde ocorrem os dados;
- Medidas de localizao da distribuio;
- O modo como se distribuem os valores, indicando concentraes ou
agrupamentos, disperso e simetria, sem perder informao individual do dado;
- Buracos ou lacunas na distribuio;
- Valores atpicos no conjunto de dados.
Abaixo encontra-se a relao de 50 valores (em decibis) de nvel de rudo de
trfego em certo cruzamento.

O diagrama de ramos e folhas pode ser montado da seguinte forma:

Figura 1 - Esquema de um diagrama ramo e folha.


Fonte: Anlise Exploratria de Dados, 2011.
Com este diagrama obtemos facilmente os dados em forma de rol:

Figura 2 - Dados em forma de rol utilizando diagrama ramo e folha.


Fonte: Anlise Exploratria de Dados, 2011.
Diagrama de caixas (Box Plot):
O box plot uma apresentao grfica que permite descrever ao mesmo
tempo vrias caracterstica relevantes de um conjunto de dados como centro,
disperso, desvio da simetria, disperso e identificao de ouliers. Os cinco
itens ou valores: o menor valor (x1), os quartis (Q1, Q2 e Q3) e o maior valor (xn),
so os 5 parmetros importantes para se ter uma ideia da posio, disperso e
assimetria da distribuio dos dados. Na sua construo so considerados os
quartis e os limites da distribuio, permitindo uma visualizao do
posicionamento da distribuio na escala da varivel.

Figura 3 - Esquema de um diagrama box plot.


Fonte: Anlise Exploratria de Dados, 2011.
Na caixa retangular da figura so fornecidos os quartis Q1, na parte esquerda, e Q3 na
parte direita da caixa. Entre eles encontra-se a Mediana da distribuio.
Observe que 50% da distribuio tm valores dentro da caixa. As linhas horizontais
que saem da caixa terminam nos limites inferior (LI) e superior (LS) da distribuio.
Entre esses limites encontram-se os valores considerados como tpicos da
distribuio. Esses limites so determinados em funo da distncia entre os dois
quartis (Q3 e Q1), isto , do desvio inter-quartlico:
DQ = Q3 Q1
Observaes com afastamento superior a 1,5 desvio inter-quartlico, para cima ou para
baixo, so consideradas atpicas, ou possveis outliers. Os pontos que esto mais de
1,5 DQ e menos que 3,0 DQ, so chamados de outliers, aparecendo (o). Valores com
afastamento superior a 3,0 DQ, para cima ou para baixo so considerados como
pontos extremos, aparecendo na figura com (*). Quanto maior for o valor do desvio
inter-quartlico, maior a variabilidade da distribuio.
O box plot tambm fornece informaes importantes sobre o comportamento do
conjunto de dados, como simetria e variabilidade. Se a amplitude for muito maior que
distncia interquartlica e a mediana estiver mais prxima do 1 quartil do que do 3
quartil, h forte indicao de assimetria positiva e de grande disperso das
observaes.

Grfico sequencial temporal:


um grfico cuja abscissa denota o tempo e a ordenada o valor observado. O
conjunto de dados formam uma srie temporal, que um conjunto de dados
observados e registrados no momento em que ocorreram.
No grfico abaixo mostrado os preos em dlar, do metro cbico de carvo
vegetal comercializado em Minas Gerais entre 1975 e 2002.

Grfico 2 - Preos em dlar, do metro cbico de carvo vegetal


comercializado em Minas Gerais entre 1975 e 2002
Fonte: Departamento de Cincias Florestais da UFLA e Departamento de
Engenharia Florestal da UFV.
Podemos de observar que esta queda no valor comercializado provavelmente
ocorreu por conta da queda do valor do barril de petrleo neste perodo.
Grfico de disperso:
Este grfico correlaciona a abscissa e a ordenada representando ao mesmo
tempo os valores de duas variveis quantitativas medidas em cada elemento
de conjunto de dados.
No grfico abaixo possvel observar a populao de idosos em relao a
regio central e perifrica da cidade de SP.

Grfico 3 - Distribuio de idosos no distrito de So


Fonte: Mundo Geonegcios.

Podemos observar que a quantidade de idosos dos distritos verdes


corresponde rea central da cidade e caracteriza-se por excelentes
condies de vida. A quantidade de idosos decai nas zonas intermedirias da
cidade (em amarelo). Por fim, na periferia, a quantidade muito menor, onde a
qualidade de vida menor.
Distribuio de frequncias:
um agrupamento de classes, no qual possvel contabilizar o nmero de
ocorrncias em cada classe.
Frequncia absoluta (i): o nmero de observaes correspondente a cada
classe;
Frequncia relativa (ri): o quociente entre a frequncia absoluta da classe
correspondente e a soma de todas as frequncias;
Frequncia percentual (pi): obtida multiplicando a frequncia relativa por
100%;
Frequncia acumulada: o total acumulado (soma) de todas as classes
anteriores at a classe atual.
Distribuio de frequncia para variveis discretas:
Neste grfico listado os diferentes valores observados da varivel com suas
frequncias absolutas.
Nmero de

Frequncia (i

Frequncia

Frequncia

Frequncia

pessoas com

relativa (ri)

percentual

acumulada

0,05

0,1

10

15

0,25

25

40

10

0,4

40

80

11

0,15

15

95

12

0,05

100

diabetes

Tabela 2 - Distribuio de frequncias para varivel aleatria discreta


Fonte: Portal Action.
Calculando-se as demais frequncias e transpondo para o grfico obtm-se um
grfico de barras.

Grfico 4 - Nmero de diabetes versus frequncia absoluta


Fonte: Portal Action.
Distribuio de frequncia para variveis contnuas:
Neste caso a faixa de variao de dados dividida em classes. O menor valor
da classe chama-se limite inferior (li) e o maior, limite superior (Li). Assim a
classe pode ser determinada da seguinte forma:
Determinar a amplitude h dos dados, ou seja, obter a diferena entre o
maior e o menor valor de nosso conjunto;
Definir o nmero de classes = (n)1/2;
Definir a amplitude hi da classe: hi = h/k, arredondado para cima.
(li) (Li), onde o limite inferior da classe includo na contagem da
frequncia absoluta, mas o superior no;
(li) (Li) , onde o limite superior da classe includo.
Na tabela de distribuio de frequncia, acrescentamos uma coluna com os
pontos mdios de cada intervalo de classe, denotada por x i. Esta definida
como a mdia dos limites da classe:

Classe

Frequnci

Freq.

Porcentage

Porc.

Densidade

Pont

Relativ

Acumulad

mdi
o

[4,2;4,4)

12

0,06

0,3

4,3

[4,4;4,6)

16

0,08

14

0,4

4,5

[4,6;4,8)

31

0,15

15,5

29,5

0,775

4,7

[4,8;5,0)

66

0,33

33

62,5

1,65

4,9

[5,0;5,2)

35

0,17

17,5

80

0,875

5,1

[5,2;5,4)

25

0,12

12,5

92,5

0,625

5,3

[5,4;5,6)

11

0,06

5,5

98

0,275

5,5

[5,6;5,8)

0,02

100

0,099

5,7

Tabela 3 - Distribuio de frequncias para varivel aleatria contnua


Fonte: Portal Action.

Grfico 5 - Classe versus frequncia


Fonte: Portal Action.
Assimetria:
Apesar das mdias poderem descrever um conjunto de dados, importante
verificar como se comporta de forma geral essa distribuio, o que possvel
graas a distribuio de frequncia e de histograma.
Para distribuies assimtricas uma cauda em uma das extremidades pode
ser observada. Quando ela se encontra direita, positivamente assimtrica, e
se est esquerda, negativamente assimtrica.
Em uma distribuio simtrica, a mdia ( x ), a mediana (Md) e a moda (Mo)
so iguais, isto , x = Md = Mo. Em uma distribuio assimtrica positiva ou

assimtrica direita, a mdia maior que a mediana, e esta, por sua vez,
maior que a moda ( x > Md > Mo), ao passo que, em uma distribuio
assimtrica negativa ou assimtrica esquerda, a mdia menor que a
mediana, e esta, menor que a moda.

Figura 4 - Simetria e Assimetria num histograma


Fonte: Anlise Exploratria de Dados, 2011.
Diagrama de pareto:
um grfico de barras. Ele ordena as frequncias das ocorrncias, desde a
maior at a menor, permitindo a priorizao dos problemas. Ele mostra ainda a
curva de percentagens acumuladas. Sua grande utilidade se deve ao fato
permitir uma fcil visualizao e identificao das causas ou problemas mais
importantes, possibilitando a concentrao de esforos sobre os mesmos.
utilizado para dados qualitativos.
Tipos de

Frequncia

Problemas

Frequncia

Porcentagem

Acumulada

Porcentagem
Acumulada

80

80

40

40

55

135

27,5

67,5

25

160

12,5

80

20

180

10

90

Outros

10

190

95

10

200

100

Tabela 4 - Distribuio de frequncias para varivel aleatria contnua


Fonte: Portal Action.
Seu respectivo grfico de pareto :

Grfico 6 - Grfico de pareto para o exemplo


Fonte: Portal Action.

Objetivos
Este experimento tem por objetivo estudar e analisar as variveis que
envolvem o lanamento de um avio de papel, bem como a probabilidade da
retirada das cartas de copas de um baralho.

Metodologia
Neste experimento foi utilizado o mtodo quantitativo devido necessidade de
se mostrar em grficos os resultados obtidos. Diversos grficos foram
montados com base nos dados coletados para as duas etapas do experimento,
tais como: diagrama de pontos, diagrama de ramos e folhas, a tabela de
distribuio e frequncias (relativa, absoluta e acumulada), histograma de
varivel contnua (para o caso do avio) e histograma de varivel discreta (para
o caso do baralho), diagrama de pareto, diagrama de caixas (box plot), grfico
sequencial temporal e grfico de disperso, tudo para melhor elucidao dos
resultados.
Alm disto, foram utilizados como ferramenta para este mtodo a probabilidade
de ocorrncia de um evento (para o estudo da probabilidade de retirada das
cartas de copas de um baralho). Clculo da mdia, mediana, varincia, desvio
padro tambm foram extremamente importantes para as duas etapas do
experimento (Estudo do lanamento de um avio de papel e a probabilidade
envolvida na retirada das cartas de copas de um baralho).
Como complementao, as contribuies do mtodo qualitativo foram
necessrias. Para isto foi realizada pesquisa bibliogrfica baseada em livros e
sites relacionados ao tema. O texto foi elaborado com as concluses tiradas a
partir destas leituras.

Mtodo
Afim de se obter resultados mais precisos, uma srie de procedimentos foram
adotados com o intuito de reduzir erros experimentais.
Na primeira etapa do experimento uma nica pessoa ficou responsvel pelo
lanamento do avio de papel, enquanto que uma segunda pessoa ficou
responsvel por cronometrar o tempo de queda. Isto muito importante, pois o
modo (ngulo de lanamento do avio) e tempo de resposta para cessar a
contagem do tempo, varia de operador para operador. Alm disto, o avio foi
largado de uma altura H fixa. O experimento foi realizado em um ambiente
fechado e na medida que ocorriam alteraes ambientais, tais como,
surgimento de uma corrente de vento, estes dados foram anotados para melhor
anlise dos dados coletados.
J na segunda etapa do experimento referente ao baralho, um nico operador
ficou responsvel por embaralhar as cartas 40 vezes e sac-las. Isto foi feito
pois cada pessoa embaralha as cartas de uma forma diferente e se mais de
uma pessoa realizasse este procedimento, variaes e erros poderiam ocorrer,
acarretando em resultados menos precisos e confiveis.

Resultados e Discusso
Estudo do lanamento de um avio de papel

Tabela de dados coletados:

N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Tempo
(segundos)
0,33
0,44
0,33
0,41
0,43
0,35
0,50
0,38
0,45
0,46
0,46
0,40
0,43
041
0,43
0,42
0,39
0,50
0,44
0,43
0,40
0,40
0,46
0,43
0,61

N
26
27
28
29
30
31
22
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

Tempo
(segundos)
0,41
0,38
0,46
0,48
0,50
0,43
0,55
0,34
0,38
0,48
0,43
0,46
0,47
0,51
0,61
0,49
0,54
0,45
0,41
0,46
0,56
0,56
0,46
0,45
0,46

N
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

Tempo
(segundos)
0,38
0,47
0,47
0,45
0,39
0,33
0,34
0,35
0,41
0,43
0,47
0,48
0,50
0,51
0,43
0,46
0,47
0,39
0,40
0,43
0,41
0,42
0,50
0,41
0,46

N
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
10
0

Tempo
(segundos)
0,56
0,56
0,46
0,38
0,41
0,43
0,55
0,41
0,50
0,38
0,45
0,46
0,43
0,47
0,51
0,43
0,44
0,37
0,33
0,51
0,48
0,47
0,43
0,41
0,35

Tabela com o resultado da mdia, varincia, desvio padro, moda,


mnimo, Q1, mediana, Q3 e mximo das medidas obtidas:
Mdia

0,4436

Varincia
Desvio Padro
Moda
Mnimo
Q1
Mediana
Q3
Mximo

0,3578
0,5981
0,43
0,33
0,41
0,44
0,47
0,61

Tabela de frequncia absoluta, frequncia relativa e frequncia


acumulada:

Grfico de sequncia acumulada (ou ogiva):


Diagrama de Pareto:
Histograma de frequncia:
Grfico de Pontos:
Box plot:
Sequencial temporal:

Diagrama de ramos e folhas:

2 parte do experimento:
Probabilidade envolvida na retirada de uma carta de copas de um baralho
Tabela de dados coletados:
Tentativa
Copas
1
5
2
7
3
4
4
9
5
4
6
4
7
8
8
4
9
3
10
8
11
6
12
6
13
8
14
4
15
3
16
6
17
5
18
8
19
5
20
5

Tentativa
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

Copas
3
5
7
5
3
5
3
5
3
7
4
4
6
4
4
4
5
5
4
8

Tabela com o resultado da mdia, varincia, desvio padro, moda,


mnimo, Q1, mediana, Q3 e mximo das medidas obtidas:
Mdia

5,15

Varincia
Desvio Padro
Moda
Mnimo
Q1
Mediana
Q3
Mximo

2,84872
1,687815
4 (11 vezes)
3
4
5
6
9

O desvio padro foi igual a 1,687815. Ele mostra que existe uma relativa
disperso (desvio dos dados), no to alta, pois a mdia manteve-se mais que
o dobro superior ao desvio padro. Este leve desvio provavelmente foi
decorrente da forma como o baralho foi embaralhado (o baralho nunca ser
embaralhado de forma igualitria em todas as 40 tentativas).
A mdia aritmtica fcil de se calcular, pois todos os dados coletados so
somados e em seguida, o resultado obtido dividido pela quantidade. No

entanto, a mdia fortemente influenciada pelas presena de outliers, podendo


causar uma grande distoro nos dados. Com a realizao do diagrama de
caixas (box plot) foi possvel observar a existncia de outliers tornando seu
resultado pouco confivel.
A moda (o valor que se repetiu com maior frequncia) foi igual a 4. Das 40
rodadas, em 11 (27,5% das rodadas) 4 cartas de copas foram sacadas
aleatoriamente. Alm disto, em 10 rodadas, 5 cartas de copas foram retiradas
(25% das rodadas). Nesta regio ocorre um forte concentrao de dados
(distribuio bimodal), comprovado pelo diagrama de pontos, diagrama de
pareto e histograma de frequncia.
Tabela de frequncia absoluta, frequncia relativa e frequncia
acumulada:
Nmero de
Frequncia
%
Frequncia
Frequncia
Cartas de Copas
Absoluta
Relativa
Acumulada
0
0
0%
0,000
0,000
1
0
0%
0,000
0,000
2
0
0%
0,000
0,000
3
6
15%
0,150
0,150
4
11
28%
0,275
0,425
5
10
25%
0,250
0,675
6
4
10%
0,100
0,775
7
3
8%
0,075
0,850
8
5
13%
0,125
0,975
9
1
3%
0,025
1,000
10
0
0%
0,000
1,000
11
0
0%
0,000
1,000
12
0
0%
0,000
1,000
13
0
0%
0,000
1,000
Total
40
100%
1,000
1,000

Grfico de sequncia acumulada (ou ogiva):

Frequncia Acumulada
1.200
1.000
0.800
0.600
0.400
0.200
0.000
0

10

12

14

O diagrama de frequncia acumulada a soma da frequncia relativa do dado


mais a frequncia absoluta do dado anterior. Este grfico mostra que a
frequncia acumulada cresce na medida que a tabela de frequncia dos dados
preenchida at o valor 1,00, que corresponde ao total (100% do dados com
suas respectivas frequncias analisadas).
Diagrama de Pareto:

Diagrama de Pareto
12

1.200

10

1.000

0.800

0.600

0.400

0.200

Frequencia Absoluta

10 11 12 13 14

0.000

Frequencia Acumulada

Como j comentado, existe uma forte concentrao dos dados em 4 e 5


(distribuio bimodal). Assim, o pico da frequncia absoluta de dados esto
nestes valores, decrescendo progressivamente. Enquanto isto, no outro
extremo do grfico, enquanto a frequncia acumulada cresce, esto os
valores cuja frequncia absoluta zero.

Histograma de frequncia:

Histograma
12
10
8
Frequnci a absoluta

6
4
2
0

0 1 2 3 4 5 6 7 8 9 10 11 12 13
Nmero de Cartas de Copas

No histograma de frequncia possvel observar os picos de frequncia em 4 e


5 (distribuio bimodal). Existe um aumento em 8, isto pode ser observado no
grfico de frequncia acumulada pois a curva possui um movimento suave e
neste ponto ela sofre um leve salto, indicando um valor fora do "padro".
possvel verificar ainda que a distribuio no normal e com isto, no
possvel padronizar. Porm, possvel analisar como a moda, mdia e
mediana influenciam no formato deste grfico. Como Moda<Mediana<Mdia, o
aspecto do grfico este:

O grfico assimtrico, pois moda, mediana e mdia so diferentes entre si.


Como ele est tendendo para o lado esquerdo, sua assimetria negativa.

Grfico de Pontos:

Copas x Nmero de tentativas


45
40
35
30
25
20
15
10
5
0
2

10

Observa-se neste grfico que existe uma forte concentrao de dados no


nmero 4 e 5. Como comentado anteriormente, 27,5% do dados encontram-se
no nmero 4 e 25% dos dados encontram-se no nmero cinco, totalizando
52,5% das rodadas (mais que metade das 40 tentativas de retirar copas do
baralho). Isto mostra que existe uma forte concentrao de dados nesta regio
e que h uma tendncia maior de retirar esta quantidade de cartas. A mediana
e a mdia aritmtica ficaram dentro desta faixa (5 e 4 respectivamente).
Box plot:

Box Plot
8
7
6
5
4
3
2
1
0

Colocando-se os dados em rol, encontramos que: 3 (menor valor), 4 (Q 1), 5


(mediana), 6 (Q3), 9 (maior valor). Como o desvio inter-quartlico dado por:
DQ = Q3 - Q1, DQ = 6 - 4 = 2.
O limite inferior determinado pela seguinte frmula:
LI = Q1 - 1,5DQ
LI = 4 - 1,5(2) = 1
E o limite superior:
LS = Q3 + 1,5DQ
LS = 6 + 1,5 (2) = 9
Para o limite inferior:
1,5 . 2 = 3
Isto indica a presena de um possvel outlier em 2 e um ponto extremo 1.
Para o limite superior:
1,5 . 2 = 3
3,0 . 2 = 6
Isto indica que no existe nenhum outlier.
Clculo da Probabilidade:
Para a determinao da probabilidade de sacar copas de um baralho de 52
cartas, retirando uma a uma 20 vezes sem devolv-la, foi preciso analisar o
problema, afim de identificar a melhor distribuio para solucionar o mesmo.
Cada naipe num baralho composto por 13 cartas paus, 13 cartas de ouro,
13 cartas de espadas e 13 cartas de copas. Assim a Probabilidade de retirar
uma carta de copas de um baralho com 52 cartas :
P(C) = 13/52=0,25 ou 25% de chance de retirar copas de um baralho com
52 cartas.
Como as tentativas so todas independentes, cada uma delas resulte em
"sucesso" ou "falha" e como a tentativa p de sucesso permanece constante
em todas as tentativas, chegou-se a concluso que a distribuio binomial
a que melhor se enquadra no nosso problema.
Considerando que foram retiradas 20 cartas de um baralho de 52 e
utilizando a funo de probabilidade para uma binomial tm-se:
P(X = 20) =
(0,25)13 (0,75)39

(0,25)13 (0,75)39

P(X = 20) = 23,17%

O valor da probabilidade calculada a partir da funo binomial de probabilidade


bem prxima da probabilidade de retirar 13 cartas de copas de um baralho
com 52 cartas.

Concluso

Referncias bibliogrficas
[1] MONTGOMERY, DOUGLAS C. Estatstica Aplicada e Probabilidade Para
Engenheiros. 5 Edio. Editora: LTC, 42, 43, 44, 45, 45, 50, 51, 52, 53, 67, 68
e 71.
[2] PORTAL ACTION, Distribuio Binomial. Disponvel em: <http:
//www.portalaction.com.br/probabilidades/51-distribuicao-binomial>. Acesso 18
de maio de 2015.
[3] PORTAL ACTION, Varivel aleatria discreta. Disponvel em: <
http://www .portalaction.com.br/probabilidades/22-variavel-aleatoria-discreta>.
Acesso em 18 de maio de 2015.
[4] PORTAL ACTION, Varivel aleatria contnua. Disponvel em: <http://ww
w.portalaction.com.br/probabilidades/23-variavel-aleatoria-continua>. Acesso
em 18 de maio de 2015.
[5] PORTAL ACTION, Histograma. Disponvel em: < http://www.portalaction.
com.br/estatistica-basica/16-histograma>. Acesso em 17 de maio de 2015.
[6] SISTEMAS GALILEU DE EDUCAO ESTATSTICA, Diagrama de Ramos
e Folhas. Disponvel em: <http://www.galileu.esalq.usp.br/mostra _topi co.php?
cod=227>. Acesso em 17 de maio de 2015.
[7] JUNIOR, LUIZ MOREIRA COELHO, Anlise longitudinal dos preos do
carvo vegetal, no Estado de Minas Gerais. Disponvel em: < http://ww
w.scielo.br/scielo.php?script=sci_arttext&pid=S0100-67622006000300013>.
Acesso em 17 de maio de 2015.
[8] MEDRI, WALDIR, Anlise exploratria de dados. Disponvel em: < http://
www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_estatistica.
pdf>. Acesso em 17 de maio de 2015.
[9] GEONEGCIOS, Sndrome dos olhos de perto. Disponvel em: < http://
mundogeo.com/blog/1999/06/02/geonegocios-5/>. Acesso em 17 de maio de
2015.

[10] GRFICO DE PONTOS, Estatstica: medidas de tendncia central de


pesquisa. Disponvel em: <http://www.gentequeeduca.org.br/planos-de-aula/
estatistica-medidas-de-tendencia-central-de-pesquisa>.Acesso em 17 de maio
de 2015.
[11] QUMICA GERAL, Exatido e preciso nas medidas. Disponvel em:
<http://www.mundoeducacao.com/quimica/exatidao-precisao-das-medidas.
htm>. Acesso em 18 de maio de 2015.