Você está na página 1de 23

!

"#$%&' ) *'+,+-'+$%,
,#.$%,/, 0 %&1#2+,34&
52., 6
8osrlo 8lbelro
rosarloufg[gmall.com
unlversldade lederal de Cols

*178+,9:;<7+$=&'

LS1A1IS1ICA
Un||zar estansnca para reso|ver prob|emas das C|nc|as da
Computao (sohware k)

>$;.$&?@,A$,
8A88L11A, 8LlS e 8C8nlA - LsLausuca para Cursos de Lngenharla e
lnformuca. ALlas, 2004
L1L8nLLLl, L.A., MLLLC, M.. de. Conhecendo o k: Uma v|so Lstansnca.
LdlLora ulv: unlversldade lederal de vlosa, 2007.
vLnA8LLS, W.n., SMl1P, u.M, 8 uevelopmenL Core 1eam. An Introducnon
to k.
kuPnL81, ., vLnA8LLS, 8. An Introducnon to k: Sohware for Stansn- ca|
Mode|||ng & Compunng. CSl8C MaLhemaucal and lnformauon Sclences:
Cleveland, AusLralla, 2003.
ulversos arugos
www.r-pro[ecL.org
5=,.$,34&
! 1 rova escrlLa lndlvldual (3 valores)
! Semlnrlos
! Lxerclclos
! 1rabalhos escrlLos

!"#$#%"#&'$ )!"'*&#&+$
na pruca somos frequenLemenLe confronLados com grandes
quanudades de dados aos quals queremos apllcar as Lecnlcas da
esLausuca, alls, o ob[ecuvo da LsLausuca e preclsamenLe anallsar
dados.
A anllse de dados, que deve comear pela sua descrlo, e mulLo
mals fcll se esLes forem organlzados e reduzldos (ou sumarlzados).
A LsLausuca uescrluva e pols um passo necessrlo.
vamos esLudar agora Lecnlcas para organlzar e reduzlr dados que
nos permlLem exLralr lnformaes desses dados.

LxlsLem vrlas formas de organlzar e reduzlr dados, umas so
grcas e ouLras no.
C mxlmo na reduo ou sumarlzao de dados aconLece quando se
calcula um s numero ou medlda ( como por exemplo uma medla
arlLmeuca) que conLem lnformao lmporLanLe sobre os dados.
LxlsLem vrlas medldas descrluvas dos dados que lremos esLudar.
A forma mals elemenLar de apresenLao dos dados esLausucos de
uma varlvel e a !"#$% '()*+(,-*, onde as observaes so
enumeradas, evenLualmenLe por ordem crescenLe.
LxLMLC : num cerLo esLudo esLausuco anallsaram-se 169 pessoas
cu[as ldades, esLo compreendldas enLre 18 e 63 e, so 27, 27, 42, ...,
38, 23, 39.
A serle esLausuca correspondenLe e 18, 18, 19, 19, 20 ..., 62, 63, 63 .
uma sr|e estansnca permlLe-nos deLermlnar rapldamenLe o
mxlmo, o mlnlmo e a medlana, mas por vezes no e necessrla para
ouLros ns.
or ouLro lado o mxlmo, o mlnlmo e aLe a medlana podem ser
deLermlnados sem ser necessrlo ordenar Lodos os valores, o que e
basLanLe demorado.
!,!*'%'&-.
C numero de avarlas de 20 mqulnas em 6 meses e:
24, 21, 22, 24, 26 23, 23, 21, 23, 24 22, 20, 26, 24, 23 21, 23,
22, 23, 23
ConsLrua uma Labela de frequnclas conLendo :
1. As frequnclas absoluLas ( f.a. )
2. As frequnclas relauvas (f.r.)
3. As frequnclas absoluLas acumuladas (f.a.a.)
4. As frequnclas relauvas acumuladas (f.r.a.)


B7'&.234&
Joaquim Costa, DMA-FCUP 6
! !! !"#$%&'($ "#$%&'($ "#$%&'($ "#$%&'($ :

NMERO
DE AVAR.
)*+* )*+* )*+* )*+* )*,* )*,* )*,* )*,* )*+*+ )*+*+ )*+*+ )*+*+. )*,*+* )*,*+* )*,*+* )*,*+*
20 1
1
/
20
= 0.05 1 0.05
21 3
3
/
20
= 0.15 4 0.20
22 3
3
/
20
= 0.15 7 0.35
23 5
5
/
20
= 0.25 12 0.60
24 4
4
/
20
= 0.20 16 0.80
25 2
2
/
20
= 0.10 18 0.90
26 2
2
/
20
= 0.10 20 1.00
20 1

Genericamente, teremos os valores observados X
1
, X
2
, X
k
, com
frequncias absolutas correspondentes n
1
, n
2
, , n
k
, sendo :







)/012/34/5670 $8249:;:0
LxL8ClClC : Medlu-se o comprlmenLo da nervura malor de 73
folhas de plLano. Cs valores em mlllmeLros so os segulnLes :
113, 126, 139, 171, 119, ..., 133, 183, 132.
A serle esLausuca correspondenLe e : 104, 112, 112, ..., 182,
184, 188
uma forma de sumarlzar os dados e por exemplos agrupa-los
em classes.
C&8+D *E7@%-%$&
Joaquim Costa, DMA-FCUP 8
Distribuies Agrupadas


! !! !"!#$%$&' "!#$%$&' "!#$%$&' "!#$%$&' : Mediu-se o comprimento da nervura maior de 75 folhas
de pltano. Os valores em milmetros so os seguintes :
113, 126, 139, 171, 119, , 155, 183, 132.

A srie estatstica correspondente : 104, 112, 112, , 182, 184, 188

Uma forma de sumarizar ou reduzir estes dados consiste em agrup-los
em classes. Por exemplo :






CLASSE
()*)
[ 100 - 115 [
4
[ 115 - 130 [
9
[ 130 - 145 [
15
[ 145 - 160 [
26
[ 160 - 175 [
15
[ 175 - 190 [
6
75
A esLa Labela d-se o nome de tabe|a de frequnc|as.
Cuando o numero de observaes e elevado, e preclso condensar os
dados aLraves do agrupamenLo das observaes em classes.
ara lsso, selecclonamos um con[unLo de lnLervalos conuguos,
de forma a que cada observao possa ser colocada num e s
num desses lnLervalos.
uma das prlmelras conslderaes no agrupamenLo de dados,
conslsLe em saber quantos |nterva|os un||zar, asslm como,
qual a amp||tude desses |nterva|os.
Se usarmos mulLo poucos lnLervalos, os dados so reduzldos
excesslvamenLe e perde-se mulLa lnformao.
Se usarmos demaslados lnLervalos, o ob[ecuvo da sumarlzao
dos dados no e alcanado.
SLurges, em 1926, sugerlu uma frmula relaclonada com o
blnmlo de newLon para calcular o numero de lnLervalos a
conslderar no agrupamenLo dos dados. A frmula e :
Joaquim Costa, DMA-FCUP 10
Se usarmos muito poucos intervalos, os dados so reduzidos
excessivamente e perde-se muita informao.


Se usarmos demasiados intervalos, o objectivo da sumarizao dos
dados no alcanado.


Sturges, em 1926, sugeriu uma frmula relacionada com o binmio de
Newton para calcular o nmero de intervalos a considerar no
agrupamento dos dados. A frmula :


n n k
2 10
log 1 log 322 . 3 1 + = +

frmula de Sturges
k - n. de classes
n - nmero de observaes
LsLa frmula d-nos uma lndlcao quanLo ao numero de classes a
conslderar mas, por vezes, esse numero e llgelramenLe aumenLado
ou dlmlnuldo, por convenlncla e melhor apresenLao dos dados.
no exemplo das folhas de plLano:
k = 1 + 3.322log10 73 = 7.3
Se escolhermos k = 7 a ampllLude de cada lnLervalo serla de:
!"# = (188 - 104)/7 = 12
Lscolhemos por razes de convenlncla a ampllLude 13,
Lambem poderlamos Ler escolhldo 10.
lsLo levou-nos a uullzar 6 classes, em vez de seLe.
or ouLro lado, no e necessrlo comear a prlmelra classe em
104, que e a prlmelra observao.
odemos comear em 100, que e mals pruco, e asslm a
prlmelra classe serla [ 100 , 113 [
A ampllLude das classes e em geral consLanLe.
or vezes uullza-se uma ampllLude varlvel, de modo a reduzlr
as dlferenas enLre as frequnclas das dlferenLes classes.
nesLe caso, e preclso dlvldlr as frequnclas absoluLas e as
frequnclas relauvas pela ampllLude de cada classe lsLo e :
Joaquim Costa, DMA-FCUP 13
Por vezes utiliza-se uma amplitude varivel, de modo a reduzir as
diferenas entre as frequncias das diferentes classes.

Neste caso, preciso dividir as frequncias absolutas e as frequncias
relativas pela amplitude de cada classe isto :


i
f
f
i
i

= '

frequncias unitrias
ou
densidade de frequncia



*792707<1:5670 =2>?/@:0.
! ulagrama de barras (xl exacLos)
! PlsLograma (dados agrupados em classes)
! ollgono de frequnclas acumuladas
! ollgono de frequnclas relauvas
! ollgono de frequncla relauvas acumuladas
! ollgono de frequnclas absoluLas acumuladas
! ulagrama de exLremos e quarus e dlagrama calxa-dos-blgodes
! ulagrama de caule-e-folhas
F$,?@,1, /7 ;,@@,'
LxL8ClClC: Lm relao aos dados das avarlas de mqulnas,
Lrace o dlagrama de barras das frequnclas absoluLas.
noLa: LsLes dlagramas s se apllcam para valores de xl exacLos,
lsLo e, no agrupados em classes.

Joaquim Costa, DMA-FCUP 15
! !! !"!#$%$&' "!#$%$&' "!#$%$&' "!#$%$&' : Em relao aos dados das avarias de mquinas, trace
o diagrama de barras das frequncias absolutas.

# ## #!( !( !( !(')*+,' ')*+,' ')*+,' ')*+,' :










Estes diagramas s se aplicam para valores de xi exactos, isto , no
agrupados em classes.

5



4



3



2




1
20 21 22 23 24 25 26
Diagrama de barras das frequncias absolutas
*E7@%-%$&
Medlu-se o dlmeLro de 100 conchas de uma especle de
caracol. Cs resulLados, expressos em mlllmeLros e [a ordenados
foram : 20.4 , 20.4 , 21.0 , ... , 23.4 , 26.0.
Cs dados, agrupados em classes de 1 mm, so :

Joaquim Costa, DMA-FCUP 16
! !! !"!#$%$&' "!#$%$&' "!#$%$&' "!#$%$&' : Mediu-se o dimetro de 100 conchas de uma espcie de
caracol. Os resultados, expressos em milmetros e j ordenados foram :
20.4 ; 20.4 ; 21.0 ; ; 25.4 ; 26.0.

Os dados, agrupados em classes de 1 mm, so :

CLASSES
()*) ()*) ()*) ()*) (),) (),) (),) (),) ()*)*) ()*)*) ()*)*) ()*)*) (),)*) (),)*) (),)*) (),)*)
[ 19.5 - 20.5 [
2 0.02 2 0.02
[ 20.5 - 21.5 [
8 0.08 10 0.10
[ 21.5 - 22.5 [
19 0.19 29 0.29
[ 22.5 - 23.5 [
27 0.27 56 0.56
[ 23.5 - 24.5 [
31 0.31 87 0.87
[ 24.5 - 25.5 [
12 0.12 99 0.99
[ 25.5 - 26.5 [
1 0.01 100 1.00
100 1.00

a) uesenhe o hlsLograma e o pollgono de frequnclas relauvas unlLrlas
b) uesenhe o hlsLograma e o pollgono de frequnclas absoluLas
c) uesenhe o pollgono das frequnclas absoluLas acumuladas
d) uesenhe o pollgono das frequnclas relauvas acumuladas
kLSCLUC
a) Lmbora se possa desenhar hlsLogramas dos vrlos upos de frequnclas,
o mals uul e o hlsLograma das frequnclas relauvas unlLrlas. or um
lado porque asslm a rea LoLal debalxo do hlsLograma e 1 e podemos
por exemplo sobrepor um modelo (por exemplo gausslano) para ver se
se adequa bem aos dados.
or ouLro lado lsLo permlLe-nos usar classes de ampllLude varlvel.
G$'+&?@,1, 7 H&.-?&8& /7
I@7J2K8%$, @7.,+$=,' 28$+L@$,'
Joaquim Costa, DMA-FCUP 18
















Histograma e Polgono de frequncia relativas unitrias
f.r.u.
19.5 20.5 21.5 22.5 23.5 24.5 25.5 26.5
.05
.10
.15
.20
.25
.30

.35
B7'&.234&
b) L semelhanLe, mas usam-se as frequnclas absoluLas em vez
das frequnclas relauvas unlLrlas.
c)
Joaquim Costa, DMA-FCUP 19
b) semelhante, mas usam-se as frequncias absolutas em vez das
frequncias relativas unitrias.

c)











d) semelhante a c), mas usamos as frequncias relativas acumuladas.

f.a.a.
19.5 20.5 21.5 22.5 23.5 24.5 25.5 26.5

2

10

29

56

87

99

100
d) L semelhanLe a c), mas usamos as frequnclas relauvas
acumuladas.
um ouLro dlagrama que por vezes se usa e o d|agrama de
cau|e-e-fo|has (ver exemplo no 8).
LsLe dlagrama, que e parecldo com o hlsLograma, conLem no
enLanLo mals lnformao.

Você também pode gostar