Escolar Documentos
Profissional Documentos
Cultura Documentos
De acordo com Vieira (2008), estat�stica � a ci�ncia que fornece meios para a
coleta, organiza��o e interpreta��o de dados, possibilitando identificar algumas
caracter�sticas relevantes de um conjunto de dados.
Amostra - fra��o da popula��o estat�stica, que serve como par�metro para deduzir o
comportamento de toda a popula��o.
Fen�meno estat�stico - qualquer evento que se pretenda analisar, cujo estudo seja
pass�vel da aplica��o de uma t�cnica estat�stica. Por exemplo, n�mero de portadores
de HIV por grupo de cem mil habitantes no Brasil.
Estat�stica descritiva
A estat�stica descritiva permite a realiza��o da descri��o dos eventos estat�sticos
de forma resumida. Em outras palavras, se trata da coleta, observa��o, an�lise e
apresenta��o de dados pertinentes a um determinado fen�meno estat�stico.
Estat�stica indutiva
A estat�stica indutiva, por sua vez, realiza a an�lise dos diferentes eventos por
meio de generaliza��es, do particular para o todo, empregando t�cnicas de
amostragem.
defini��o do problema;
planejamento;
coleta de dados;
apura��o dos dados;
apresenta��o dos dados;
an�lise e interpreta��o dos dados.
Em uma pesquisa, quando se obt�m fra��es com d�zimas peri�dicas ou raz�es infinitas
de algarismos, por exemplo, 1/3=0,33333..., aplicamos t�cnicas de arredondamento
com o objetivo de facilitar o trabalho do pesquisador e a apresenta��o de dados,
mantendo-se a maior precis�o poss�vel. Assim, veja o exemplo para dois algarismos
significativos:
Quando uma d�zima tem sua s�rie 0,3333... Ou seja, um algarismo menor que 5, o
n�mero � arredondado para o algarismo da esquerda, tornando-se assim 0,33.
Ap�s saber qual � a natureza dos dados, devemos organiz�-los em uma tabela. Antes
de qualquer tipo de organiza��o nos dados, eles s�o chamados de dados brutos; no
momento que voc� os coloca em uma ordem crescente, s�o chamados de ROL.
Com a organiza��o dos dados em uma tabela, podemos ter a dimens�o de como
represent�-los em um gr�fico. Assim, podemos organizar nossos dados em uma tabela
com a frequ�ncia absoluta e frequ�ncia relativa.
Exemplo: um grupo de 150 pessoas em que vamos verificar quem est� doente e quem
est� saud�vel. Nesse grupo, foi verificado que 120 pessoas s�o saud�veis
(frequ�ncia absoluta de saud�veis s�o 120 pessoas; frequ�ncia relativa de saud�veis
ser� 120 divididos por 150 que � igual a 0,8 ou 80%). Lembrando que esse foi um
exemplo de vari�vel qualitativa nominal.
S�o ferramentas poderosas para descri��o de dados. Uma vantagem dos gr�ficos
estat�sticos � a capacidade de transmitir muita informa��o ao leitor em apenas uma
figura. Quando bem constru�do, o leitor entender� as principais caracter�sticas dos
dados com rapidez.
Linhas e curvas:
S�o indicados para representar vari�veis ao longo do tempo. O pesquisador pode
perceber, com o aux�lio dos gr�ficos de linhas, os per�odos de crescimento e
decrescimento da s�rie de dados ao longo do tempo, fato que pode ser importante
para a sua pesquisa.
A coleta de dados para pesquisa gera informa��es que precisam ser adequadamente
tratadas, a fim de que seja poss�vel realizar uma an�lise estat�stica adequada. Um
desses mecanismos � a separa��o dos dados coletados por intervalos, agrupando dados
com as mesmas caracter�sticas dentro de um determinado grupo.
Quando separamos os dados coletados para uma pesquisa, definimos a vari�vel por
intervalos e verificamos as frequ�ncias. Assim, encontramos as classes de
frequ�ncia (ou classes), que s�o os intervalos de varia��o da vari�vel analisada.
AT = Lm�xk - lmin1
Imagine que um pesquisador coletou dados relacionados � renda dos habitantes de uma
cidade do interior e verificou que poderia estabelecer uma distribui��o de
frequ�ncias baseadas em seis classes: �de um a dois sal�rios m�nimos (SM)�; �de
dois a tr�s SM�; �de tr�s a cinco SM�; �de cinco a dez SM�; �de dez a 50 SM�; e uma
classe, com frequ�ncia igual a 1, �de 50 a 200SM�. Observaremos que a Amplitude
Total da frequ�ncia de dados � dada por:
xi = (Li + li)/2
Histogramas e pol�gonos
Dados coletados para uma an�lise estat�stica geralmente s�o organizados em classes,
que constituem intervalos de varia��o de uma vari�vel de pesquisa, por exemplo, a
altura de um grupo de alunos.
A frequ�ncia dessa classe seria ent�o calculada pelo n�mero de observa��es
pertencentes �quela classe.
Tratam-se de somas de frequ�ncias que v�o sendo realizadas � medida que s�o
adicionadas classes a esse somat�rio.
Medidas de posi��o
Nesse contexto, vamos analisar as medidas mais utilizadas, iniciando pela m�dia.
Ela considera todos os valores que est�o sendo estudados. Portanto, � indicado
utiliz�-la quando a distribui��o de dados for sim�trica. A m�dia � dividida em
simples e ponderada.
M�dia simples
� a medida mais utilizada e melhor compreendida, segundo Duquia e Bastos (2006).
Para calcular a m�dia aritm�tica, basta somar todos os valores de um conjunto de
dados e dividir pelo n�mero de valores somados. Veja na f�rmula:
n
X' = (Somat�rio Xi)/n
i-1
M�dia ponderada
� utilizada quando as frequ�ncias dos valores analisados n�o s�o iguais. Para
calcul�-la, basta somarmos as multiplica��es das frequ�ncias pelos respectivos
valores e dividirmos pela soma das frequ�ncias. Veja na f�rmula:
n n
X'p = (Somat�rio Xi-fi)/(Somat�rio fi)
i-1 i-1
Diferente da m�dia, a mediana sempre tender� a ocupar a posi��o central de um
conjunto de dados. Quando o n�mero total de dados for �mpar, a mediana � o elemento
central; quando o n�mero total de dados for par, a mediana � obtida pela m�dia dos
elementos centrais.
Aten��o: devemos ordenar os dados de forma crescente.
Um conjunto com apenas uma moda se chama unimodal; com duas modas, bimodal; tr�s ou
mais modas, multimodal; e o conjunto com nenhuma moda se chama amodal.
Neste tema, conhecemos as medidas de posi��o mais usuais e seus devidos c�lculos.
Por meio da an�lise das medidas de posi��o, conseguimos verificar como � realizada
a distribui��o de um determinado conjunto de dados. O crit�rio de distribui��o dos
dados � efetuado pelo pesquisador para que seja poss�vel analisar o comportamento e
as tend�ncias desses dados em sua totalidade.
Separatrizes s�o medidas de posi��o que separam um conjunto de dados em �n� partes.
Cada uma dessas partes deve conter a mesma quantidade de dados. Assim, caso fa�amos
uma divis�o de um conjunto de 40 dados em 4 partes, cada parte ter� 10 dados. A
classifica��o e nomenclatura das separatrizes se d�o com base no n�mero de divis�es
feitas.
Quartis: s�o valores que dividem uma s�rie de dados em quatro partes iguais. S�o
tr�s valores (Q1, Q2 e Q3) que constituem o limite desses subconjuntos.
Decis: dividem um conjunto de dados em 10 partes iguais. Desse modo, podemos dizer
que 10% dos dados s�o inferiores ou iguais ao primeiro decil D1, 20% dos dados s�o
inferiores ou iguais ao segundo decil D2, e assim por diante, at� chegar ao �ltimo
decil D9. O quinto decil corresponde � mediana, haja visto que ele divide os dados
em dois blocos com 50% dos dados para cada lado, assim como a mediana.
Separatrizes s�o �teis para avaliar o comportamento de uma s�rie de dados e suas
tend�ncias, ou seja, se est�o mais concentrados nos dados mais inferiores, ou mais
superiores, por exemplo. Acompanhe a tela seguinte para saber como interpretar as
separatrizes.
Lembre-se sempre de que a mediana � um valor que separa os 50% menores valores dos
50% maiores. Vamos supor que uma determinada divis�o de um conjunto de dados seja
em 50 partes iguais. Note que 25 partes s�o menores ou iguais � mediana e 25 s�o
maiores. Assim, o valor que ocupa a 25� divis�o � a respectiva mediana.
O desvio m�dio � a m�dia das diferen�as dos valores de cada observa��o, em rela��o
� m�dia, conforme a f�rmula a seguir.
n
DM = Somat�rio(xi - x')/n
i=1
n
Var(X) = Somat�rio(xi - X')�/n
i=1
� = Raiz�Var(X)
Quanto maior o desvio padr�o, mais distantes entre si os dados est�o. Dados com
desvio padr�o zero s�o todos iguais entre si. Trata-se de uma �til medida de
dispers�o. Lembre-se que, quanto mais pr�ximo de zero for o valor do desvio-padr�o,
mais os valores observados est�o pr�ximos � m�dia.
Coeficiente de varia��o e propriedades
CV = s/x'(100)
A m�dia, uma medida de dispers�o, � a soma dos valores dividida pelo n�mero de
valores somados. O desvio padr�o mede a dispers�o dos dados e � dado por:
n
s = raiz�s� = raiz� Somat�rio(xi - X')�/n
i=1
Perceba que a dispers�o dos dados � bem menor, situando-se entre 1,5 e 2,4 para
ambas as vari�veis (X, Y). Nesse caso, como n�o h� nota��es em rela��o aos dados da
vari�vel, podemos comparar os desvios padr�es.
Para superar essas limita��es, podemos padronizar o desvio padr�o, de modo a criar
uma medida de dispers�o que possa se aplicar a conjuntos de dados com diferentes
m�dias e desvios. Essa medida � o coeficiente de varia��o.
n
CV = Somat�rio(xi)/n = (10+12+14+20)/4 = 14
i=1
n
s = raiz�s� = raiz� Somat�rio(xi - X')�/n =========================>
i=1
Da mesma forma, como esse coeficiente � uma medida padronizada, ele permite a
an�lise comparativa entre duas ou mais vari�veis, expressas em diferentes ordens de
grandeza. Uma vari�vel expressa em cent�metros pode ter sua dispers�o comparada com
uma vari�vel expressa em quilos, pois o coeficiente de varia��o � uma raz�o, uma
porcentagem em rela��o a cada m�dia.
Assimetria
Perceba que, com este gr�fico, � poss�vel fazer infer�ncias sobre simetria ou
assimetria daqueles dados.
Neste exemplo, h� uma perfeita simetria em torno da terceira classe, sendo que 50%
dos dados restantes est�o � direita dessa classe, e outros 50% � esquerda da mesma.
Ap = X-Mo/s
Experimentos aleat�rios
S�o baseados em resultados previstos, por�m regidos pelo acaso.
Por exemplo: a retirada de uma carta de um baralho franc�s, com 52 resultados
poss�veis, mas inesperados.
Experimentos determin�sticos
Esses experimentos ocorrem quando os resultados s�o previstos e determinados.
Por exemplo, a ebuli��o do etanol ao n�vel do mar.
Eventos certos s�o visualizados quando h� 100% de chances dos resultados esperados
estarem inclusos dentro do espa�o amostral.
Por exemplo: ao lan�ar-se um dado comum, tem-se o evento A = {N�meros naturais
menores ou iguais a seis e diferentes de zero}.
Eventos imposs�veis ocorrem quando n�o h� nenhum dado no espa�o amostral que
contemple o evento.
Por exemplo: no lan�amento de um dado comum, tem-se o evento B = {n�meros m�ltiplos
de 9}.
Perceba que h� situa��es em que alguns dados pertencem a mais de uma vari�vel.
Nesse caso, dizemos que h� uma intersec��o de alguns elementos em torno de dois ou
mais conjuntos.
Para a elimina��o de dupla contagem, a soma de dois conjuntos que possuem dados em
intersec��o deve incluir a subtra��o desses dados, de acordo com a equa��o.
AUB = A+B-(A~UB)
Experimentos aleat�rios
Experimentos aleat�rios s�o dados com base em resultados poss�veis, por�m incertos.
Por exemplo, o lan�amento de um dado de seis faces. Sabemos que o resultado ser�
entre um e seis, mas n�o qual ser� o resultado.
Espa�o amostral
O espa�o amostral consiste no conjunto de elementos e informa��es que cont�m todos
os poss�veis resultados gerados por um experimento (sobretudo os aleat�rios). Os
espa�os amostrais podem conter de zero a infinitos resultados poss�veis.
Por exemplo: o espa�o amostral de um dado de seis faces � dado por S = {1; 2; 3; 4;
5; 6}
Evento
Eventos s�o as situa��es definidas pelo pesquisador para a realiza��o de um
experimento.
Por exemplo, {n�meros �mpares de um dado}.
Eventos imposs�veis n�o possuem resultados vi�veis em um espa�o amostral, ent�o sua
probabilidade � igual a zero.
Soma = 1
P = P1 +P2 + ... + Pn
P(A) = n(A)/n(S)
P(A|B) = P(A~U)B/P(B)
A regra da adi��o nos mostra que, quando h� dados que pertencem a mais de um
conjunto, como n�meros pretos e vermelhos em uma roleta, a probabilidade de
obtermos um determinado resultado em dois eventos, A e B, � dada pela soma das
probabilidades desses eventos, subtraindo-se a probabilidade de encontrarmos dados
em intersec��o, ou seja, que perten�am aos dois eventos ao mesmo tempo, conforme a
f�rmula a seguir:
Permuta��es
A permuta��o � o processo de ordenar e reordenar os dados do conjunto dos poss�veis
resultados de um evento em uma sequ�ncia definida pelo pesquisador (MILONE;
ANGELINI, 1993).
Arranjos
Os arranjos s�o o n�mero total de resultados vi�veis nos subconjuntos de �x�
elementos de um espa�o amostral com �n� elementos.
Combina��es
As combina��es s�o onde a ordem dos elementos, dispostos como resultado de um
evento, em etapas, n�o � importante.
Vamos iniciar nossos estudos entendendo que a probabilidade � a raz�o que avalia as
chances de ocorr�ncia de um denominado evento, cujos poss�veis resultados est�o
submetidos a um espa�o amostral (BUSSAB; MORETTIN, 2010).
As vari�veis podem ser calculadas da seguinte forma:
P(A) = n(A)/n(S)
Por exemplo, imagine que temos como objetivo ver quantas vezes obteremos �cara� em
um jogo de �cara ou coroa�. Se lan�amos uma moeda para cima, a vari�vel aleat�ria
X, vari�vel designada para o n�mero de vezes que dar� �cara�, nos mostra que os
resultados poss�veis s�o zero, uma e duas ocorr�ncias para �cara�.
Vamos iniciar nossas discuss�es estudando que as distribui��es normais t�m por
principais caracter�sticas o fato de a m�dia dividir exatamente os valores
observados em duas metades. Desse modo, a representa��o gr�fica dessa distribui��o
� uma curva em forma de sino.
Z = (x - u)/�
Sabendo-se que o peso m�dio de uma caneta � de 60 gramas, temos que u=60. Se a
varia��o esperada � de tr�s gramas, o desvio padr�o � dado por �=3.
O Teorema do Limite Central nos mostra que, quanto mais uma amostra aumenta de
tamanho, mais essa distribui��o se aproxima de uma distribui��o normal, com as
maiores observa��es situadas em torno da m�dia.
Por meio desse Teorema, podemos verificar as probabilidades de ocorr�ncia de
eventos, a partir de um intervalo em torno da m�dia e com base em uma amostra.
Vamos iniciar nossos estudos com o conceito de correla��o linear, vejamos! Para o
caso de duas vari�veis de pesquisa, como a que mencionamos, a an�lise que ser�
discutida � tratada como an�lise bidimensional. Nesses casos, � poss�vel obter o
grau de associa��o entre vari�veis a partir do conceito de correla��o linear. As
formas de an�lise s�o: gr�fica e coeficiente de correla��o.
{(x1,y1),(x2,y2),...,(xn,yn)}
n
Cov(X,Y) = Somat�rio((xi - X')*(yi - Y'))/n
i=1
Regress�o linear
Voc� j� deve ter ouvido nos notici�rios econ�micos algumas previs�es dos
economistas a respeito da taxa esperada de infla��o, de desemprego ou de
crescimento econ�mico, n�o � mesmo?!
Essas medi��es n�o s�o feitas ao acaso, elas s�o obtidas a partir de s�ries de
dados que identificam tend�ncias, de acordo com o conceito de regress�o.
Regress�es permitem a visualiza��o de tend�ncias de distribui��o de conjuntos de
dados com mais de uma vari�vel explicativa.
Mas qual a fun��o que melhor compreende o conjunto de dados A = (1,3), (2,7),
(3,14), (4,13), (9,28)?
Nesse caso, devemos recorrer � regress�o linear simples. Ela demonstrar� a fun��o
que permite estimar os valores da vari�vel dependente Y em fun��o da vari�vel
independente X.
Siga em frente e conhe�a sobre esse tipo de regress�o linear!
Uma fun��o de regress�o linear simples � baseada em uma rela��o entre dados de duas
vari�veis dispostas de acordo com a seguinte equa��o:
Yi = a + bXi
ei = Yi - Yi
Quando efetuamos uma regress�o, � importante definir em que medida a varia��o dessa
regress�o e da vari�vel independente (X) explica a altern�ncia da vari�vel
dependente (Y).
Esse coeficiente tem valores distribu�dos entre zero e um. Quanto mais pr�ximo de
um for o coeficiente, mais a vari�vel independente X explica a varia��o da vari�vel
dependente Y.
Amostragem
Popula��o
Popula��o � o conjunto com todos os n elementos de uma vari�vel com uma
caracter�stica em comum.
Amostra
Amostra � o subconjunto finito da popula��o, com k elementos.
Principais t�cnicas de amostragem
As principais t�cnicas de amostragem s�o:
- casual ou aleat�ria simples;
- proporcional estratificada;
- sistem�tica.
Exemplo:
Separam-se os mil edif�cios de uma rua. Sorteia-se o n�mero 23. Uma amostra a dois
por cento deve conter cinquenta dados.
Ent�o, come�a-se pelo edif�cio 23 e colhe-se a cada cinquenta edif�cios (23, 73,
123... 923, 973).
Por exemplo:
Selecionando dez por cento dos indiv�duos mencionados acima, uma amostra ideal deve
conter duas pessoas que recebam um sal�rio, sete que recebam entre um e dois
sal�rios, e um que receba mais de dois sal�rios.
O Excel separa os dados coletados em c�lulas, sendo que cada c�lula comporta um
dado ou uma opera��o de an�lise estat�stica. Para efetuar esses c�lculos,
primeiramente, voc� ir� inserir o operador matem�tico de igual (�=�), o nome da
fun��o estat�stica e, fechado entre par�nteses, o intervalo de dados necess�rios �
sua an�lise (RIBEIRO J�NIOR, 2005). Para obter a m�dia dos valores de uma s�rie de
dados, voc� ir� digitar �=�, escrever M�DIA, selecionar o conjunto e apertar a
tecla �Enter�. O valor exibido na c�lula ser� a m�dia do conjunto analisado.
Separatrizes s�o n-1 valores que dividem um conjunto em n partes iguais. Por
exemplo, h� tr�s quartis que dividem um conjunto em quatro partes. Para obter o
primeiro quartil de um conjunto, voc� ir� teclar �=QUARTIL�, selecionar o conjunto
de dados e depois teclar os n�meros um, dois ou tr�s, sendo esse n�mero
correspondente ao quartil que voc� deseja obter.
Quando voc� tiver dados com uma ou mais vari�veis, eles podem ser organizados em
tabelas, que podem ser formatadas de forma manual ou por comandos.
O m�todo manual � uma forma de apresenta��o de dados no qual voc� recolhe os dados
relacionados a cada vari�vel e os organiza em colunas. Mas voc� pode tamb�m
selecionar esse conjunto de dados e clicar na op��o �formatar como tabela�, na
barra de menus. Ali, ser� criada uma tabela que permitir� a voc� reorganizar os
dados conforme seu interesse. Voc� pode tornar a tabela esteticamente mais
agrad�vel aplicando bordas (com o comando �borda superior ou inferior�) e
centralizando os dados.
Primeira etapa
Deve ser selecionado o tipo de gr�fico desejado. H� gr�ficos para cada tipo de
dados; para uma vari�vel, voc� pode utilizar um gr�fico em que os dados ficam
dispostos em colunas, por exemplo. Nessa etapa, um modelo b�sico de gr�fico ser�
exibido.
Segunda etapa
Agora, voc� dever� formatar o gr�fico. Voc� ir� ajust�-lo para tornar a
apresenta��o mais did�tica. Altere o t�tulo clicando nele e depois aloque a caixa
de legenda abaixo do gr�fico, ou a exclua. Por fim, insira informa��es a respeito
de cada um dos eixos, clicando na aba �ferramentas de gr�fico�, e depois em layout
e �t�tulos dos eixos�.