Você está na página 1de 32

ESTATSTICA E PROBABILIDADE

Professor: Msc Alexandre Correia Fernandes Graduado em Matemtica Especialista em Estatstica Mestre em Matemtica e Estatstica

INTRODUO ESTATSTICA

Aspectos gerais
A estatstica uma coleo de mtodos para planejar experimentos, obter dados e organiz-los, resumilos, analis-los, interpret-los e deles extrair informaes. A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a anlise e a interpretao desses dados ficam a cargo da Estatstica Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatstica, o fazem no sentido da organizao e descrio dos dados, desconhecendo que o aspecto essencial da Estatstica o de proporcionar mtodos inferenciais, que permitam concluses que transcendam os dados obtidos inicialmente.

Ela abrange muito mais do que o simples traado de grficos e o clculo das mdias. Em estatstica, utilizamos extensamente os termos populao e amostra. Esses termos, que passamos a definir, esto no prprio cerne da estatstica. Uma populao uma coleo completa de todos os elementos (valores, pessoas, medidas, etc.) a serem estudados. Um censo uma coleo de dados relativos a todos os elementos de uma populao.

Uma amostra uma subcoleo de elementos extrados de uma populao. Estreitamente relacionados com os conceitos de populao e amostra esto os conceitos de parmetro e estatstica. Um parmetro uma medida numrica que descreve uma caracterstica de uma populao. Uma estatstica uma medida numrica que descreve uma caracterstica de uma amostra.

Exemplo Em uma pesquisa com 1015 pessoas escolhidas aleatoriamente, 269 (ou 26,5%) possuam computador. Como a cifra de 26,5% se baseia em uma amostra, e no em toda a populao, trata-se de uma estatstica (e no um parmetro). J se uma pesquisa feita entre os 27 governadores do Brasil mostra que 20 (ou 74%) possuem computador, a cifra 74% um parmetro porque se baseia em toda a populao de governadores.

A natureza dos dados


Alguns conjuntos de dados (como alturas) consistem em nmeros, enquanto outros so no-numricos (como sexo, cor dos olhos). Aplicam-se as expresses dados qualitativos e dados quantitativos para distinguir esses dois tipos. Os dados qualitativos (ou dados categricos, ou atributos) podem ser separados em diferentes categorias que se distinguem por alguma caracterstica no-numrica.

Exemplos Em caixas de laranja amostradas, um tcnico especializado pode fazer a seguinte classificao: tima, boa, regular, ruim ou pssima; Quanto ao grau de necrose, a classificao pode ser: inexistente, leve, moderada, grave.

Os dados quantitativos consistem em nmeros que representam contagens ou medidas. Eles se subdividem em 2 tipos: discretos e contnuos.

Os dados discretos resultam de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores. (Ou seja, o nmero de valores possveis 0, ou 1, ou 2, etc).

Exemplos: Nmero de laranjas no aproveitveis por caixa; Nmero de acidentes de trabalho ocorridos no ms passado em uma fbrica; Quantidade de pacotes de p de caf com peso inferior a 500g; Nmero de eixos de um lote cujos dimetros satisfazem s especificaes.

Os dados contnuos (numricos) resultam de um nmero infinito de valores possveis que podem ser associados a pontos em uma escala contnua de tal maneira que no haja lacunas ou interrupes. Exemplos: Dimetro externo de esferas de ao a serem usadas na fabricao de rolamentos; Rendimento de uma reao qumica (%) Tempo gasto na entrega de pizzas nas residncias dos clientes; Quando os dados representam contagens, so discretos; quando representam mensuraes, so contnuos.

Usos e abusos da estatstica


Usos da estatstica Hoje praticamente todo campo se beneficia da utilizao de mtodos estatsticos. Vamos ver alguns exemplos: o Controle de qualidade de um produto; o Melhoramento animal; o Controle de doenas; o Espcies ameaadas so protegidas; o Reduo de taxas fatais.

Abusos da estatstica Algumas vezes os dados so apresentados de forma enganosa. Isso constitui um abuso da estatstica. Alguns dos que abusam da estatstica o fazem por descuido ou ignorncia; outros, porm, tm objetivos pessoais. Passemos a alguns exemplos das diversas maneiras como os dados podem ser distorcidos. Pequenas amostras: As pequenas amostras no so necessariamente ms; entretanto, os resultados obtidos com pequenas amostras podem por vezes ser usados como uma forma de mentira estatstica. As preferncias de 10 dentistas por determinado dentifrcio no devem servir de base para uma afirmao generalizada como A pasta dentifrcia X recomendada por 7 a cada 10 dentistas. Mesmo que a amostra seja grande ela no deve ser tendenciosa.

Nmeros precisos: s vezes, os prprios nmeros podem ser enganosos. Uma cifra $37.735,29 pode parecer muito precisa enquanto que a cifra $37.700,00 no infunde o mesmo senso de preciso. No entanto, uma estatstica com muitas casas decimais no necessariamente precisa. Estimativas por suposio: Estimativas por suposio podem apresentar erros substanciais. preciso considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami, as fontes oficiais estimaram uma multido de 250.000 pessoas, mas utilizando fotos areas e grades chegou-se a uma cifra mais precisa de 150.000 pessoas.

Porcentagens distorcidas: Por vezes utilizam-se porcentagens confusas ou distorcidas. Num anncio de pgina inteira, a Continental Airlines anuncia que no caso de bagagens extraviadas se trata de uma rea em que j melhoraram 100% nos ltimos 6 meses. Em uma crtica a esta estatstica, o New York Times interpretou corretamente uma melhora de 100% significando que no se extravia mais qualquer bagagem, o que no verdade. Cifras parciais: Noventa por cento dos carros de certa marca vendidos nos EUA nos ltimos 10 anos ainda esto rodando. Milhes de consumidores ficaram com a impresso de que os carros devem ter sido muito bem construdos para durarem tanto. O que o fabricante no mencionou que 90% dos carros por ele vendidos, o foram nos ltimos 3 anos.

Perguntas tendenciosas: As perguntas em uma pesquisa podem ser formuladas de modo a sugerirem uma resposta. Um exemplo famoso envolve o candidato presidncia dos EUA que formulou a seguinte pergunta em um questionrio: O presidente deve ter o poder de vetar as decises do Congresso? Noventa e sete por cento das respostas foram sim. Entretanto, esse percentual caiu para 57% quando a pergunta foi O presidente deve ter, ou no, o poder de vetar as decises do Congresso? s vezes, at mesmo a ordem dos itens a serem considerados pode influenciar na resposta. Grficos enganosos: Muitos dispositivos visuais podem ser utilizados para exagerar ou diminuir a verdadeira natureza de um conjunto de dados.

Ganho sem anal m ediano em dlares

Ganho sem anal m ediano em dlares

800 700 600 500 400 300 200 100 0 Homens Mulheres

800 750 700 650 600 550 500 Homens Mulheres

Pictogrficos: Os desenhos de objetos, chamados pictogrficos, tambm podem levar a erros. Ao desenhar objetos para ilustrar dados o artista pode criar falsas impresses. Por exemplo, se duplicarmos o lado de um quadrado, a rea desse quadrado no apenas duplicada e, sim quadruplicada.

Presso do pesquisador: Quando se formulam perguntas a indivduos pesquisados, esses freqentemente do respostas favorveis sua autoimagem Ms amostras: Uma fonte de estatstica enganosa so os mtodos inadequados de coleta de dados. Um exemplo uma pesquisa auto-selecionada. Esta constitui de uma pesquisa em que os prprios entrevistados sero includos.

Planejamento de experimentos
Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e executados, dando resultados confiveis, aos que so concebidos deficientemente e mal executados, levando a concluses enganosas e sem qualquer valor real. Eis alguns pontos importantes para o planejamento de um estudo capaz de produzir resultados vlidos: 1. Identificar com preciso a questo a ser respondida e definir com clareza a populao de interesse.

2. Estabelecer um plano para coleta de dados. Esse plano deve descrever detalhadamente a realizao de um estudo observacional ou de um experimento (ambos definidos a seguir), e deve ser elaborado cuidadosamente, de modo que os dados coletados representem efetivamente a populao em questo. 3. Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem resultar de uma coleta tendenciosa de dados. 4. Analisar os dados e tirar concluses. Identificar tambm possveis fontes de erros.

Obs.: Como j dissemos, o objetivo ltimo da Estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases correspondentes estatstica descritiva, fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica indutiva ou inferencial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses. Os estudos que requerem mtodos estatsticos decorrem tipicamente de duas fontes comuns: estudos observacionais e experimentos. Em um estudo observacional, verificamos e medimos caractersticas especficas, mas no tentamos manipular ou modificar os elementos a serem estudados.

Em um experimento, aplicamos determinado tratamento e passamos ento a observar seus efeitos sobre os elementos a serem pesquisados. Passamos agora a definir os cinco mtodos mais comuns de amostragem. Amostragem aleatria Em uma amostra aleatria, os elementos da populao so escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatria simples de n elementos, de maneira que toda amostra de tamanho n possvel tenha a mesma chance de ser escolhida.

Exemplo: Seja um conjunto constitudo por 50 corpos de prova. Obter uma amostra representativa de 10% para a pesquisa do grau de dureza destes corpos de prova: a) Numeramos os corpos de prova de 01 a 50. b) Escrevemos os nmeros, de 01 a 50, em pedaos iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaos de papel e retiramos, um a um, cinco nmeros que formaro a amostra.

Amostragem estratificada Com a amostragem estratificada, subdividimos a populao em, no mnimo, duas subpopulaes (ou estratos) que compartilham das mesmas caractersticas (como sexo) e, em seguida, extramos uma amostra de cada estrato. Exemplo: Suponhamos que, dos noventa funcionrios de uma empresa, 54 sejam do sexo masculino e 36 sejam do sexo feminino. Obter uma amostra proporcional estratificada de 10 % desta populao.

H dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da populao. Logo, temos:
Sexo M F total Populao 54 36 90 10% 5,4 3,6 9,0 Amostra 5 4 9

A prxima fase consiste em selecionar, quer seja por sorteio, quer seja pelo uso de uma tabela de nmeros aleatrios ou outro mtodo qualquer, os 5 funcionrios e as 4 funcionrias para comporem a amostra.

Amostragem sistemtica Na amostragem sistemtica, escolhemos um ponto de partida, e selecionamos cada k-simo elemento (como por exemplo cada 50 elemento) da populao. Exemplo: Suponhamos uma rua contendo novecentos prdios, dos quais desejamos obter uma amostra formada de cinqenta prdios. Podemos, neste caso, usar o seguinte procedimento: como 900/50=18, escolhemos por sorteio casual um nmero de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o nmero sorteado fosse o 4, tomaramos, pelo lado direito da rua, o 4 prdio, o 22, o 40 etc., at voltarmos ao incio da rua, pelo lado esquerdo.

Amostragem por conglomerados Na amostragem por conglomerados, comeamos dividindo a rea da populao em sees (ou conglomerados); em seguida escolhemos algumas dessas sees e, finalmente, tomamos todos os elementos das sees escolhidas. Uma diferena importante entre a amostragem por conglomerados e a amostragem estratificada que a amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem estratificada utiliza uma amostra de membros de cada estrato. Exemplo: Numa pesquisa pr-eleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais, pesquisamos todos os elementos de cada uma das zonas escolhidas.

Amostragem de convenincia Na amostragem por convenincia, simplesmente utilizamos resultados que j esto disponveis. Obs.: Em alguns casos, os resultados da amostragem de convenincia podem at ser bons, mas em outros casos podem apresentar sria tendenciosidade. Exemplo: Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente um estudante pesquisar seus prprios colegas de classe, porque esto ao seu alcance imediato. Mesmo que tal amostra no seja aleatria, os resultados devem ser bem satisfatrios.

No importa quo bem planejemos e executemos o processo de coleta de amostras, h sempre a possibilidade de um erro nos resultados. Um erro amostral a diferena entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuaes amostrais aleatrias. Ocorre um erro no-amostral quando os dados amostrais so coletados, registrados ou analisados incorretamente. Tais erros resultam de um erro que no seja uma simples flutuao amostral aleatria, como a escolha de uma amostra no-aleatria e tendenciosa, a utilizao de um instrumento de mensurao defeituoso, uma questo formulada de modo tendencioso, um grande nmero de recusas de resposta ou a cpia incorreta dos dados amostrais.

Você também pode gostar