Você está na página 1de 22

NOES DE ESTATSTICA: 1 Estatstica descritiva e anlise exploratria de dados: grficos, diagramas, tabelas, medidas descritivas (posio, disperso, assimetria

e curtose). 2 Probabilidade. 2.1 Definies bsicas e axiomas. 2.2 Probabilidade condicional e independncia. 2.3 Variveis aleatrias discretas e contnuas. 3 Inferncia estatstica. 4 Tcnicas de amostragem. 4.1 Amostragem aleatria simples. 4.2 Amostragem estratificada. 4.3 Amostragem sistemtica. 4.4 Amostragem por conglomerados.

1. ESTATSTICA DESCRITIVA E ANLISE EXPLORATRIA DE DADOS: GRFICOS, DIAGRAMAS, TABELAS, MEDIDAS DESCRITIVAS (POSIO, DISPERSO, ASSIMETRIA E CURTOSE) Estatstica Descritiva A Estatstica Descritiva pode ser definida como um conjunto de tcnicas destinadas a descrever e resumir dados, a fim de que possamos tirar concluses a respeito de caractersticas de interesse. Em geral utilizamos a Estatstica Descritiva na etapa inicial da anlise quando tomamos contato com os dados pela primeira vez. Objetivando tirar concluses de modo informal e direto, a maneira mais simples seria a observao dos valores colhidos. Entretanto ao depararmos com uma grande massa de dados percebemos, imediatamente, que a tarefa pode no ser simples.Para tentar retirar dos dados informaes a respeito do fenmeno sob estudo, preciso aplicar algumas tcnicas que nos permitam simplificar a informao daquele particular conjunto de valores. A finalidade da Estatstica Descritiva tornar as coisas mais fceis de entender, de relatar e discutir. A mdia industrial Dow-Jones, a taxa de desemprego, o custo de vida, o ndice pluviomtrico, a quilometragem mdia por litro de combustvel, as mdias de estudantes so exemplos de dados tratados pela Estatstica Descritiva.

Anlise Exploratria A anlise exploratria de dados nos fornece um extenso repertrio de mtodos para um estudo detalhado dos dados, antes de adapt-los. Nessa abordagem, a finalidade obter dos dados a maior quantidade possvel de informao, que indique modelos plausveis a serem utilizados numa fase posterior, a anlise confirmatria de dados ou inferncia estatstica.

reas da Estatstica Se entender Estatstica como a Cincia dos Dados, ser de grande valia o domnio que seu corpo de conhecimento pode oferecer. Primeiramente, como ponto de partida, pode-se dividir a Estatstica em duas reas: Descritiva Inferencial (Indutiva) Alguns autores, como por exemplo, Marcos Nascimento Magalhes e Antonio Carlos Pedroso de Lima, dizem que a estatstica, grosso modo, pode ser dividida em trs reas: Estatstica descritiva; Probabilidade e Inferncia estatstica. Estatstica Descritiva A Estatstica Descritiva se preocupa com a organizao, apresentao e sintetizao de dados. Utilizam grficos, tabelas e medidas descritivas como ferramentas. Utilizada na etapa inicial da anlise, destinada a obter informaes que indicam possveis modelos a serem utilizados numa fase final que seria a chamada inferncia estatstica. Anlise Exploratria de Dados - Prof. Dr. Waldir Medri Estatstica Inferencial A Estatstica Inferencial postula um conjunto de tcnicas que permitem utilizar dados oriundos de uma amostra para generalizaes sobre a populao. Constitui esse conjunto de tcnicas: a determinao do nmero de observaes (tamanho da amostra); o esquema de seleo das unidades observacionais; o clculo das medidas estatsticas; a determinao da confiana nas estimativas; a significncia dos testes estatsticos; a preciso das estimativas; dentre outras. Essa generalizao feita a partir do processo de estimao das medidas estatsticas que podem ser calculadas, porm no sem antes se antecipar um grau de certeza de que a amostra esteja fornecendo os dados que seriam de se esperar caso toda a populao fosse estudada. Nesse caso, o ramo da matemtica que ser utilizado para se avaliar tal grau de certeza a probabilidade. Com ela teremos condies de mensurar a fidedignidade de cada inferncia feita com base na amostra.

2. PROBABILIDADE A Probabilidade pode ser pensada como o teoria matemtica utilizada para estudar a incerteza oriunda de fenmenos que envolvem o acaso. Jogos de dados e de cartas, ou o lanamento de uma moeda para o ar enquadram-se na categoria do acaso. A maioria dos jogos esportivos tambm influenciada pelo acaso at certo ponto. A deciso de um fabricante de cola de empreender uma grande campanha de propaganda visando a aumentar sua participao no mercado, a deciso de parar de imunizar pessoas com menos de vinte anos contra determinada doena, a deciso de arriscar-se a atravessar uma rua no meio do quarteiro, todas utilizam a probabilidade consciente ou inconscientemente.

2.1 DEFINIES BSICAS E AXIOMAS Definies Bsicas Suponha que vamos realizar um experimento cujo resultado no pode ser predito de antemo. Entretanto, suponha que saibamos todos os possveis resultados de tal experimento. Este conjunto de todos os resultados possveis, que denotaremos por , chamado de espao amostral do experimento. Assim, temos a seguinte definio: Definio 1. O conjunto de todos os resultados possveis de um determinado ex- perimento chamado de espao amostral. Exemplo 1. Se o experimento consiste em lanar uma moeda, ento = {Ca, Co}, onde Ca cara e Co coroa.

Exemplo 2. Se o experimento consiste em lanar um dado e observar a face superior, ento = {1, 2, 3, 4, 5, 6}. Exemplo 3. Se o experimento consiste em lanar duas moedas, ento = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}, onde o resultado (a, b) ocorre se a face da primeira moeda a e a face da segunda moeda b. Exemplo 4. Se o experimento consiste em lanar dois dados e observar as faces superiores, ento

>

onde o resultado (i, j) ocorre se a face i aparece no primeiro dado e a face j no segundo dado.

Exemplo 5. Se o experimento consiste em medir a vida til de um carro, ento um possvel espao amostral consiste de todos os nmeros reais no-negativos, isto , = [0; ).

Definio e Propriedades das Probabilidades H vrias interpretaes da probabilidade. Discutiremos as trs mais correntes: Clssica: Baseia-se no conceito de equiprobabilidade, ou seja, de resultados equiprovveis.

Freqentista: Baseia-se na freqncia relativa de um nmero grande de realizaes do experimento. Seja A um evento, ento

Subjetiva: Baseia-se em crenas e/ou informaes do observador a respeito do fenmeno em estudo. Por exemplo, seja o evento C chove em Moscou.

No nos preocuparemos com o problema de como definir probabilidade para cada experimento. Assentaremos a base axiomtica da teoria das probabilidades tal como foi erigida pelo matemtico russo Kolmogorov, responsvel pela base matemtica solida da teoria.

AXIOMAS DA PROBABILIDADE Requisitos bsicos Para que se possa ter um conceito de probabilidade que seja isento de circularidade e independente de simetria preciso que se adote uma construo matemtica cuidadosa. Desse modo, preciso definir uma srie de conceitos bsicos a partir dos quais se possa enunciar, de modo claro e sem ambigidades, o que vem a ser a probabilidade de um evento. Os conceitos bsicos a partir dos quais se constri a definio de probabilidade so conhecidos como os axiomas da probabilidade, sendo o seu conhecimento importante no apenas para o entendimento dessa definio, mas tambm para compreender claramente as condies necessrias sua aplicao.

Conceitos Bsicos: Experimento Aleatrio Um experimento pode ser pensado como um teste para se demonstrar uma afirmativa, para examinar a validade de uma hiptese, ou para se determinar a eficcia de alguma coisa nunca tentada previamente. A conduta de um tal teste constitui um experimento. Um bom exemplo de experimento o ato de jogar uma moeda sobre uma superfcie plana e anotar o resultado (cara ou coroa), assim como o lanamento de um dado ou o sorteio cego de uma bola a partir de uma urna com mltiplas bolas coloridas. Um ingrediente fundamental na teoria da probabilidade a noo de um experimento que, ao menos hipoteticamente, pode ser repetido sob condies essencialmente idnticas, porm conduzindo a resultados diferentes em tentativas diferentes. Em outras palavras, trata-se de uma situao onde, para todos os fins prticos, causas iguais geram (ou podem gerar) efeitos diferentes. Quando se diz ser possvel repetir um experimento sob condies essencialmente idnticas, naturalmente est-se pensando no controle de um certo nmero de fatores. claro que seria impossvel controlar absolutamente todos os fatores em questo. Na realidade, so justamente esses fatores no controlados (tambm chamados de variveis de confuso, variveis estranhas ou variveis esprias) que iro constituir a aleatoriedade do fenmeno. Esta uma forma de visualizar o conceito. Tome-se, por exemplo, o caso do lanamento de uma moeda. De um lanamento para o outro, no se pode garantir que as condies sejam exatamente as mesmas. A exata posio inicial dos objetos e personagens envolvidos, bem como a intensidade e direo precisas da fora de lanamento, no sero rigorosamente as mesmas. As condies gerais, contudo, tais como a moeda, o indivduo que faz o lanamento e a mesa, podem ser idnticas, mas muitos fatores simplesmente no sero controlados. Caso tudo fosse absolutamente controlado, ento poder-se-ia supor que os resultados seriam os mesmos, ou talvez nem assim, visto que, aparentemente, existem incertezas fundamentais no universo, tais como as que so evidenciadas no fenmeno quntico.

Espao Amostral Um espao amostral o conjunto de todos os possveis resultados de um experimento aleatrio, ou de todos os resultados considerados possveis. Assim, o espao amostral do lanamento de uma moeda seria uma coleo de resultados que inclui: cara, coroa, a moeda cair em p, a moeda ser despedaada por uma bala perdida, um pssaro apanhar a moeda em pleno ar e fugir com ela, a moeda ser acidentalmente engolida pelo experimentador e outros. Excluindo os resultados muito inverossmeis, perfeitamente razovel considerar apenas cara e coroa. O espao amostral costuma ser designado pela letra grega mega ( ), de modo que, no exemplo do lanamento de uma moeda: {cara, coroa}. J no caso da medida da presso arterial sistlica de um indivduo, o espao amostral seria uma faixa plausvel de valores contnuos, como, por exemplo, a faixa de 50 mmHg a 250 mmHg ( 50,250

Evento Um evento um subconjunto do espao amostral, ou seja, uma coleo de resultados possveis que pode ser igual ou menor do que o espao amostral como um todo. Desse modo, se o espao amostral do lanamento de um dado comum de seis faces for {1, 2, 3, 4, 5, 6}, ento qualquer combinao desses resultados ser um evento. Assim, diversos eventos podem ser identificados, tais como a ocorrncia de cada face especfica ({1}, {2}, {3}, {4}, {5} ou {6}), a ocorrncia de uma face par ({2, 4, 6}) ou mpar ({1, 3, 5}), a ocorrncia de valores abaixo de "3" ({1, 2}) e outros.

lgebra lgebra um conjunto de eventos de um espao amostral, conjunto esse definido pelas seguintes duas propriedades fundamentais:

Para qualquer evento pertencente lgebra, o seu complementar (tomado em relao ao espao amostral) tambm pertence lgebra; Se dois eventos pertencem lgebra, a sua unio tambm pertence lgebra.

O primeiro postulado implica em dizer que, se se est interessado na ocorrncia de um evento, ento, automaticamente, se estar interessado na sua no-ocorrncia. J o conjunto dos dois tem como conseqncias que, para toda lgebra:

O evento vazio (nenhum evento ocorreu) pertence lgebra; O espao amostral pertence lgebra (algum evento da lgebra necessariamente ocorrer); Se dois conjuntos pertencem lgebra ento a sua interseo tambm pertence lgebra; Se um nmero qualquer de eventos pertence lgebra, ento as operaes lgicas entre eles (operaes de conjunto - complementos, unies, intersees e diferenas simtricas) tambm pertencem lgebra; Uma lgebra pode ter um nmero infinito de eventos; Qualquer nmero finito de operaes com eventos (operaes de conjunto - complementos, unies, intersees e diferenas simtricas) apresenta resultados que pertencem lgebra; Quando todos os resultados de um nmero infinito (porm enumervel) de operaes com eventos (operaes de conjunto - complementos, unies, intersees e diferenas simtricas) apresentam resultados que pertencem lgebra, esta ltima passa a ser denominada de sigmalgebra.

As afirmativas acima funcionam como uma verdadeira lista de itens a serem verificados para que faa sentido o uso da expresso "lgebra de eventos".

Axiomas de Kolmogorov Em 1933 o matemtico russo Andrei Nikolaevich Kolmogorov (1903 - 1982) lanou as bases axiomticas da probabilidade e desenvolveu toda uma teoria que constituiu um enorme avano na rea, estabelecendo um marco histrico. No obstante o nvel avanado de matemtica necessrio para uma compreenso aprofundada do assunto, os seus princpios bsicos so relativamente simples e intuitivos, permitindo que se tenha uma boa compreenso dos conceitos e suas aplicaes prticas. Essencialmente, os axiomas de Kolmogorov estabelecem que: 1) Associados aos possveis resultados de um experimento aleatrio, existe sempre um espao amostral e uma lgebra de eventos; 2) Para todo evento da lgebra, existe um nmero no-negativo (maior ou igual a zero), chamado de probabilidade, que se atribui a tal evento; 3) A probabilidade do espao amostral igual a 1; 4) Para quaisquer dois eventos disjuntos (que no compartilham nenhum resultado) a probabilidade da unio deles igual soma das suas probabilidades; 5) O 4 Axioma verdadeiro para infinitas unies, desde que todos os pares de eventos sejam disjuntos. A aplicao da lgica matemtica aos postulados acima leva s seguintes propriedades fundamentais da probabilidade:

A probabilidade de qualquer evento sempre um nmero maior ou igual a zero e menor ou igual a um; A probabilidade de um evento impossvel zero; Se a ocorrncia de um evento implica na ocorrncia de um segundo, ento a probabilidade do primeiro menor do que a probabilidade do segundo; A probabilidade da unio de dois eventos igual probabilidade do primeiro mais a probabilidade do segundo menos a probabilidade da ocorrncia simultnea dos dois.

A importncia do Conceito de Partio A partio de um conjunto uma coleo de conjuntos tal que a sua unio igual ao conjunto original, e que a interseo de quaisquer dois deles vazia. Ao se particionar um evento, possvel se calcular a sua probabilidade somando-se a probabilidade dos eventos da partio. Para isso necessrio apenas dispor-se das probabilidades dos elementos da partio (vide Axiomas 4 e 5). Atravs do particionamento de conjuntos, possvel no apenas se calcular a probabilidade de eventos a partir de outras probabilidades j conhecidas mas tambm deduzir diversas propriedades e implicaes do prprio conceito de probabilidade.

2.2 PROBABILIDADE CONDICIONAL E INDEPENDNCIA Probabilidade Condicional Permite analisar o resultado de um experimento aleatrio (clculo de probabilidades), quando existe interveno no espao amostral (e.g., quando temos informao incompleta).

Exemplos: Num experimento em que um dado lanado duas vezes, sabe-se que a soma dos dois resultados vale 9. Qual a probabilidade de que o primeiro resultado tenha sido 6? Um objeto detectado por um radar. Qual a probabilidade de que seja um avio? Qual a probabilidade de que o paciente esteja doente, dado que o teste deu negativo?

Exemplos: Suponha que em uma sala de aula com 15 meninos e 10 meninas, um aluno escolhido ao acaso para realizar uma tarefa na aula de 4a. feira. Um outro aluno escolhido aleatoriamente para realizar a mesma tarefa na aula de 6a. feira. Dado o resultado da escolha de 4a. feira, qual a probabilidade de que na 6a. feira o aluno escolhido seja do sexo masculino? Duas respostas so possveis, dependendo do resultado de 4a. feira: 1. Um menino foi escolhido na 4a. feira P[outro menino ser escolhido na 6a. feira ] = 14/24 2. Uma menina foi escolhida na 4a. feira

P[um menino ser escolhido na 6a. feira ] = 15/24 Estas so probabilidades condicionais! Nota: Se no tivssemos nenhuma informao sobre o resultado de 4a. feira, a resposta seria 15/25 Se sabemos que um determinado evento B ocorreu, ento o espao amostral para outro evento subsequente reduzido para os resultados possveis luz desta informao, ou seja, os resultados pertencentes a B. Para determinar a probabilidade da ocorrncia de um outro evento A, devemos considerar o conjunto de resultados em B que tambm resultam na ocorrncia de A este o evento AB. Probabilidade Condicional Definio Sejam A e B dois eventos associados a um experimento aleatrio E e definidos em um espao amostral .

A expresso P [A|B ] representa a probabilidade de ocorrncia do evento A, dado que o evento B ocorreu. Regra do Produto P [AB ] = P [A|B ]P [B ] = P [B |A]P [A]

Probabilidade condicional funo probabilidade (satisfaz os trs axiomas):

... e, portanto, tambm satisfaz as propriedades decorrentes dos axiomas:

Independncia de Eventos Dois eventos aleatrios A e B so independentes se, e somente se:

Quando dois eventos so independentes, a ocorrncia de um no exerce nenhuma influncia na probabilidade de ocorrncia do outro. Nota: Independncia hiptese (no de natureza estatstica) Exemplos:

Propriedades

2.3 VARIVEIS ALEATRIAS DISCRETAS E CONTNUAS Varivel o conjunto de resultados possveis de um fenmeno (ou observao, ou caracterstica). Para os fenmenos: - sexo - dois resultados possveis: masculino e feminino; (no pode ser medida: um atributo) - nmero de filhos tidos de um grupo de casais - resultados possveis: 0, 1, 2, 3, 4, 5, ..., n; - peso de pessoas adultas - resultados possveis: 60 kg, 59,3 kg, 75,3 kg, 65,3 kg, ...; pode tomar um infinito nmero de valores num certo intervalo.

TIPOS DE VARIVEIS 1. Varivel Qualitativa: quando seus valores so expressos pr atributos ou qualidade. Exemplos: . Populao: Estudantes universitrios do Estado do Par. Variveis: sexo, profisso, escolaridade, religio, meio onde vivem (rural, urbano). . Populao: Populao dos bairros perifricos do municpio de Belm Variveis: tipo de casa, existncia de gua encanada (sim, no), bairro de origem. Variveis qualitativas que no so ordenveis recebem o nome de nominais. Exemplo: religio, sexo, raa, cor. Raa do Paraense - 2001 Raa Frequncia Branca Negra

Parda Outra Total Fonte: Fictcia Variveis qualitativas que so ordenveis recebem o nome de ordinais. Exemplo: nvel de instruo, classe social. Classe social do Paraense - 2001 Classe social Frequncia Classe A Classe B Classe C Classe D Total Fonte: Fictcia

2. Varivel Quantitativa: quando seus valores so expressos pr nmeros. Esses nmeros podem ser obtidos pr um processo de contagem ou medio. Exemplos: . Populao: Todos os agricultores do Estado do Par. Variveis: nmero de filhos tidos, extenso da rea plantada, altura, idade. . Populao: Populao dos bairros perifricos do municpio de Belm Variveis: nmero de quartos, rea da casa em m2, nmero de moradores da casa. A varivel quantitativa dividi-se em: 1. Varivel Discreta: so aquelas que podem assumir apenas valores inteiros em pontos da reta real. possvel enumerar todos os possveis valores da varivel. Exemplos: . Populao: Universitrios do Estado do Par. Variveis: nmero de filhos, nmero de quartos da casa, nmero de moradores, nmero de irmos. 2. Varivel Contnua: so aquelas que podem assumir qualquer valor num certo intervalo (contnuo) da reta real. No possvel enumerar todos os possveis valores. Essa variveis, geralmente, provm de medies. . Populao: Todos os agricultores do Estado do Par. Variveis: idade, renda familiar; extenso da rea plantada (em m2 ) , peso e altura das crianas agricultoras.

EXPERIMENTO ALEATRIO So aqueles que, repetidos em idnticas condies, produzem resultados diferentes. Embora no se saiba qual o resultado que ir ocorrer num experimento, em geral, consegue-se descrever o conjunto de todos os resultados possveis que podem ocorrer. As variaes de resultados, de experimento para experimento, so devidas a uma multiplicidade de causas que no podemos controlar, as quais denominamos acaso. Exemplos de Experimentos Aleatrios a) Lanar uma moeda e observar a face de cima. b) Lanar um dado e observar o nmero da face de cima. c) Lanar duas moedas e observar as seqncias de caras e coroas obtidas. d) Lanar duas moedas e observar o nmero de caras obtidas e) De um lote de 80 peas boas e 20 defeituosas, selecionar 10 peas e observar o nmero de peas defeituosas. f) De um baralho de 52 cartas, selecionar uma carta, e observar seu naipe. g) Numa cidade onde10% dos habitantes possuem determinada molstia, selecionar 20 pessoas e observar o nmero de portadores da molstia. h) Observar o tempo que um aluno gasta para ir de nibus, de sua casa at a escola. i) Injetar uma dose de insulina em uma pessoa e observar a qunatidade de acar que diminuiu. j) Sujeitar uma barra metlica a trao e observar sua resistncia.

Exemplo 2: Consideremos os dados relativos ao aproveitamento num curso de Matemtica para o 1 perodo de Administrao 2003/2 da Faculdade UNIVILA, apresentados abaixo de forma ligeiramente diferente das tabelas de freqncias anteriores, apenas para ilustrar outra maneira de preparar uma tabela de freqncia.

3. INFERNCIA ESTATSTICA Inferncia Estatstica o estudo de tcnicas que possibilitam a extrapolao, a um grande conjunto de dados, das informaes e concluses obtidas a partir de subconjuntos de valores, usualmente de dimenses muito menores. Deve-se notar que se tivermos acesso a todos os elementos que desejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica; entretanto, elas so indispensveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por razes de natureza econmica, tica ou fsica.

Fases do Trabalho Estatstico O trabalho estatstico um mtodo cientfico, que consiste das cinco etapas bsicas seguintes: 1- Coleta e crtica de dados 2- Tratamento dos dados 3- Apresentao dos dados

4- Anlise e interpretao dos resultados 5- Concluso

Vamos tratar cada uma dessas etapas: Coleta e crtica dos dados Aps definirmos cuidadosamente o problema que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio. A coleta pode ser direta ou indireta. A coleta direta quando feita sobre elementos informativos de registro obrigatrio (nascimentos, casamentos e bitos, importao e exportao de mercadorias), elementos pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de inquritos e questionrios. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) Contnua quando feita continuamente, tal como a de nascimentos e bitos e a de freqncia dos alunos s aulas. b) Peridica quando feita em intervalos constantes de tempo, como os censos e as avaliaes mensais dos alunos. c) Ocasional Quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta indireta quando inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como por exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos por uma coleta direta. Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou certo vulto, que possam influir sensivelmente nos resultados.

A crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feitas; interna quando visa observar os elementos originais dos dados da coleta.

Tratamento dos dados Nada mais do que a soma e o processamento dos dados obtidos e a disposio mediante critrios de classificao Pode ser manual ou eletrnica.

Apresentao dos dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada tabelas e grficos tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico.

Anlise dos resultados Aps a apresentao dos dados devemos calcular as medidas tpicas convenientes para fazermos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Indutiva ou Inferencial, e tirarmos desses resultados concluses e previses.

Concluso de responsabilidade de um especialista no assunto que est sendo pesquisado, que no necessariamente um estatstico, relatar as concluses de maneira que sejam facilmente entendidas por quem as for usar na tomada de decises.

4. TCNICAS DE AMOSTRAGEM Uma amostragem ser probabilstica se todos os elementos da populao tiverem probabilidade conhecida, e diferente de zero, de pertencer amostra. Desta forma, a amostragem probabilstica implica um sorteio com regras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Consideraremos aqui as seguintes tcnicas de amostragem: 1 Amostragem Aleatria Simples 2 Amostragem Proporcional Estratificada 3 Amostragem Sistemtica

4.1 AMOSTRAGEM CASUAL OU ALEATRIA SIMPLES Este tipo de amostragem equivalente a um sorteio lotrico. A Amostragem Aleatria Simples constituda de elementos retirados ao acaso da populao. Ento todo elemento da populao tem probabilidade fixa de ser amostrado. Por isso que a esse tipo de amostragem tende a produzir amostras representativas. Esta tcnica usada quando a identificao dos elementos da populao extremamente difcil, porm pode ser relativamente fcil dividir a populao em conglomerados (subgrupos) heterogneos representativos da populao global. A seguir, descrito o procedimento de execuo desta tcnica: 1. Seleciona uma amostra aleatria simples dos conglomerados existentes; 2. Realizar o estudo sobre todos os elementos do conglomerado selecionado. So exemplos de conglomerados: quarteires, famlias, organizaes, agncias, edifcios, etc. Exemplo: Estudar a populao de uma cidade, dispondo apenas do mapa dos quarteires da cidade. Neste caso, no temos a relao dos moradores da cidade, restando o uso dos subgrupos heterogneos (conglomerados). Para realizar o estudo estatstico sobre a cidade, realizaremos os seguintes procedimentos: 1. Numerar os quarteires de 1 a n; 2. Escrever os nmeros de 1 a n em pedaos de papel e coloc-los em uma urna; 3. Retirar um pedao de papel da urna e realizar o estudo sobre os elementos do conglomerado selecionado.

Exemplo: Geralmente so considerados aleatrios os seguintes processos: A chegada de carros a um posto de pedgio As chamadas telefnicas numa grande mesa de operao A chegada de clientes aos caixas de um supermercado A produo de qualquer processo mecnico Sucessivos lances de moeda ou de dado Tempo de servio em estaes de pedgio de mxima importncia dar cuidadosa ateno maneira como se escolhem os itens, bem como se eles so igualmente provveis. Exemplo: Imagine que 500 clientes esto cadastrados em sua empresa e voc precisa obter uma amostra aleatria de 2% dos cadastros. O que voc faria?

Como queremos uma amostra de 2% dos cadastros, precisamos sortear 10 deles. Faremos isso seguindo os seguintes passos: 1 Numeramos os cadastros de 001 a 500. 2 - Para o sorteio exibiremos duas opes: a) Escreva os nmeros de 001 a 500, em pedaos iguais de um mesmo papel, colocando-os dentro de uma caixa. Agite sempre a caixa para misturar bem os pedaos de papel e retire, um a um, dez nmeros que formaro a amostra. b) Coloque em uma urna, bolas numeradas de zero a nove, inclusive, misture bem e retire uma. Anote o nmero dessa bola que ser o primeiro dgito do nmero do cadastro que ser amostrado. Volte a bola retirada urna, misture bem e retire outra. O nmero dessa segunda bola ser o segundo dgito do nmero do cadastro que ser amostrado. O procedimento dever ser repetido at completar os trs dgitos da numerao utilizada. Como a populao constituda por 500 cadastros, devem ser desprezados os nmeros maiores do que 500, bem como os nmeros que j foram sorteados e o nmero 000. O sorteio dever ser repetido at se conseguir a amostra de 10 cadastros.

O processo de seleo exige que se atribuam nmeros consecutivos aos itens listados escolhendo-se depois, aleatoriamente, os nmeros dos itens que comporo a amostra. Conceitualmente, podemos usar cartas, dados, fichas numeradas ou bolas numeradas para gerar nmeros aleatrios para gerar nmeros aleatrios correspondentes aos nmeros de nossa listagem. Na prtica, tais dispositivos so empregados raramente, por vrias razes. Uma dela que cada dispositivo deixa algo a desejar; os mtodos no so perfeitamente aleatrios. As cartas, por exemplo, podem aderir umas s outras, impedindo um embaralhamento perfeito. As arestas de um dado podem estar desgastadas. E sempre h o perigo de as bolas de uma urna no terem sido convenientemente misturadas. Em vista disso, e porque a amostragem aleatria vital para a inferncia estatstica, existem tabelas especialmente elaboradas, chamadas Tabelas de Nmeros Aleatrios, construda de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e colunas. Na tabela de nmeros aleatrios os dez algarismos 0,1,2,...,7,8,9, podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem, como por colunas, num sentido ou noutro, por linhas, diagonalmente etc., e podem ser considerados aleatrios. A opo de leitura, porm, deve ser feita, antes de iniciado o processo. Para usar uma tabela de nmeros aleatrios devemos: 1 Fazer uma lista dos nmeros da populao 2 Numerar consecutivamente os itens na lista, a comear do zero,

3 Ler os nmeros na tabela de nmeros aleatrios de modo que o nmero de algarismos em cada um seja igual ao nmero de algarismos do ltimo nmero da sua listagem. 4 Desprezar quaisquer nmeros que no correspondam a nmeros da lista ou que sejam repeties de nmeros lidos anteriormente. Continue o processo at ter o nmero desejado de observaes. 5 Usar os nmeros assim escolhidos para identificar os itens da lista a serem includos na amostra.

EXEMPLO DE UMA TABELA DE NMEROS ALEATRIOS (retirada de: STEVENSON, William J. Estatstica aplicada administrao, So Paulo: Harbra, 1981) 3690 0813 6477 0772 5692 2080 1039 7227 8506 5086 0092 0935 2605 7277 5484 6905 8387 4094 4951 9047 7274 9192 0554 8231 3995 2402 5295 5177 7315 5775 5500 3251 4675 3543 3521 5573 7478 3339 5505 6381 2492 6790 5289 2160 9870 3828 3382 0104 6348 0303 1629 5565 3973 9889 3900 7127 5323 1957 3781 0199 9512 4011 1690 5627 9677 6250 7385 1191 3365 7517 2276 8902 1435 6130 8772 9396 7569 2854 8474 2086 7171 6858 4092 8236 3583 7880 7600 4141 4612 7423 0377 2315 8204 0390 3485 5933 3753 0163 5101 5068 0074 0255 6333 1815 7765 9362 5474 2106 7203 8974 6307 8843 2192 4247 6612 3464 7551 9691 3167 5457 7720 1489 4223 0812 8997 0586 1077 1521 8252 3298 3590 8030 4143 5579 0741 1137 1859 9717 1815 7447 6677 5458 1931 7171 3194 7373 2123 3351 1231 3961 2346 2112 0874 4859 0721 1706 3380 9562 8552 7703 6509 2669 6454 4195 1533 8482 4455 9104 1062 3979 2209 7651 2677 4620 9069 7583 6043 4118 7068 1664 8676 6942 9433 8036 3222 4757 7035 5057 0546 2183 1285 8567 2897 2660 3899 9204 2152 3252 5409 2758 7549 3743 7632 5589 6566 7811 8806 5563 1757 2831 4839 5189 0034 5650 5920 6450 0294 4276 6379 9278 0222 8043 2661 1832 4191 1716 9983 0967 6612 5295 7000 8131 0262 7852 2999 3389 5411 9848 1556 2963 2330 1901 7577 0830 8830 6807 1822 1392 0964 2257 6332 0075 8601 0210 4326 5658 5110 9465 7252 1708 3335 6201 8690 2031 2734 1942 5192 4538 1038 3096 5306 8116 5092 9096 1263 5678 2647 6030 4247 8167 5733 4971 2816 8261 7271 3309 1669 8238 2983 1508 1490 9353 3340 2082 7704 7678 6340 8820 1086 3625 1976 1587 2313 6298 4469 0417 1840 1246 1425 8536 0414 5270 5541 0578 7017 2589 7242 8472 4652 6712 4730 8280 9202 9232 3809 2729 7501 4882 2244 7642 3092 1921 8383 4664 6525 3444 9137 4127 8919 2864 1645 0972 6999 6073 8617 5921 6176 3374 2709 9442 3383 5994 4014 0097 8057 0288 2800 2266 2953 9820

Exemplo: Imagine que 500 clientes esto cadastrados em sua empresa e voc precisa obter uma amostra aleatria de 2% dos cadastros. Como voc usaria a tabela de nmeros aleatrios para extrair essa amostra? Depois de numerar os cadastros podemos escolher, por exemplo, percorrer a ltima coluna da tabela de cima para baixo lendo os trs primeiros algarismos de cada linha. Os nmeros obtidos dessa forma so: 473, 828, 920, 923, 380, 272, 750, 488, 224, 764, 309, 192, 838, 466, 652, 344, 913, 412. Desprezando os nmeros que so maiores do que 500 (e eventuais repeties) devemos tomar para a amostra os cadastros de nmeros: 473, 380, 272, 488, 224, 309, 192, 466, 344, 412. Dispondo-se de uma lista precisa dos itens da populao, relativamente simples escolher uma amostra aleatria com o auxilio de uma tabela de nmeros aleatrios. Na realidade, a lista no precisa conter todos os itens. As locaes dos itens podem constituir uma alternativa, como por exemplo, os quarteires de uma cidade, ou os arquivos de uma firma etc.

4.2 AMOSTRAGEM ESTRATIFICADA Muitas vezes a populao se divide em subpopulaes, denominadas de Estratos. Como provvel que a caracterstica em estudo dessa populao apresente, de estrato em estrato, um comportamento heterogneo e, dentro de cada estrato, um comportamento homogneo, convm que o sorteio dos elementos da amostra leve em considerao tais estratos. A amostra proporcional estratificada composta por elementos proveniente de todos os estratos. Exemplo: Vamos obter uma amostra proporcional estratificada de 10% para a pesquisa da estatura de 90 alunos de uma escola onde 54 so meninos e 36 so meninas.Temos aqui dois estratos, sexo masculino e sexo feminino. a) O primeiro passo determinar o tamanho da amostra em cada estrato: Sexo M F Total Populao 54 36 90 10% 10 54 = 5,4 100 10 36 = 3,6 100 10 90 = 9 100 Amostra 5 4 9

b) Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90 meninas. c) obtemos uma amostra aleatria ou sistemtica de cada sexo e reunimos as informaes numa s amostra, denominada amostra estratificada.

4.3 AMOSTRAGEM SISTEMTICA Quando os elementos da populao j se acham ordenados, no h necessidade de construir um sistema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, as linhas de produo etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A Amostragem Sistemtica constituda de elementos retirados da populao segundo um sistema preestabelecido. Exemplo 1: Imagine que 500 clientes esto cadastrados em sua empresa e voc precisa obter uma amostra aleatria de 2% dos cadastros. Como voc obteria uma amostra sistemtica? Precisamos obter uma amostra de tamanho 10. Para obter a amostra podemos dividir 500 por 10, e obter 50. Sorteamos um nmero entre 1 e 50, inclusive, para ser o primeiro cadastro da mostra e a partir desse nmero, contamos 50 cadastros e retiramos o ltimo para fazer parte da amostra. Procedemos dessa forma at completarmos os 10 cadastros da amostra. Exemplo 2: No caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria. Neste caso, estaramos fixando o tamanho da amostra em 10% da populao. preciso especial cuidado com o sistema de seleo. No forme uma amostra com as primeiras pessoas de uma fila ou, se so atendidos 10 clientes por dia, no escolha para a amostra, o dcimo de cada dez clientes. Estes procedimentos podem determinar amostras tendenciosas. Recomenda-se sempre sortear o primeiro elemento que ser selecionado para a mostra e, a partir da, usar o sistema de seleo. 4.4 AMOSTRAGEM POR CONGLOMERADOS utilizada quando a populao pode ser dividida em subpopulaes (conglomerados) heterogneos representativos da populao global. A amostragem feita sobre os conglomerados, e no mais sobre os indivduos da populao.

Você também pode gostar