Você está na página 1de 42

1 2 ESTATSTICA Quando o primeiro algarismo aps aquele que vai ser arredondado for 5, 6, 7, 8 e 9 aumentamos uma unidade no algarismo

o anterior. 78,886970 = 78,9.

1. CONCEITOS Exemplo: 5,735958 = BSICOS 5,74;

Populao - o conjunto de elementos (pessoas, coisas, objetos) que tm em comum uma car acterstica 3. DIVISO em estudo. DA ESTATSTICA A populao pode ser:

Podemos dividir i. Finita: a Estatstica quando em apresenta duas reas: um nmero limitado de indivduos. Ex.1 a populao constituda por todos os parafusos produzidos em uma fbrica em um Estatstica Descritiva dia. parte da Estatstica que tem por objetivo Ex. 2os dados nascimento de cr ianas emfuno um diados emdados, Novo Hamburgo. descrever observados e na sua tem as seguintes atribuies. ii. Infinita: quando o nmero de observaes for infinito. a populao constituda de todos resultados (cara coroa) de emum i. Ex. A obteno ou coleta de dados os normalmente feitaeatravs sucessivos lances de uma moeda. questionrio ou de observao direta de uma populao ou amostra. ii. A organizao dos dados consiste na ordenao e crtica quanto Amostra - correo o conjunto dos de elementos valores observados, retirados dafalhas populao, humanas, suficientemente omisses, representativos abandono dessa de populao. dados duvidosos. Atravs da anlise dessa amostra estaremos aptos para iii. analisar A representao os resultados dos da dados mesma os for dados ma que estatsticos se estudssemos podem ser toda mais a populao. facilmente compreendidos quando apresentados atravs de tabelas e grficos, que permite uma visualizao instantnea de todos os dados. Obs. A amostra Indutiva sempre finita. Quanto for a amostra mais significativa o Estatstica parte da maior Estatstica que tem por objetivo obter e estudo. generalizar concluses para a populao a partir de uma amostra, atravs do clculo de probabilidade. A tais concluses esto sempre associados a um Parmetro - uma caracterstica numrica estabelecida para toda uma grau de incerteza e conseqentemente, a uma probabilidade de erro. populao. Estimador - uma caracterstica numrica estabelecida para uma amostra. 4. VARIVEIS Dado Estatstico - sempre um nmero real. Uma varivel qualquer caracterstica de um elemento observado (pessoa, objeto ou a- animal). Primitivo ou Bruto: aquele que no sofreu nenhuma transformao Algumas variveis, como sexo e designao de emprego, simplesmente enquadram matemtica. Nmero direto. os indivduos em categorias. Outras, como altura e renda anual, tomam valores numricos b- Elaborado ou secundrio: aquele que sofreu transformao com os quais podemos fazer clculos. matemtica. Ex. porcentagem, mdia, etc. Os exemplos acima nos dizem que uma varivel pode ser: 2. ARREDONDAMENTO DE DADOS a quando seus valores expressos por sexofor (masculino Qualitativa: Quando o primeiro algarismo aps so aquele que vai seratributos: arredondado 0, 1, 2, 3 feminino), cor da pele (branca, preta, amarela, vermelha); e 4 despreza-se este algar ismo e conserva-se o anterior. b Quantitativa: quando seus valores so expressos em nmeros (salrios dos Exemplo: 5,733958 = 5,73; 78,846970 = 78,8. operrios, idade dos alunos de uma escola, nmero de filhos, etc.). Uma varivel quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o

3 nome de varivel contnua (altura, peso, etc.); uma varivel que s pode assumir valores pertencentes a um conjunto enumervel recebe o nome de varivel discreta (nmero de filhos, nmero de vitrias).

Exerccios
1. Classifique as variveis abaixo: (a) Tempo para fazer um teste. (b) Nmero de alunos aprovados por turma. (c) Nvel scio-econmico (d) QI (Quociente de inteligncia). (e) Sexo (f) Gastos com alimentao. (g) Opinio com relao pena de morte (h) Religio (i) Valor de um imvel (j) Conceitos em certa disciplina (k) Classificao em um concurso. 2. Identifique e classifique as variveis: a) Tabela de cdigos de declarao de bens e direitos de imveis: 11 Apartamento; 12 - Casas; 13 Terrenos; 14 Terra nua; 15 Salas ou lojas; 16 Construo; 17 Benfeitorias; 19 Outras; (Declarao de Ajuste Anual, Instrues de Preenchimento, Imposto de Renda, Pessoa Fsica, 1999) b) O euro comea a circular com 13 bilhes de notas em sete valores(5, 10, 20, 50, 100, 200 e 500)...A cunhagem de 75 bilhes de moedas de 1 e 2 euros e de 1, 2, 5, 10, 20 e 50 centavos de euro implicar uma troca completa de mquinas e equipamentos de venda de jornais,caf e refrigerantes. (Revista poca, Ano 1, n 33 , 4/1/1999) c) Em sete deliciosos sabores: tangerina, Laranja, maracuj, lima-limo, carambola, abacaxi e ma verde. ( Anncio de um preparado slido artificial para refresco) d) A partir de 1999, as declaraes de I mposto de Renda dos contribuintes com patrimnio de at R$ 20 mil podero ser feitas por telefone. (Revista poca, ano 1, n 33, 4/1/1999) e) Quantidade de sabores de refresco consumida em deter minado estabelecimento no fim de semana; f) Em 28 de dezembro de 1998, a Folha de S. Paulo publicou a classificao dos prefeitos de nove capitais brasileiras. As notas, em uma escala de 0 a 10, foram as seguintes: Curitiba 6,7; Recife, 6,5; Porto Alegre, 6,4; Florianpolis, 6,4; Salvador, 6,3; Fortaleza, 5,5; Belo Horizonte, 5,4; Rio de Janeiro, 5,4 e So Paulo,3,4.

4 APRESENTAO DE DADOS ESTATSTICOS APRESENTAO TABULAR A apresentao de dados estatsticos na forma tabular consiste na reunio ou grupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los de modo ordenado, simples e de fcil percepo e com economia de espao. Componentes Bsicos Em termos genricos, uma tabela se compe dos seguintes elementos bsicos: Ttulo Cabealho Indicadora de Coluna C o Casa u n a

Linha

Rodap E xemplo: Brasil - Estimativa de Populao 1970 76 Ano Populao (1000 habitantes) 1970 93.139 1971 95.993 1972 98.690 1973 101.433 1974 104.243 1975 107.145 1976 110.124 Fonte: Anurio Estatstico do Brasil Principais Elementos de uma Tabela

Ttulo: Conjunto de informaes, as mais completas possveis, localizado no topo da tabela, respondendo s perguntas: O qu? Onde? Quando? Cabealho: Parte superior da tabela que especifica o contedo das colunas.

5 Coluna Indicadora: Parte da tabela que especifica o contedo das linhas. Linhas: Retas imaginrias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas. Casa ou Clula: Espao destinado a um s nmero. Rodap: so mencionadas a fonte se a srie extrada de alguma publicao e tambm as notas ou chamadas que so esclarecimentos gerais ou particulares relativos aos dados. SRIES ESTATSTICAS toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo de trs elementos: a. Da poca; b. Do local; c. Da espcie. Esses elementos determinam o surgimento de quatro tipos fundamentais de sries estatsticas: Sries Temporais ou Cronolgicas: so aquelas nas quais os dados so reunidos segundo o tempo que varia, permanecendo fixos o local e a espcie. Exemplo: Produo de petrleo bruto Brasil 1966 1970. Anos Quantidade (cm) 1966 6.748.889 1967 8.508.848 1968 9.509.639 1969 10.169.531 1970 9.685.641 Fonte Brasil em dados. Sries Geogrficas: so aquelas nas quais os dados so reunidos segundo o local que varia permanecendo fixos o tempo e a espcie. E xemplo:Rebanhos bovinos Brasil 1970. Regies Bovinos (1000) Norte 2.132 Nordeste 20.194 Sudeste 35.212 Sul 18.702 Centro-oeste 15.652 Fonte Brasil em dados.

6 Sries Especficas: so aquelas nas quais os dados so reunidos segundo o espcie que varia permanecendo fixos o tempo e o local. Exemplo: Produo pesqueira (mar) Brasil 1969. Itens Produo (ton.) Peixes 314 Crustceos 62 Moluscos 3 Mamferos 12 Fonte Brasil em dados. Sries Composta ou Mista: a combinao de dois ou mais fundamentais de sries estatsticas. Exemplo: Geogrfica Temporal. Evoluo do transporte de carga martima nas 4 principais bacias brasileiras Brasil -1968 1970. Bacias Anos Amaznica Nordeste Prata So Francisco 1968 1969 1970 233.768* 16.873 177.705 53.142

324.350 20.272 203.966 48.667

316.557 20.246 201.464 57.948

Fonte Brasil em dados. * Os dados esto em toneladas. A apresentao tabular de dados estatsticos normalizada pela resoluo n 886 de 26-10-1966 do Conselho Nacional de Estatstica a fim de uniformizar a apresentao de dados. EXERCCIOS Exerccio 1: De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trnsito, 27306 casos de vtimas fatais, assim distribudos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faa uma tabela para apresentar esses dados. Exerccio 2: De acordo com o Ministr io dos transportes, em 1998, o tamanho das malhas de transporte no Brasil , assim distribudo: 320480 km de Rodovias (estradas municipais no esto includas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km esto sendo usados de fato). Faa uma tabela para apresentar esses dados. E xerccio 3: De acordo com Ministrio da Educao a quantidade e alunos matriculados no ensino de 1 grau no Brasil nos de 1990 a 1996 em milhares de alunos, so: 19.720 20.567 21.473 21.887 20.598 22.473 23.564. Faa uma tabela para apresentar esses dados.

7 E xerccio 4: Estabelecimentos de ensino da regio norte do Brasil em 1982. A regio norte subdivide-se em: Rondnia, Acre, Amazonas, Roraima, Par e Amap e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. . Faa uma tabela para apresentar esses dados. E xerccio 5: De acordo com o IBGE(1988), a distribuio dos suicdios ocorridos no Brasil em 1986, segundo a causa atribuda, foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por doena mental, 189 por outro tipo de doena, 416 por desiluso amorosa e 217 por outras causas. Apresente essa distribuio em uma tabela. E xerccio 6:Muitos siste mas escolares fornecem o acesso a Internet para seus estudantes hoje em dia. Desde 1996, o acesso Internet foi facilitado a 21.733 escolas elementares, 7.286 escolas do nvel mdio e 10.682 escolas de nvel superior (Statistical Abstract of United States, 1997). Existe nos Estados Unidos um total de 51.745 escolas elementares, 14.012 escolas do nvel mdio e 17.229 escolas do nvel superior. E xerccio 7:A chance de uma campanha publicitria atingir sucesso a ponto de ser comentada nas ruas e at incorporada ao vocabulrio da populao muito baixa. De acordo com estudos essa probabilidade se altera de acordo com o meio de comunicao utilizado. Numa amostra de 30.000 campanhas publicitrias de Rdio (8mil), TV (10mil) e Rdio+TV (12mil), verificou-se que, das 2800 que atingiram tal sucesso, 1200 foram veiculadas no rdio e na TV e 500 apenas no rdio. E xerccio 8: Classifique as sries dos exerccios 1 at 5. DISTRIBUIO DE FREQUNCIA o tipo de srie estatstica na qual permanece constante o fato, o local e a poca. Os dados so colocados em classes pr-estabelecidas, registrando freqncia. Divide-se em duas partes: Distribuio de Freqncia Intervalar (Var. Contnua) Distribuio de Freqncia Pontual (Var. Discreta)

Distribuio de Freqncia Intervalar


um mtodo de tabulao dos dados em classes, categorias ou intervalos, onde teremos uma melhor visualizao e aproveitamento dos dados. Exemplo: Notas do curso de Cincia da Com putao na disciplina de Program ao I de uma dada Faculdade Notas N de Estudantes 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02

8 Elementos Principais: a) Classe cada um dos intervalos em que os dados so agrupados. b) Limites de classes so os valores extremos de cada classe. l i = limite inferior de uma classe; L i = limite superior de uma classe. c) Amplitude a diferena entre o maior valor e o menor valor de certo conjunto de dados. Pode ser referida ao total de dados ou a uma das classes em particular. Amplitude Total (At ) calculada pela seguinte expresso: A = Max. (rol) Min.(rol). t Amplitude das classes (h) a relao entre a amplitude total e o nmero de classes, conforme mostra a expresso a seguir: Mx (rol ) - Mn.( rol ) h= , onde n o nmero de intervalos de classe. n

d) Ponto mdio de classe (x i ) - calculado pela seguinte expresso: L + li xi = i 2 e) Freqncia absoluta (f i ) - freqncia absoluta de uma classe de ordem i, o nmero de dados que pertencem a essa classe. f) Freqncia relativa (fr i ) - freqncia relativa de uma classe de ordem i, o quociente da freqncia absoluta dessa classe (f i ), pelo total, ou seja, f fr = i i Total Obs: a soma de todas as freqncias absolutas igual ao total. g) Freqncia acumulada (F i ) - freqncia acumulada de uma classe de ordem i, a soma das freqncias at a classe de ordem i. h) Freqncia relativa acumulada (Fr i ) - freqncia relativa acumulada de uma classe de ordem i, a soma das freqncias relativas at a classe de ordem i. ORGANIZAO DE UMA DISTRIBUIO DE FREQUNCIA: Para organizar um conjunto de dados quantitativos em distribuio de freqncias, aconselha- se seguir a seguinte orientao:

9 1o Organizar o rol colocar os dados em ordem crescente ou ordem decrescente. 2o Calcular (ou adotar) o nmero conveniente de classes o nmero de classe deve ser escolhido pelo pesquisador, em geral, convm estabelecer de 5 a 15 classes. Existem algumas frmulas para estabelecer quantas classes devem ser construdas. Nos usaremos, n = N onde N a quantidade total de observaes. 3o Calcular (ou adotar) a amplitude do intervalo de classes conveniente - a amplitude do intervalo de classes deve ser o mesmo para todas as classes. Mx (rol ) - Mn.(rol ) h= onde n o nmero de intervalos de classe. n 4o Obter os limites das classes Usualmente as classes so intervalos abertos direita. Os limites so obtidos fazendo-se. Limite inferior da 1 a classe igual ao mnimo do rol, isto , l1 = Min.(rol) Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do intervalo de classes aos limites da 1 a classe. 5o Obter as fi - contar o nmero de elementos do rol, que pertencem a cada classe. 6o Apresentar a distribuio construir uma tabela com ttulo, subttulo, ...

Distribuio de Freqncia Pontual


uma srie de dados agrupados na qual o nmero de observaes est relacionados com um ponto real. Ex.: Notas do Aluno "X" na Disciplina de Estatstica 1990 Nota Alunos 6.3 2 8.4 3 5.3 2 9.5 3 6.5 5 Total 15

Exerccios 1)Abaixo so relacionados os salrios semanais (em Reais) de 60 operrios de uma fbrica de sapatos.
110 120 125 136 145 150 165 172 180 185 110 120 125 140 145 155 165 172 180 190 115 120 130 140 145 158 168 175 180 190 115 120 130 140 147 158 168 175 180 195 117 120 130 140 150 160 170 175 180 195 117 123 135 142 150 163 170 178 185 198

a) Construir uma distribuio de freqncias adequada.

10 b) Interpretar os valores da terceira classe. 2) Abaixo so relacionados s estaturas e os pesos de 25 alunos de Estatstica. Estaturas Pesos Construir 1.71 1.80 1.75 1.73 1.81 58 60 60 62 63 uma 1.90 1.80 1.71 1.74 1.77 80 77 70 82 62 distribuio 1.63 1.80 1.78 1.84 1.81 55 76 83 50 78 de 1.83 1.80 1.75 1.79 1.65 79 70 60 76 83 freqncias 1.72 1.88 1.80 1.66 1.89 77 60 65 71 63 adequada para cada conjunto de dados. 3) Uma amostra de 20 operrios de uma companhia apresentou os seguintes salrios recebidos durante uma certa semana, arredondados para o valor mais prximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Construir uma distribuio de freqncias adequada.
4) Complete os dados que falta m na distribuio de freqncia: a) Classes x f F fr (%) 0 |-- 2 1 4 ... 4 2 |-- 4 ... 8 ... ... 4 |-- 6 5 ... 30 18 ... 7 27 ... 27 8 |-- 10 ... 15 72 ... 10 |-- 12 ... ... 83 ... ... 13 10 93 10 14 |-- 16 ... ... ... 7
i i i i

... .... b) Salrios

xi

fi

Fi

500 |-- 700 600 8 8 ... 800 20 ... 900 |-- 1.100 ... ... 35 1.100 |-- 1.300 ... 5 1.300 |-- 1.500 1.400 ... ... ... 1 43 1.700 |-- 1.900 1.800 ... ... Total 44

40 ...

GRFICOS ESTATSTICOS O grfico estatstico uma for ma de apresentao dos dados estatsticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido compreenso que as sries.

11

A representao grfica de um fenmeno deve obedecer a certos requisitos fundamentais para ser realmente til: a) Simplicidade o grfico deve ser destitudo de detalhes de importncia secundria, assim como de traos desnecessrios que possam levar o observador a uma anlise com erros. b) Clareza o grfico deve possibilitar uma correta interpretao dos valores representativos do fenmeno em estudo. c) Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo. Tipos de grficos Histograma, Polgono de Freqncia e Ogiva: So utilizados para representar a distribuio de freqncia. Histograma e Polgono de Freqncia: Exemplo: Notas obtidas na disciplina de Programao I Notas fi 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 FONTE: Dados hipotticos. Ogiva ou polgono de freqncia acumulada: Exemplo:

Grfico em linha: um dos mais importantes grficos; representa observaes feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas sries histricas ou temporais.

12

EVOLUO DO DESEMPREGO NA GRANDE PORTO ALEGRE 20 10 0 1992 1994 1996 1998 2000 ANOS

Grfico em setores: um grfico construdo no crculo, que dividido em setores correspondentes aos termos da srie e proporcionais aos valores numricos dos termos da srie. mais utilizado para sries especficas ou geogrficas com pequeno nmero de termos e quando se quer salientar a proporo de cada termo em relao ao todo. Exemplo:
ESPECIALIDADES M DICAS QUE M AIS SOFREM PROCESSOS POR ERROS CIRRGICOS ANUALMENTE Ginecologia e Obstetrcia Cirurgia Plstica Oftalmologia Cirurgia Geral Ortopedia Pediatria Outros

Grficos em Barras (ou em colunas). a representao de uma srie por meio de retngulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas). Quando em barras , os retngulos tm a mesma altura e os comprimentos so proporcionais aos respectivos dados.
GRUPOS GACHOS M AIS LEMBRADOS

Tc h Guri Engenhei ros do H awai Tc h B arbari dade Os S erra nos Tc h Garot os

0 5 10 15
N DI C E

Quando em colunas , os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados.

13

O S D E Z E S T A D O S E M Q UE A C O LE T A D E L IXO UR B A N O M A I S P R E C R I A - E M % D A P O P ULA O A T E N D I D A

80 70 60 50 40 30 20 10 0 M A P I P A TO A P A C C E A M R R B A ESTADOS 26,5 48 51,5 55 62 66,5

68 71 75 76

Cartograma. representao sobre uma carta geogrfica. Este grfico empregado quando o objetivo o de figurar os dados estatsticos diretamente relacionados com as reas geogrficas ou polticas.

Pictograma. Constitui um dos processos grficos que melhor fala ao pblico, pela sua forma ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras. Ex.: Populao Urbana do Brasil em 1980 (x 10)

14

Fonte: Anurio Estatstico (1984) LISTA DE EXERCCIOS


1) Construir o Histograma, Polgono de Freqncia e a Ogiva das distribuies dos exerccios 1, 2 e 3 anteriores (pg. 11 e 12). 2) Escolha o melhor tipo de grfico para representar os vrios tipos de sries.
a. Os dez Estados que fizeram maior nmero de Transplantes de rim em 98 _____________________________________ ESTADOS N DE TRANSPLANTES _____________________________________ DF 34 BA 38 ES 56 PE 56 CE 87 PR 181 RJ 181 RS 181 MG 231 SP 756 ___________________________________ FONTE: Associao Brasileira de Transplante de rgos. FONTE: World Resources Institute

c.

REA TERRESTRE DO BRASIL _______________________________ REGIES PERCENTUAL _______________________________ NORTE 45,25 NORDESTE 18,28 SUDESTE 10,85 SUL 6,76 CENTRO-OESTE 18,86 _______________________________ FONTE: IBGE

d.
b. O estado das florestas do planeta e o que foi devastado pela ocupao humana - em milhes de km CONTINENTE REA REA ATUAL DE DESMATADA FLORESTAS OCEANIA 0.5 0.9 SIA 10.8 4.3 FRICA 4.5 2.3 EUROPA 6.8 9.6 AMRICA DO 2.9 6.8 SUL AMRICA DO 3.2 9.4 NORTE E CENTRAL

COMRCIO EXTERIOR BRASIL - 1988/1993 QUANTIDADE (1000 t) ANOS EXPORTAO IMPORTAO 1988 1989 1990 1991 1992 1993 169666 58085 177033 57293 168095 57184 165974 63278 167295 68059 182561 77813

FONTE: Ministrio da Indstria, Comrcio e Turismo.

e.

IMUNIZAES - DOSES APLICADAS

15
POR MUNICPIO - 1997 _______________________________________ MUNICPIO DOSES APLICADAS _______________________________________ ERECHIM 51215 NOVO HAMBURGO 110844 PORTO ALEGRE 615317 R IO GRANDE 84997 SANTA MARIA 107701 ________________________________________ FONTE: Minstrio da Sade.

MEDIDAS ESTATSTICAS Estudaremos dois tipos fundamentais de medidas estatsticas: medidas de tendncia central e medidas de disperso. As medidas de tendncia central mostram o valor representativo em torno do qual os dados tendem a agrupar-se, com maior ou menor freqncia. So utilizadas para sintetizar em um nico nmero o conjunto de dados observados. As medidas de disperso mostram o grau de afastamento dos valores observados em relao quele valor representativo. MEDIDAS DE TENDNCIA CENTRAL A mdia aritmtica simples A mdia aritmtica simples de um conjunto de valores o valor obtido somando-se x (leia- se x todos eles e dividindo-se o total pelo nmero de valores. denotada por barra) x , onde x so os valores observados. x= n x .f i i x= , se os dados estiverem organizados em distribuio de freqncia. f
i

Onde xi e fi so os valores do ponto mdio e da freqncia absoluta da classe i-sima respectivamente. Exemplos: 1) Calcule a mdia aritmtica dos valor es abaixo: a. X = {0, 6, 8, 7, 4, 6} b. Y = {25, 16, 29, 19, 17} c. Z = {105, 123, 98, 140} 2) Encontre a mdia para o salrio destes funcionrios. Salrios sem anais para 100 operrios no especializados Salrios fi xi xi .fi semanais 140 |-- 160 7 160 |-- 180 20 180 |-- 200 33 200 |-- 220 25 220 |-- 240 11 240 |-- 260 4 100 Exerccios:

1) Encontre a mdia dos seguintes conjuntos de observaes. a) X = {2, 3, 7, 8, 9}. R: 5,8 b) Y = {10, 15, 22, 18, 25, 16}. R: 16,67 c) Z = {1, 3, 6, 8}. R: 4,5 d) T = {1, 3, 6, 100}. R: 27,5 2) Encontre a mdia das notas na disciplina de Programao I. Notas obtidas na disciplina de Programao I Notas f i 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 FONTE: Dados hipotticos. Resp 6,62 . A um valor central de um rol, ou seja, a mediana de um conjunto de valor es mediana ordenados (crescente ou decrescente) a medida que divide este conjunto em duas partes iguais. Exemplo: Calcule a mediana dos conjuntos abaixo: a- X={3, 7, 4, 12, 15, 10, 18, 14} b- Y={29, 33, 42, 38, 31, 34, 45, 51, 95} c- Z={29, 33, 42, 38, 31, 34, 45, 120, 95} Moda Seja X um conjunto de dados estatsticos. Define-se como sendo o elemento mais freqente no conjunto. Um conjunto de dados pode ter: Nenhuma moda (amodal); Uma moda (unimodal); Duas ou mais modas (multimodal). Exerccios: Calcule a moda para os conjuntos abaixo: a) X= {2, 3, 4, 3, 7, 8, 9, 14}. b) Y= {2, 4, 6, 2, 8, 4, 10}. c) Z= {32, 56, 76, 4, 8, 97}. Moda de X, denotada por Mo

OBSERVAES:

No h regra para se dizer qual a melhor medida de tendncia central. Em cada situao especfica o problema deve ser analisado pelo estatstico, que concluir pela medida mais adequada a situao. Assim que: a) A MA a medida mais adequada quando no h valores errticos ou aberrantes. b) A mediana deve ser usada sempre que possvel como medida representativa de distribuies com valores dispersos, como distribuio de rendas, folhas de pagamentos, etc. Exerccios: 1) Dados os conjuntos abaixo, calcule a mdia aritmtica, mediana e moda. A = {3, 5, 2, 1, 4, 7, 9}. x 4,4 9,3 10,3 6,8 B = {6, 12, 15, 7, 6, 10}. Md 4 8,5 10 6,5 C = {10, 5, 11, 8, 15, 4, 16, 5, 20, 6, 13}. Mo 6 5 D = {4, 4, 10, 5, 8, 5, 10, 8}. 2) Calcule a mdia aritmtica das distribuies de freqncias dos exerccios 1 e 2 das pginas 11. Resp. 1) R$ 151,79; 2) 173,53 cm e 68,15 kg.

MEDIDAS DE DISPERSO Servem para verificarmos a representatividade das medidas de posio, pois muito comum encontrarmos sries que, apesar de terem a mesma mdia, so compostas de maneir a distinta. Assim, para as sries: a) 25, 28, 31, 34, 37 b) 17, 23, 30, 39, 46 x = xb = . temos 31 a Nota-se que os valores da srie a esto mais concentrados em torno da mdia 31, do que a srie b. Precisamos medir a disperso dos dados em torno da mdia, para isto utilizaremos as medidas de disperso: Desvio Padro Coeficiente de Variao Desvio Padro: a raiz quadrada positiva da mdia aritmtica dos quadrados das diferenas entre cada valor e a mdia aritmtica do conjunto e denotada por s . Assim, s = (x - x )2
i

(xi - x )2 fi s ,= se os dados estiverem organizados em distribuio de freqncia. fi Exemplo 1: Encontre o desvio padro para os dados das sries a), e b) acima.

Exemplo 2: Salrios sem anais para 100 operrios no especializados Salrios fi xi (xi - x )2 (xi - x )2 fi semanais 140 |-- 160 7 160 |-- 180 20 180 |-- 200 33 200 |-- 220 25 220 |-- 240 11 240 |-- 260 4 100 Encontre o desvio padro para o salrio destes funcionrios. Exerccio: Calcule o desvio padro das distribuies de freqncias dos exerccios 1 e 2 das pginas 11 e 12. Coeficiente de variao: Trata-se de uma medida de disperso, til para a compreenso em termos relativos do grau de concentrao em torno da mdia de sries distintas. dado por: s C = .100 v x Exemplo 4: Para duas emisses de aes ordinrias da indstria eletrnica, o preo mdio dirio, no fechamento dos negcios, durante um perodo de um ms, para as aes A , foi de R$ 150,00 com um desvio padro de R$ 5,00. Para as aes B, o preo mdio foi de R$ 50,00 com um desvio padro de R$ 3,00. Em relao ao nvel do preo, qual dos tipos de aes mais varivel? E xerccios. 1) Uma amostra de 20 operrios de uma companhia apresentou os seguintes salrios recebidos durante uma certa semana, arredondados para o valor mais prximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155,

165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a mdia, (b) a mediana, (c) a moda, (d) o desvio padro, (e) o coeficiente de variao, para este grupo de salrios. R: a) 170,5; d) 33,12. 2) O nmero de carros vendidos por cada um dos vendedores de um negcio de automveis durante um ms particular, em ordem crescente: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15. Determinar (a) a mdia, (b) a mediana, (c) a moda, (d) o desvio padro R: a) 9,6; d) 3,95. 3) Em conjunto com uma auditoria anual, uma firma de contabilidade pblica anota o tempo necessrio para realizar a auditoria de 50 balanos contbeis. Calcular (a) a mdia, (b) o desvio padro, para o tempo de auditoria necessrio para esta amostra de registro. R: a) 43,2; b)12,28. Tempo necessrio para a auditoria de balanos contbeis. Tempo de auditoria. N de balanos. (min.) (fi ) 10 |-- 20 3 20 |-- 30 5 30 |-- 40 10 40 |-- 50 12 50 |-- 60 20 Total 50
4) Os salrios semanais de 50 funcionrios de um hospital, em reais, foram os seguintes:
100 122 130 140 152 160 164 176 180 188 192 200 216 104 126 134 146 156 160 170 176 184 190 194 200 218 116 128 138 150 156 162 170 178 186 190 196 200 120 128 140 150 156 162 176 180 186 192 196 210

a) Construa uma distribuio de freqncias, com h = 20 e limite inferior para a primeira classe igual a 100. b) Quantos funcionrios tem um salrio semanal situado entre R$ 120,00 (inclusive) e R$ 160,00 (exclusive)? 17 funcionrios c) Que porcentagem de funcionrios tem um salrio semanal situado entre R$ 180,00 (inclusive) e R$ 200,00 (exclusive)? 26% d) Qual o salrio mdio semanal destes funcionrios utilizando o item a)? 166,4 e) Determine o desvio padro e o coeficiente de variao da distribuio. 28,76; 17,28% 5) A distribuio das alturas de um grupo de pessoas apresentou uma altura mdia de 182 cm e um desvio padro de 15 cm, enquanto que a distribuio dos pesos, apresentou um peso mdio de 78 kg, com um desvio padro de 8 kg. Qual das duas distribuies apresentou maior disperso? Por qu?

CORRELAO E REGRESSO Introduo: J trabalhamos com a descrio de valores de uma nica varivel. Quando, porm, consideramos observaes de duas ou mais variveis surge um novo problema: as relaes que podem existir entre as variveis estudadas. Assim, quando consideramos variveis como peso e estatura de um grupo de pessoas, uso do cigarro e incidncia do cncer, procuramos verificar se existe alguma relao entre as variveis de cada um dos pares e qual dessa relao. Uma vez caracterizada a relao, procuramos descrev-la atravs de uma funo matemtica. A regresso o instrumento adequado para determinao dos parmetros dessa funo. Se todos os valores das variveis satisfazem exatamente uma equao, diz-se que elas esto perfeitamente correlacionadas ou que h correlao perfeita entre elas. Quando esto em jogo somente duas variveis, fala-se em correlao e regresso simples. Quando se trata de mais de duas variveis, fala-se em correlao e regresso mltipla. Diagrama de Disperso Para desenhar um diagrama de disperso, primeiro traa-se o sistema de eixos cartesianos. Depois se representa uma das variveis no eixo x e a outra no eixo y Colocam-se, ento os valores das variveis sobre os respectivos eixos e marca-se um ponto para cada par de valores. Consideremos uma amostra aleatria, for mada por dez dos 98 alunos de uma classe da Universidade A e pelas notas obtidas por eles em Matemtica e Estatstica: No 01 02 03 04 05 06 07 08 09 10 Notas Matemtica Estatstica (X) (Y) 5,0 6,0 8,0 9,0 7,0 8,0 10,0 10,0 6,0 5,0 7,0 7,0 9,0 8,0 3,0 4,0 8,0 6,0 2,0 2,0 ordenados (x,y), obtemos uma nuvem de pontos que denominamos diagrama de disperso. Esse diagrama nos fornece uma idia grosseira, porm til da correlao existente:
12 10 8 6 4 2 0 -3 2 7 12 M ate mtica

Representando, em um sistema cartesiano coordenado cartesiano ortogonal, os pares DEFINIO 1 : Correlao

Dizemos que duas ou mais variveis expressam a relao de causa e efeito ou se elas variam concomitantemente, so variveis consideradas correlacionadas. O grau de relacionamento para dados amostrais dado pela seguinte expresso: n r = n
n i =1 = n i= 1 =

Xi Y i
n i 1 2

n i =1

Xi n
n i =1 =

n i 1

Y i
n i 1 2

X2 i

Xi

2 Y i

Y i

Onde: n o nmero de observaes; r o coeficiente de correlao linear para uma amostra. EXEMPLO 1 : Encontre o coeficiente de correlao para os dados da tabela anterior. (X) (Y) X Y X 5 6 30 25 36 8 9 72 64 81 7 8 56 49 64 10 10 100 100 100 6 5 30 36 25 7 7 49 49 49 9 8 72 81 64 3 4 12 9 16 8 6 48 64 36 22444 65 65 473 481 475 r = 10.473 - 65.65 10.481 - 65
2 2 2 Y

10.475 - 65

505 585 525

= 0,911

PROPRIEDADE DO COEFICIENTE DE CORRELAAO LINEAR r. 1. O valor de r est sempre entre 1 e 1. 2. O valor de r no varia se todos os valores de qualquer uma das variveis so convertidos para uma escala diferente. 3. O valor de r no afetado pela escolha de x ou y. 4. r mede a intensidade, ou grau, de um relacionamento linear. No serve para medir a intensidade de um relacionamento no-linear.

CORRELAO POSITIVA E CORRELAO NEGATIVA Se as variveis x e y crescem no mesmo sentido, isto , quando x cresce, y tambm cresce, diz-se que as duas variveis tm correlao positiva. Ento, notas de matemtica e notas de estatstica dos alunos tem correlao positiva, porque quando uma das variveis cresce, a outra , em mdia, tambm cresce. Se as variveis x e y variam em sentido contrrio, isto , quando x cresce, em mdia y decresce, diz-se que as duas variveis tm correlao negativa. Observe os dados da Tabela abaixo: Consumo individual de protenas de origem animal, em gramas, e coeficiente de natalidade, em 14 pases, 1961. Pas Consumo Coef. de de natalidade protenas Formosa 4,7 45,6 Malsia 7,5 39,7 ndia 8,7 33,0 50 Japo 9,7 27,0 Iugoslvia 11,2 25,9 40 Grcia 15,2 23,5 30 Itlia 15,2 23,4 Bulgria 16,8 22,2 20 Alemanha 37,3 20,0 10 Irlanda 46,7 19,1 Dinamarca 56,1 18,3 0 Austrlia 59,9 18,0 0 20 40 60 Estados Unidos 61,4 17,9 Sucia 62,6 15,0 Eixo x = consumo de protenas Eixo y= coeficiente de natalidade Fonte: Castro(1961)

ANLISE DE REGRESSO Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais atributos ou variveis simultaneamente. Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada uma das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores (Xi ; Y i ). O objetivo visado quando se registra pares de valores (observaes) em uma amostra, o estudo das relaes entre as variveis X e Y. Para a anlise de regresso interessam principalmente os casos em que a variao de um atributo sensivelmente dependente do outro atributo.

O problema consiste em estabelecer a funo matemtica que melhor exprime a relao existente entre as duas variveis. Simbolicamente a relao expressa por uma equao de regresso e graficamente por uma curva de regresso. REGRESSO LINEAR SIMPLES Modelo: Yi = + a x i + ei Pressuposies: a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais em Y e a razo de crescimento constante). b) Os valores de X so fixados arbitrariamente ( X no uma varivel aleatria ). c) Y uma varivel aleatria que depende entre outras coisas dos valores de X. d) ei o erro aleatrio, portanto uma varivel aleatria com distribuio normal, com mdia zero e varincia s 2 . [ ei N (0, s 2 )]. ei representa a variao de Y que no explicada pela varivel independente X. e) Os erros so considerados independentes. Estimativas dos Parmetros a e As estimativas dos parmetros uma amostra de n pares de valores (x disperso. Exemplo:
(X) (Y) 56 89 78 10 10 65 77 98 34 86 22

a e dadas por a e b, sero obtidas a partir de , yi ) que correspondem a n pontos no diagrama de i


12 10 8 6 4 2 0 0 5 10 Varivel X Y Y previs to

= ax + b Obtemos ento: y i i
Para cada par de valores (x i , yi ) podemos estabelecer o desvio: ei = yi - y = y i -( axi + b) i

Mtodo dos Mnimos Quadrados O mtodo dos mnimos quadrados consiste em adotar como estimativa dos parmetros os valores que minimizem a soma dos quadrados dos desvios.

S=

n i =1

ei 2 =

n i =1

[yi - axi - b]2

S = f(a, b) Essa soma, funo de a e de b, ter mnimo quando suas derivadas parciais em relao a a e b forem nulas. Para facilitar a escrita, consider a-se dz = db dz = da 2 [yi] - axi - b (- )1 = 0 2 [y] - ax - b (- )x = 0
i i i n i =1

[y] i [y] i

ax - b = 0 axi - b (xi) = 0 xi - nb = 0 xi 2 - b x
i i

yi - a xi yi - a b =

xi = 0

y - a
i

n xi - a xi 2 = 0

xi yi - b

Resolvendo-se esse sistema, obtemos as estimativa para o clculo de:

a =

n n

xy i i

x2 i

( )x

y
2

b =y- a e a partir da 1 equao x

No exemplo: (X) (Y) X.Y X 5 6 30 25 36 8 9 72 64 81 7 8 56 49 64 10 10 100 100 100 6 5 30 36 25 7 7 49 49 49 9 8 72 81 64 3 4 12 9 16 8 6 48 64 36 22444 65 65 473 481 475 a = 10.473 - 65.65 10.481 - 65
2

2 Y

12 10 8 6 4 2 0 0 5 10 Varivel X

505 585

= 0,8632

b=

65 65 - 0,8632. = 0,8892 10 10
i

y = 0,8632 x + 0,8892
i

EXERCCIOS

Nos Exerccios 1-10, a) Determine o coeficiente de correlao. b) Determine a equao da reta de regresso.

1. A tabela apresenta dados de amostra referentes ao nmero de horas de estudo fora de classe para deter minados alunos de um curso de estatstica, bem como os graus obtidos em um exame aplicado no fim do curso. Estudante 1 2 3 4 5 6 7 8 Horas de estudo 20 16 34 23 27 32 18 22 Grau no exame 64 61 84 70 88 92 72 77 c) Estimar o grau no exame obtido por um estudante que dedicou 30 horas fora de classe. 2. A tabela mostrada relaciona os nmeros x de azulejos e os custos y (em dlares) de sua ajustagem e colocao. x 12356 y 5 8 11 17 20 , o valor predito de y. c) Para x = 4, ache y

3. Os dados emparelhados que se seguem consistem no permetro torcico (em polegadas) e dos pesos (em libras) de uma amostra de ursos machos. X Trax 26 45 54 49 41 49 44 19 Y Peso 90 344 416 348 262 360 332 34 y , o peso predito. c) Para um urso com permetro torcico de 52 in, ache 4. Os dados da tabela abaixo consistem nos pesos (em libras) de plstico descartado e tamanhos de residncias. Plstico (lb.) 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05 Tam. da residncia 23364215 c) Ache o tamanho predito de uma residncia que descarta 2,50 lb. de plstico. 5. A tabela abaixo apresenta os pesos totais (em libras) de lixo descartado e tamanhos de residncias. Peso total 10,76 19,96 27,6 38,11 27,9 21,9 21,83 49,27 33,27 35,54 Tam da 2336421564 Residncia c) Ache o tamanho predito de uma residncia que descarta 20,0 lb. de lixo. 6. Os dados seguintes foram obtidos da altura (polegadas) e do peso (libras) de mulheres nadadoras. Altura 68 64 62 65 66 Peso 132 108 102 115 128 c) Estimar o peso de uma mulher, que possui 67 polegadas. 7. Os dados seguintes mostram o gasto com mdia (milhes de dlares) e as vendas de caixas (milhes) para sete grandes marcas de refrigerantes. Marca Gastos com mdia (US$) Vendas de caixas Coca-Cola 131,3 1929,2 Pepsi-Cola 92,4 1384,6 Coca-Cola Light 60,4 811,4 Sprite 55,7 541,5 Dr. Pepper 40,2 536,9 Mountain Dew 29,0 535,6 7- Up 11,6 219,5
Fonte: Superbrands 98, 20 de outubro de 1997

c) Estimar as vendas, sabendo que foi gasto US$ 80,0 com mdia.

8. Os dados a seguir so a mdia das notas x e salrios mensais y de estudantes que obtiveram bacharelado em administrao com nfase em sistemas de informao.
Mdia das Notas 2,6 3,4 3,6 3,2 3,5 2,9 Salrio Mensal (US$) 2800 3100 3500 3000 3400 3100

c) Supondo que a nota de um estudante de bacharelado em administrao com nfase em sistemas de informao seja 8,0. Estime ser seu salrio mensal.
9.U m gerente de vendas reuniu os seguintes dados considerando os anos de experincia e as vendas anuais.

Vendedor

Anos de experincia Vendas anuais (US$ 1.000)

1 1 80 2 3 97 3 4 92 4 4 102 5 6 103 6 8 111 7 10 119 8 10 123 9 11 117 10 13 136 c) Estimar as vendas anuais, supondo que um vendedor tenha 9 anos de experincia. 10 ados sobre os gastos com publicidade (US$ 1.000) e faturamento (US$ 1.000) para o Four Seasons Restaurant so apresentados a seguir. Gastos com publicidade Faturamento 1 19 2 32 4 44 6 40 10 52 14 53 20 54 c) Sabendo que os gastos com publicidade foi de US$ 7.000,00. Quanto espera ganhar o Four Seasons Restaurant?

PROBABILIDADE 1.1. INTRODUO Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios . Os fenmenos determinsticos so aqueles em que os resultados so sempre os mesmos, qualquer que seja o nmero de ocorrncias. Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um grande nmero de repeties do mesmo fenmeno. Nos experimentos aleatrios, mesmo que as condies iniciais sejam as mesmas, os resultados finais de cada tentativa do experimento, sero diferentes e no previsveis, por isso, conveniente dispormos de uma medida para o estudo de tais situaes. Esta medida a probabilidade. 1.2. EXPERIMENTO ALEATRIO. ESPAO AMOSTRAL. EVENTO

Antes de passarmos definio de probabilidade, necessrio fixarmos os conceitos de experimento, espao amostral e evento. Um experimento aleatrio o processo de coleta de dados relativos a um fenmeno que acusa variabilidade em seus resultados. EXEMPLOS: a) lanamento de uma moeda honesta; b) lanamento de um dado; c) determinao da vida til de um componente eletrnico; Espao amostral o conjunto de todos os resultados possveis de um experimento. Vamos denot-lo por . EXEMPLOS: 1) No caso do lanamento de um dado, = 2) Uma lmpada ligada e observada at queimar anotando-se os tempos decorridos, = Quando o espao amostral consiste em um nmero finito ou infinito numervel de eventos, chamado espao amostral discreto; e quando for todos os nmeros reais de determinado intervalo, um espao amostral contnuo. Um evento um subconjunto de um espao amostral EXEMPLO: Nos exemplos anteriores 1 e 2. Qual seria um possvel evento para cada um dos exemplos? 1.3. DEFINIES DE PROBABILIDADE Seja A um evento de um experimento aleatrio, definimos a probabilidade de A , denotada por P(A) , Nmero de casos favo rveis Nmero de casos poss veis que a definio clssica de probabilidade. EXEMPLO: Na jogada de um dado, qual a probabilidade de aparecer face 3 ou face 5? Soluo: P(A) = EXEMPLO: Consideremos o experimento que consiste em lanar uma moeda 15 vezes. Suponhamos que o nmero de caras obtido tenha sido 10. Determine a probabilidade do evento cara: Soluo: 1.4. OPERAES COM EVENTOS ALEATRIOS Consideremos um espao amostral finito . Sejam A e Bdois eventos de operaes so definidas. a) UNIO

. As seguintes

O evento unio de A e Bequivale ocorrncia de A , ou de B, ou de ambos. Contm os elementos do espao amostral em que esto em pelo menos um dos dois conjuntos. Denota-se por A B. A rea hachurada da figura abaixo ilustra a situao.

EXEMPLO: Se A o conjunto dos alunos de um Estabelecimento que freqentam o curso de Contabilidade e B o conjunto de alunos do mesmo estabelecimento que fazem Cincia da Computao, ento: A B= b) INTERSECO O evento interseco de dois eventos A e Bequivale ocorrncia de ambos. Contm todos os pontos do espao amostral comuns a Ae a B. Denota-se por An B. A interseco ilustrada pela rea hachurada do diagrama abaixo.

EXEMPLO: Seja A o conjunto de alunos de uma Instituio que freqentam o 2 conjunto dos que freqentam um curso facultativo de interpretao musical. A interseo dada por: An B =

grau, e Bo An B

c) EXCLUSO Dois eventos A e Bdizem-se mutuamente exclusivos ou mutuamente excludentes quando a ocorrncia de um deles impossibilita a ocorrncia do outro. Os dois eventos no tm nenhum elemento em comum. Exprime-se isto escrevendo A n B = . O diagrama a seguir ilustra esta situao. EXEMPLO: Na jogada de um dado, seja A o evento aparece nmero par e Bo evento aparece nmero mpar. Ento A n B =

d) NEGAO A negao do evento A , denotada por A chamada evento complementar de A. ilustrada na parte hachurada na figura abaixo.

EXEMPLO: Se, na jogada de um dado, o evento complementar dado por: A =

A consiste no aparecimento de face par, seu

REGRAS BSICAS Se A e B so dois eventos do espao amostral , ento valem as seguintes regras bsicas: 0 =P(A) =1 P(A) = 0 o evento impossvel e P(A) = 1 o evento certo. P( ) = 1 Se A e B so eventos mutuamente excludentes, A n B = , ento: P(A B) = P(A) + P(B). Se An B , ento: P(A B) = P(A) + P(B) P(A n B). P(A) = 1- P(A). Se o vazio, ento P( ) =0. EXERCCIO : Consideremos os alunos matriculados na disciplina de Estatstica. Temos _____ homens com mais de 25 anos, _____ homens com menos de 25 anos, ____ mulheres com mais de 25 anos, ____ mulheres com menos de 25 anos. Uma pessoa escolhida ao acaso dentre os ____. Os seguintes eventos so definidos: A: a pessoa tem mais de 25 anos; C : a pessoa um homem; B: a pessoa tem menos de 25 anos; D : a pessoa uma mulher. Calcular: P(B D) e P(A n C). EXERCCIOS 1. Quais dos valor es abaixo no podem ser probabilidades? 0; 2 ; 0,001; -0,2; 3/2; 2/3. 2. Um estudo de 500 vos da American Airlines selecionados aleatoriamente mostrou que 430 chegaram no horrio (com base em dados do Ministrio dos transportes). Qual a probabilidade de um vo da American Airlines chegar no horrio?
3. Em uma pesquisa entre estudantes de uma faculdade, 1162 afirmaram que colaram nos exames, enquanto 2468 afirmaram no colar. Selecionado aleatoriamente um desses estudantes, determine a probabilidade de ele ou ela ter colado em um exame. 4. A MasterCard International efetuou um estudo de fraudes em cartes de crditos; os resultados esto agrupados na tabela a seguir. Tipo de fraude N de cartes Carto roubado 243 Carto falsificado 85 Pedidos por correio/telefone 52 Outros 46 Selecionado aleatoriamente uma caso de fraude nos casos resumidos na tabela, qual a probabilidade de a fraude resultar de um carto falsificado? . R: 0,2 .

5. Se IP (A)= 2/5, determine IP(A) .


6. Com base em dados do Centro Nacional de Estatstica de Sade dos EUA, a probabilidade de uma criana ser menino 0,513. Determine a probabilidade de uma criana ser menina.

7. Determine IP(A) , dado que IP (A)= 0,228.


8. Com base em dados do Centro Nacional de Examinadores Forenses, se escolhermos aleatoriamente uma pessoa que se submete ao exame para exerccio da advocacia, a probabilidade de obter algum que seja aprovado 0,57. Ache a probabilidade de algum que seja reprovado. 9. Os pesquisadores esto preocupados com declnio do nvel de cooperao por parte dos entrevistados em pesquisas. A tabela mostra o resultado de uma pesquisa feita com 359 pessoas. Faixa etria Respondem No respondem Total 18-21 73 11 84 22-29 255 20 275 Total 328 31 359 Qual probabilidade de obter algum que no queira responder? R: 0,086 . Qual probabilidade de obter algum na faixa etria 22-29? R: 0,766 . Determine a probabilidade de obter algum na faixa etria 18-21 ou algum que recuse responder. R: 0,29 . Determine a probabilidade de obter algum na faixa etria 18-21 que no recuse responder. R: 0,203 .

a) b) c) d)

Testes de Hipteses Nesta seo, vamos admitir um valor hipottico para o parmetro desconhecido - as hipteses estatsticas - e, depois utilizar a informao da amostra para aceitar ou rejeitar esse valor hipottico. Por exemplo, com base na produtividade de uma hortalia cultivada em uma rea, onde for usado um novo fertilizante, e em outra rea onde se utiliza o fertilizante padro, temos de decidir se o novo fertilizante , ou no, melhor. A dificuldade aqui - e da a necessidade de dados estatsticos - que a produtividade varia de planta para planta. Os testes de hipteses permitem-nos tomar decises em presena da variabilidade, ou seja, verificar se estamos diante de uma diferena real (significativa) ou de uma diferena devida simplesmente flutuao aleatria inerente ao processo. Na realizao de um teste, so feitas duas hipteses: a hiptese nula (H 0 ), que ser testada, e a hiptese alternativa (H 1 ), que ser aceita caso nosso teste indique a rejeio da hiptese nula. Exemplos : 1- Indique as hipteses nula e alternativa para cada uma das situaes: a) Tubos galvanizados devem ter mdia de 2 polegadas para serem aceitveis.

b) Um fabricante de conservas deseja evitar excesso no enchimento de potes de 12 oz. De gelia. 2- Para cada um dos casos seguintes, decida se adequado um teste teste bilateral , trace a curva normal para ilustrar o teste. a) H 0 : =10 , H1: 10, a =0,02 b) H 0 : =0,037 , H1: >0,037, a =0,05 c) H0 : =3,2 , H1: <3,2, a =0,01 Tipos de Erros O esquema a seguir mostra os erros que podemos cometer: Concluso do teste H verdadeira H 0 No rejeitar H0 Rejeitar H0 Correto Erro tipo II Erro tipo I Correto falsa unilateral ou um

Procedimento para se efetuar um teste de hiptese 1) Enunciar as hipteses H 0 e H 1 ; 2) Fixar-se o limite de erro a e identificar-se a varivel do teste; 3) Determinar-se a regio crtica em funo da varivel tabelada; 4) Calcular o valor da varivel do teste, obtido na amostra; 5) Aceitar ou rejeitar a hiptese nula de acordo com a estimativa obtida no item 4, em comparao com a regio crtica estabelecida no 3) passo. Valores crticos de z em testes de hipteses
Nvel de significncia Tipo de teste

unilateral bilateral 5% +1,65 ou 1,96 -1,65 1% +2,33 ou 2,58 -2,33

Teste para a mdia ( s 2conhecido) 1) Enunciar as hipteses: H0 : = 0 0 (a ) > H1 : <


0 0

(b ) (c )

2) Fixar o nvel de significncia a . Admitindo-se que conhecemos a varincia populacional a varivel do teste ser a distribuio Normal (Z) 3) Regio crtica

4) Calcular:

X - 0 Z= s n

onde: X = mdia amostral 0 = valor da hiptese nula s = desvio padro da populao n = tamanho da amostra

5) Concluses: a) Se |Z |> z rejeita-se H 0 (para um teste bicaudal ) b) Se Z > z rejeita-se H 0 (para um teste unicaudal a direita). c) Se Z < -z rejeita-se H 0 (para um teste unicaudal a esquerda). Exemplo 2: Uma mquina automtica de encher pacotes de erva mate, enche-os segundo uma distribuio normal com mdia e desvio padro de 20g. A mquina foi regulada para =500g. Desejamos verificar se a produo esta sob controle, para isto analisamos uma amostra de 30 pacotes. Se uma amostra apresentar mdia X =492g, voc pararia ou no a produo para verificar se a mquina deve ser regulada? Use a =1%. 1o Passo:

2o Passo:

3o Passo:

4o Passo:

5o Passo:

Teste para a mdia ( s 2desconhecido; n < 30) Neste caso usaremos a distribuio tde Student. Logo no 4 o e 5 o passo teremos: 4) Calcular: X - 0 onde: X = mdia amostral T = 0 = valor da hiptese nula S S = desvio padro da amostra n n = tamanho da amostra 5) Concluses: b) Se |T |> t rejeita-se H 0 (para um teste bicaudal ) b) Se T > t rejeita-se H 0 (para um teste unicaudal a direita). c) Se T < -t rejeita-se H 0 (para um teste unicaudal a esquerda). Exemplo 3: Um fabricante afirma que a mdia de vida til das lmpadas por ele fabricadas de 4.200 horas. A mdia da vida til para uma amostra de N=10 lmpadas de 4.000 horas com um desvio padro de amostral de S=200 horas. A vida til das lmpadas segue uma distribuio normal. Teste a afirmao do fabricante a um nvel de significncia de 5%. 1o Passo:

2o Passo: 3o Passo:

4o Passo:

5o Passo:

1)

EXERCCIOS Uma amostra aleatria de 40 elementos retirados de uma populao normal com desvio padro s = 3 apresentou um valor mdio igual a 60. Teste, ao nvel de significncia de 5%, a hiptese de que a mdia populacional seja igual a 59, supondo a hiptese alternativa > 59.

2)

Uma amostra aleatria de 100 mortes naturais, no Rio Grande do Sul, deu uma mdia de X =71,8 anos, com um desvio padro de 8,9 anos. Isto indica que o tempo mdio de vida no RS, atualmente, maior do que 70 anos? ( a = 5%) Uma amostra aleatria de tamanho n = 18 de uma populao normal tem mdia x= 31,5 e desvio padro s = 4,2. Ao nvel de significncia de 5%, estes dados sugerem que a mdia populacional seja superior a 30? A resistncia dos cabos fabricados por determinada companhia acusa mdia de 1800 libras e desvio padro de 100 libras. Adotando-se uma nova tcnica de fabricao, espera-se aumentar esta resistncia. Para testar tal hiptese, toma-se uma amostra de 50 cabos fabricados pelo novo processo, obtendo-se uma resistncia mdia de 1850 libras. Pode-se aceitar a hiptese ao nvel de significncia de 0,01? Doze latas de lubrificante de certa marca acusam os contedos mdios seguintes (decilitros):10.2 9.7 10.1 10.3 10.1 9.8 9.9 10.4 10.3 9.8 10.4 10.2. Ao nvel de 1% , testar a hiptese de que o contedo mdio das latas daquele lubrificante = 10 dl. Admitir a normalidade da distribuio. Teste de diferena entre m dias:

3)

4)

5)

Amostras Dependentes. Neste caso usaremos a distribuio tde Student. Logo no 4 o e 5 o passo teremos: 4) Calcular: onde: d = valor mdio das diferenas dpara os dados d - d amostrais emparelhados( dependentes) T = d = mdia das diferenas dpara a Sd populao de dados emparelhados. n S = desvio padro das diferenas dpara os d dados amostrais emparelhados n= nmero de pares de dados. Graus de liberdade = n-1. 5) Concluses: c) Se |T |> t rejeita-se H 0 (para um teste bicaudal ) b) Se T > t rejeita-se H 0 (para um teste unicaudal a direita). c) Se T < -t rejeita-se H 0 (para um teste unicaudal a esquerda). Exemplo: Utilizando um cronometrador de reao foi obtido a tabela abaixo, no nvel de 0,05 de significncia, teste a afirmao de que h uma diferena entre a mdia dos tempos de reao da mo direita e da mo esquerda. Pessoa A B C D E F G H I J K L M N Direita 191 97 116 165 116 129 171 155 112 102 188 158 121 133 Esquerd 224 171 191 207 196 165 177 165 140 188 155 219 177 174 a

d -33 -74 -75 -42 -80 -36 -6 -10 -28 -86 33 -61 -56 -41

1o Passo:

2o Passo: 3o Passo:

4o Passo: 5o Passo: Amostras Grandes e Independentes. Neste caso usaremos a distribuio Normal. Logo no 4 4) Calcular:
o

e 5 o passo teremos:

Z =

(x1 - x2 ) - (1 - 2 )
2 s1 s2 + 2 n1 n2

OBS: Se no conhecemos os valores de s 1 e s 2 , podemos substitu-los por s 1 e s 2 , desde que ambas as amostras sejam grandes. 5) Concluses: d) Se |Z |> z rejeita-se H 0 (para um teste bicaudal ) b) Se Z > z rejeita-se H 0 (para um teste unicaudal a direita). c) Se Z < -z rejeita-se H 0 (para um teste unicaudal a esquerda). Exemplo: 1) Os alunos de uma faculdade selecionaram aleatoriamente 217 carros de estudantes e constataram que a mdia de suas idades era de 7,89 anos, com desvio padro de 3,67 anos. Selecionaram tambm, aleatoriamente, 152 carros do corpo docente e do pessoal da administrao, constatando uma mdia de 5,99 anos e um desvio padro de 3,65 anos. No nvel de significncia de 0,05, teste a afirmao de que os carros dos estudantes so mais velhos do que os dos professores e demais funcionrios.

1o Passo:

2o Passo: 3o Passo:

4o Passo:

5o Passo: Amostras Pequenas e Independentes. Neste caso usaremos a distribuio Normal. Logo no 4 4) Calcular:
o

e 5 o passo teremos:

T =

(x1 - x2 ) - (1 - 2 ) s2 p n1 + s2 p n2

s2 = Onde ) p

1 2 2 e o grau de liberdade gl = n (n1 - 1) + (n2 - 1 5) Concluses: e) Se |Z |> z rejeita-se H 0 (para um teste bicaudal ) b) Se Z > z rejeita-se H 0 (para um teste unicaudal a direita). c) Se Z < -z rejeita-se H 0 (para um teste unicaudal a esquerda). 1

(n - 1)s2 + (n - 1)s2

+n2 -2.

Exemplo:
Os dados amostrais a seguir apresenta m os nveis de concentrao de lcool no sangue por ocasio da priso de criminosos selecionados aleatoria mente, e que foram condenados por dirigirem embriagados. Os dados so categorizados por tipo de bebida consumida.
Cerveja Usque 0,129 0,154 0,187 0,185 0,225 0,247 0,146 0,155 0,19 0,19 0,226 0,253 0,148 0,164 0,203 0,22 0,227 0,257 0,224 0,241

Com o nvel de 0,05 de significncia, teste a hiptese de que os bebedores de cerveja e os de usque e semelhantes tm os mesmos nveis concentrao de lcool no sangue. x = 0,164 e s = 0,02427 e x = 0,227 e s = 0,02317 1 1 2 2

1o Passo: 2o Passo: 3o Passo:

4o Passo:

5o Passo:

Exerccios: 1. Costuma-se avaliar a inteligncia das crianas dando-lhes blocos e pedindo-lhes que construam uma torre to alta quanto possvel. Repetiu-se um ms depois o mesmo experimento, com os tempos (em segundos) dados na tabela a seguir. No nvel de 0,01 de significncia, teste a afirmao de que no h diferena entre os dois tempos. Criana A B C D E F G H I J K L M N O 1 tentativa 30 19 19 23 29 178 42 20 12 39 14 81 17 31 52 2 tentativa 30 6 14 8 14 52 14 22 17 8 11 30 14 17 15 2. Utilize o nvel de significncia de 0,05 para testar a alegao de que as duas amostras provm de populaes com a mesma mdia. As amostras so independentes. Elementos Tratados Elementos No-Tratados n1 = 60 n = 75 2 x18,75 = 66 x2 = 9, S = 2,05 S = 2,88 1 2 3. O estresse afeta a capacidade de memorizao de testemunhas oculares? Este problema foi estudado em um experimento que testou a memria visual de uma testemunha uma semana aps o interrogatrio normal de um suspeito que cooperava, e um interrogatrio exaustivo de um suspeito que no cooperava. Os nmeros de detalhes lembrados uma semana aps o incidente esto resumidos aqui. No nvel de 0,01, teste a afirmao do artigo de que o cansao concorre para diminuir a quantidade de detalhes lembrados. Sem Estresse Com Estresse n1 = 40 n = 40 2 x153,3 = 3 x2 = 45, S = 11,6 S = 13,2 1 2

4. Os dados relativos s rendas mensais observadas em uma amostra de 12 engenheiros e 14 advogados esto na tabela abaixo: Engenheiros Advogados
8 11,5 7 9 9 11,5 7 9 9,5 12 7,5 9 10 12,5 8 10,5 11 13 8 11 11 13 8,5 11 8,5 12

Teste a afirmao que a renda mensal mdia de advogados e engenheiros so iguais. ( = 0,05)

5. Os distrbios psiquitricos srios esto relacionados com fatores biolgicos que possam ser observados fisica mente? Em um estudo foi utilizada a tomografia computadorizada de raios X para coletar dados sobre o tamanho do crebro de um grupo de pacientes com distrbios obsessivos-compulsivos, e um grupo de controle constitudo de pessoas sadias. A lista apresenta os resultados amostrais (em milmetros) para volumes do cordato direito.
Pacientes obsessivos-compulsivos Grupo de controle 0,21 0,305 0,344 0,334 0,429 0,483 0,287 0,308 0,407 0,349 0,445 0,501 0,288 0,334 0,455 0,402 0,46 0,519 0,304 0,34 0,463 0,413 0,476 0,594

Com nvel de 0,01 de significncia, teste a afirmao de que os pacientes obsessivos-compulsivos e as pessoas sadias tm os mesmos volumes cerebrais.

Teste para uma proporo Devemos calcular:

Z =

p- p

p (1 - p ) n

= proporo amostral onde: p p = valor da hiptese nula 0 n = tamanho da amostra

Exemplo: Uma estao de televiso afirma que 60% dos televisores estavam ligados no seu programa especial do ltimo sbado. Uma rede competidora deseja contestar essa afirmao e decide, para isso, usar uma amostra de 200 famlias. Destas 200 famlias 104 responderam afirmativamente. Ao nvel de 5% de significncia qual a sua concluso? 1o Passo: 2o Passo: 3o Passo: 4o Passo: 5o Passo:

Teste para duas propores Devemos calcular: x1 (proporo amostral) n1 2 1 2 Z = 1 p = proporo populacional 1 p.q p.q n = tamanho da amostra + 1 x + x2 n n p = 1 1 2 e pq = 1 - . n1 + n2 Exemplo: Pesquisadores fizeram um estudo de empregadas da IBM que estavam grvidas. De 30 empregadas que lidavam com ter-glicol, 10 (ou 33,33%) tiveram aborto (espontneo), mas, de 750 que no estavam expostas ao ter-glicol, apenas 120 (ou 16%) abortaram. No nvel de 0,01 de significncia, teste a afirmao de que as mulheres expostas ao ter-glicol apresentam maior taxa de aborto. 1o Passo:

(p - p ) - ( ponde: - p )

p = 1

2o Passo: 3o Passo: 4o Passo: 5o Passo: 1) A preocupao com ambiente entra freqentemente em conflito com a tecnologia moderna, como no caso dos pssaros que representam perigo para a aviao durante a decolagem. Um grupo ambiental afirma que tais acidentes com pssaros so to raros que no se justifica mat-los. Um grupo de pilotos alega que entre as decolagens interrompidas que levam um avio a ultrapassar o final da pista, 10% so devidas a coliso com pssaros. Teste esta afir mao ao nvel de 0,05. os dados consistem em 74 decolagens interrompidas, destas 5 foram devidos coliso com pssaros. 2) Um relatrio do Ministrio da Justia dos EUA inclui a afirmao de que em casos de crimes entre casais, as esposas acusadas tm menor probabilidade de ser condenadas do que os maridos acusados. Os dados amostrais consistiram em 277 condenaes entre 318 maridos acusados, e 155 condenaes entre 222 esposas acusadas. Tese a afirmao feita com nvel de 0,01 de significncia. 3) Uma questo de teste considerada boa se permite discriminar entre estudantes preparados e estudantes no-preparados. A primeira questo de um teste foi respondida corretamente por 62 dentre 80 alunos preparados, e por 23 dentre 50 alunos nopreparados. Com o nvel de 0,05 de significncia, teste a afirmao de que esta questo foi respondida corretamente por uma proporo maior de estudantes preparados

Você também pode gostar