Você está na página 1de 51

Estatstica Aplicada

Autores: Prof. Edwin F. F. Silva Prof. Wesley Cndido de Melo Colaboradores: Prof. Santiago Valverde Prof. Jean Carlos Cavaleiro Prof. Daniel Scodeler Raimundo

Professores conteudistas: Edwin F. F. Silva e Wesley Cndido de Melo Edwin F. F. Silva Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2005); especializao em Higiene das radiaes ionizantes (Senacap, 2011); em Metodologia do Ensino e Aprendizagem em Matemtica (2009); ps-graduao em Transporte (em andamento) pela Universidade de Braslia. Atualmente, professor da Faculdade Fortium, ministrando aulas de clculo e estatstica nos cursos de Sistema de Informaes e Administrao, e da Universidade Paulista, no curso de Engenharia. Atua em pesquisas relacionadas poluio sonora, na rea de polos geradores de viagens e tambm como corretor de questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da UNIP Interativa. Wesley Cndido de Melo Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2006); especializao em Matemtica e Estatstica pela FACITEC (2008); ps-graduao em Transporte (em andamento) pela Universidade de Braslia. Atualmente, professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gesto de RH e Segurana Privada; da Faculdade JK, nos cursos de Administrao e Radiologia. Atua tambm como corretor de questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da UNIP Interativa. pesquisador vinculado ao grupo de pesquisa em Poluio sonora com nfase em Rudos aeronuticos no curso de Fsica da Universidade Catlica de Braslia.

Dados Internacionais de Catalogao na Publicao (CIP)

S586e

Silva, Edwin F. Estatstica aplicada / Edwin F. Silva; Wesley Cndido de Melo. So Paulo: Editora Sol, 2012. 112 p., il. Nota: este volume est publicado nos Cadernos de Estudos e Pesquisas da UNIP, Srie Didtica, ano XVII, n. 2-064/12, ISSN 1517-9230. 1. Estatstica. 2. Distribuio de frequncias. 3. Probabilidades. I. Ttulo. CDU 519.2

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem permisso escrita da Universidade Paulista.

Prof. Dr. Joo Carlos Di Genio


Reitor

Prof. Fbio Romeu de Carvalho


Vice-Reitor de Planejamento, Administrao e Finanas

Profa. Melnia Dalla Torre


Vice-Reitora de Unidades Universitrias

Prof. Dr. Yugo Okida


Vice-Reitor de Ps-Graduao e Pesquisa

Profa. Dra. Marlia Ancona-Lopez


Vice-Reitora de Graduao

Unip Interativa EaD


Profa. Elisabete Brihy Prof. Marcelo Souza Profa. Melissa Larrabure

Material Didtico EaD


Comisso editorial: Dra. Anglica L. Carlini (UNIP) Dr. Cid Santos Gesteira (UFBA) Dra. Divane Alves da Silva (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Ktia Mosorov Alonso (UFMT) Dra. Valria de Carvalho (UNIP) Apoio: Profa. Cludia Regina Baptista EaD Profa. Betisa Malaman Comisso de Qualificao e Avaliao de Cursos Projeto grfico: Prof. Alexandre Ponzetto Reviso: Andria Gomes Geraldo Teixeira Jr.

Sumrio
Estatstica Aplicada
Apresentao.......................................................................................................................................................7 Introduo............................................................................................................................................................7
Unidade I

1 HISTRIA DA ESTATSTICA...............................................................................................................................9 1.1 Introduo estatstica.........................................................................................................................9 1.2 Importncia da estatstica..................................................................................................................11 1.3 Elementos fundamentais da estatstica....................................................................................... 12
1.3.1 Populao e amostra.............................................................................................................................. 12

1.4 Fases do mtodo estatstico. ............................................................................................................. 13 1.5 Dados estatsticos................................................................................................................................. 13 1.6 Formas iniciais de tratamento dos dados................................................................................... 15 1.7 Notaes por ndices........................................................................................................................... 16
1.7.1 Notao sigma ().................................................................................................................................. 16

1.8 Sries estatsticas simples e compostas................................................................................... 19 2 Apresentao de dados grficos e tabelas. ........................................................................ 20 2.1 Elementos bsicos das tabelas......................................................................................................... 26 3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA DADOS SIMPLES................................................................................................................................................... 26 3.1 A mdia aritmtica simples (x)........................................................................................................ 27 3.2 A mdia aritmtica ponderada xp.................................................................................................. 29 3.3 A mediana (Md)..................................................................................................................................... 31 3.4 A moda...................................................................................................................................................... 34 3.5 Posio relativa da mdia, moda e mediana. ............................................................................. 36 4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES. .............................................................................. 36 4.1 Amplitude total...................................................................................................................................... 38 4.2 Desvio mdio absoluto........................................................................................................................ 39 4.3 Varincia................................................................................................................................................... 40 4.4 Desvio padro......................................................................................................................................... 45 4.5 Coeficiente de variao...................................................................................................................... 46
Unidade II

5 DISTRIBUIO DE FREQUNCIAS.............................................................................................................. 52 5.1 A construo de uma distribuio de frequncias para dados contnuos. .................... 53

5.2 A construo de uma distribuio de frequncias para dados discretos....................... 59 5.3 Representaes grficas de dados agrupados.......................................................................... 60 6 AS MEDIDAS DE POSIO E VARIABILIDADE NUMA DISTRIBUIO DE FREQUNCIA. ................................................................................................................................................... 69 6.1 As medidas de posio........................................................................................................................ 70
6.1.1 A mdia........................................................................................................................................................ 70 6.1.2 A mediana................................................................................................................................................... 71 6.1.3 A moda......................................................................................................................................................... 72

6.2 As medidas de disperso numa distribuio de frequncia. ................................................ 73


6.2.1 O desvio mdio......................................................................................................................................... 73 6.2.2 Varincia...................................................................................................................................................... 74 6.2.3 Desvio padro. ........................................................................................................................................... 75

7 INTRODUO PROBABILIDADE.............................................................................................................. 80 7.1 Teorias dos conjuntos, espao amostral e eventos. ................................................................. 81 8 PROBABILIDADE: ORIGEM, MTODOS E PRINCIPAIS TEOREMAS................................................. 91 8.1 Origens da probabilidade................................................................................................................... 92
8.1.1 Mtodos objetivos................................................................................................................................... 92 8.1.2 Mtodo subjetivo..................................................................................................................................... 96

8.2 Principais teoremas de probabilidade........................................................................................... 96

Apresentao

O objetivo deste material fazer com que o aluno tenha condies de interpretar um conjunto de observaes de forma clara e objetiva, a fim de distinguir as limitaes e as vantagens do uso de amostras, assim como os mtodos para sua obteno; tenha habilidade para descrever e interpretar dados por meio de figuras (tabelas e grficos), estimativas pontuais e de variabilidade; calcular o intervalo de confiana da proporo e mdia, assim como identificar sua aplicao; coletar e interpretar dados de forma sistematizada e imprimir credibilidade a anlises quantitativas dos fenmenos de realidade investigada. Assim, esperamos contribuir da melhor forma possvel com seu aprendizado. Com nossos cumprimentos, Equipe organizadora.
Introduo

Desde a Antiguidade, a estatstica faz parte da vida das pessoas, mesmo que de forma indireta, mas o certo que essa cincia est presente na vida das pessoas o tempo todo. Quando abrimos um jornal, por exemplo, l est uma srie de grficos e tabelas que nos auxiliam no entendimento de determinado tema, ou quando lemos uma reportagem que traz como tema a probabilidade de o mercado financeiro fechar em alta ou em baixa, ou, ainda, virando a pgina desse mesmo jornal, temos a manchete divulgando os dados do Censo 2010. Diante desses fatos, nos perguntamos de que forma a estatstica pode nos ajudar, seja no levantamento de dados para uma empresa saber como vo suas vendas, seja para saber os riscos de investir nas aes de uma empresa, ou, ainda, como o governo pode determinar as caractersticas dos vrios aspectos, sociais, econmicos e ambientais dos estados e at mesmo de nosso pas. So perguntas como essas que a estatstica nos ajuda a responder, e ainda no podemos pensar nessa cincia como se ela se limitasse a apenas compilar tabelas de dados e os ilustrar graficamente. Dessa forma, de sua importncia conhecer as inmeras variveis associadas a ela, pois em qualquer ramo da sociedade contempornea esto presentes os processos estatsticos. E o estudante que no souber trabalhar com esses conceitos estar em desvantagem no mercado de trabalho. Para tirar o mximo proveito da interpretao de um determinado fenmeno, deve-se seguir algumas etapas, como, por exemplo, planejar a obteno de dados, interpretar e analisar os dados obtidos e apresentar os resultados de maneira a facilitar a tomada de decises razoveis. fundamental que o texto produzido neste material leve o aluno a pensar em situaes do seu cotidiano e que dessa forma ele possa associar a teoria com a prtica vivenciada em seu dia a dia. Pensando nisso, ele foi dividido em duas unidades, nas quais sero abordados, na primeira unidade: sries estatsticas, grficos estatsticos, medidas de tendncia central, medidas de disperso, entre outros 7

temas; j na segunda unidade, sero apresentados: dados tabulares, distribuio de frequncia, medidas de posio e variabilidade numa distribuio de frequncia, probabilidade, bem como alguns de seus teoremas, entre outros temas.

Estatstica Aplicada

Unidade I
Como a Unio realiza a distribuio de renda para os Estados, Municpios e o Distrito Federal? Como saber quem deve receber mais ou menos verbas? Como saber se determinado trecho de uma via ou rodovia ou no perigoso? So a questes como essas que a disciplina Estatstica procura responder.
1 HISTRIA DA ESTATSTICA

Na histria do desenvolvimento humano, a sociedade primitiva se deparou com os primeiros problemas para saber o tamanho da sua populao, a quantidade de terras e suas riquezas, por isso teve a necessidade de cont-las. Em decorrncia disso, os governantes das grandes civilizaes antigas zeram indiretamente um estudo estatstico para saber os bens que seu Estado possua e como a populao desse Estado estava distribuda. No Antigo Egito, aproximadamente 3040 a.C., Herdoto pediu que fosse feito um estudo sobre a riqueza da populao, com o objetivo de saber a quantidade de recursos econmicos e humanos para realizar a construo das pirmides. Na China, aproximadamente 2238 a.C., o imperador Yao pediu que fosse feito um estudo da populao, com objetivos industriais e comerciais. A palavra estatstica foi sugerida pelo alemo Gottifried Achemmel (1719/1772) e associada palavra latina status (Estado). Essa cincia teve acelerado desenvolvimento a partir do sculo XVII, com os estudos de Bernoulli, Fermat, Laplace, Gauss e outros que estabeleceram suas caractersticas atuais.

Saiba mais Para uma abordagem mais detalhada da histria da estatstica, ler o artigo: Conceitos iniciais e breve histrico da estatstica, disponvel em: <http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_ inicias-historico-somatorio.pdf>. Acesso em: 12 jul. 2012.
1.1 Introduo estatstica

A todo instante, nos noticirios, em revistas, jornais, internet, ouvimos falar na palavra estatstica, o que possvel perceber o quanto importante conhecermos a fundo essa cincia. Algumas de 9

Unidade I
suas aplicabilidades podem ser observadas nas pesquisas de opinio pblica e nos dados publicados diariamente na imprensa. Na realidade, a estatstica contempla muitos outros aspectos, sendo de vital importncia na interpretao de processos em que exista variabilidade. De acordo com Dervalmar, possvel distinguir duas concepes para a palavra estatstica. No plural, estatsticas indica qualquer coleo de dados quantitativos ou, ainda, ramo da matemtica que trata da coleta, da anlise, da interpretao e da apresentao de massa de dados numricos. Assim, por exemplo, as estatsticas demogrficas referem-se aos dados numricos sobre o quantitativo de nascimentos, falecimentos, matrimnios, desquites etc. As estatsticas econmicas esto relacionadas aos dados numricos como emprego, produo, vendas e com outras atividades ligadas aos vrios setores da vida econmica. No singular, estatstica indica a atividade humana especializada, ou um corpo de tcnicas, ou ainda uma metodologia desenvolvida para a coleta, a classificao, a apresentao, a anlise e a interpretao de dados quantitativos e a utilizao desses dados para a tomada de decises. Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os fenmenos coletivos. Para fins didticos, comum os livros-textos apresentarem a estatstica em duas grandes reas, embora no se trate de reas isoladas: estatstica descritiva e estatstica inferencial. estatstica descritiva aquela que tem por objetivo descrever e analisar determinada populao, utilizando mtodos numricos e grficos, para se determinarem padres, em um conjunto de dados, e assim apresentar a informao em uma forma conveniente. Exemplo 1: O grfico a seguir apresenta a participao relativa das bandeiras de cartes de crdito, no quarto trimestre de 2010.

Visa 52,2%

Master Card 38,4%

Outras 9,4% Figura 1 - Participao relativa das bandeiras (quantidade de transaes)

Por meio do grfico, possvel ver claramente que mais da metade das transaes so feitas com a bandeira Visa e que aproximadamente 40% so feitas com a bandeira MasterCard. Como o grfico descreve os tipos de bandeiras de cartes utilizadas em todas as transaes do quarto trimestre de 2010, o grfico um exemplo de estatstica descritiva. 10

Estatstica Aplicada
Exemplo 2: ndice Nacional de Preos ao Consumidor (INPC) Sua apresentao envolve a sintetizao, em um nico dado, dos aumentos dos produtos de uma cesta bsica. Trata-se de um exemplo de estatstica inferencial, que constitui o conjunto de mtodos para a tomada de decises, nas situaes em que h incerteza, variaes ou outras generalizaes acerca de um conjunto maior de dados. Exemplo 3: Anlise de mercado Quando uma empresa pretende lanar um produto, precisa conhecer as preferncias dos consumidores no mercado de interesse. Faz-se necessria uma pesquisa de mercado. Exemplo 4: Ocorrncia de terremotos Os gelogos esto continuamente coletando dados sobre a ocorrncia de terremotos. Gostariam de inferir quando e onde ocorrero tremores e qual a sua intensidade. Trata-se, sem dvida, de uma questo complexa que exige longa experincia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.
1.2 Importncia da estatstica

Com o desenvolvimento humano e tecnolgico, temos presenciado grandes descobertas na rea da sade, da engenharia, da economia etc.; por outro lado, tambm observamos os problemas que se espalham pelo mundo, por exemplo, a ameaa com a degradao do meio ambiente, as epidemias (H1N10) causando grandes preocupaes para os governantes e para a populao mundial. Como ajudar pesquisadores, cientistas, engenheiros etc. a se nortearem com o que deve ser feito tanto para criar novas possibilidades como tambm para solucionar os problemas existentes? O mtodo estatstico lida com informaes, associando os dados ao problema, mostrando como e o que coletar para obter concluses a partir de todos os dados, de tal forma que essas concluses possam ser entendidas por outras pessoas. Assim, esse mtodo auxilia os vrios profissionais no planejamento e na tomada de decises.

Saiba mais O artigo A elaborao de estatsticas de mortalidade segundo causas mltiplas apresenta uma aplicao da estatstica mostrando a sua importncia para a tomada de decises. Disponvel em: <http://www. scielosp.org/pdf/rbepid/v3n1-3/03.pdf>. Acesso em: 15 jul. 2012. 11

Unidade I
Vejamos alguns exemplos: O governo anualmente divulga o censo sobre a dinmica da populao brasileira, apresentando seu crescimento demogrfico, suas caractersticas e como vivem os brasileiros. As grandes empresas fazem levantamentos sobre vendas, produo, inventrio, folha de pagamento e outros dados, a fim de verificar se a empresa est crescendo, como seu crescimento est em relao a outras empresas e como tomar decises futuras. A anlise dos dados muito importante para fazer um planejamento adequado.

Saiba mais Para mais informaes sobre o Censo, acesse o site do IBGE: <http://www.ibge.gov.br>.
1.3 Elementos fundamentais da estatstica

Amostra: qualquer subconjunto no vazio de uma populao. Amostragem: o meio de escolha da amostra e consiste na seleo criteriosa dos elementos a serem submetidos ao estudo. 1.3.1 Populao e amostra Para o pesquisador, o estudo de qualquer fenmeno, seja ele natural, econmico, social ou biolgico, necessita da coleta e da anlise de dados estatsticos. A coleta de dados parte inicial de qualquer pesquisa. Populao: o conjunto de todos os itens (pessoas, coisas e objetos) que interessam ao estudo de um fenmeno coletivo. Parmetro: a denominao de uma caracterstica numrica estabelecida para toda uma populao. Estimador: a caracterstica numrica estabelecida para toda a amostra. Exemplo: pesquisas sobre tendncias de votao. Em pocas de eleio, comum a realizao de pesquisas com o objetivo de conhecer as tendncias do eleitorado. Para que os resultados sejam, de fato, representativos, deve-se atentar para que as caractersticas da populao qual os resultados da pesquisa sero estendidos sejam to prximas 12

Estatstica Aplicada
quanto possvel. A escolha da amostra, o questionrio, a entrevista, a sintetizao dos dados e a representao dos resultados so as etapas desse tipo de pesquisa.
Parmetro uma proporo de votos para o candidato A obtida na populao Fenmeno coletivo (Eleies para Prefeitura de um municpio). Amostra Estimador uma proporo de votos para o candidato A obtida na amostra Figura 2 Populao so todos os eleitores habilitados do municpio.

Amostra um grupo numrico de eleitores selecionado na populao do municpio

1.4 Fases do mtodo estatstico

Em uma pesquisa, quando se deseja empreender um estudo estatstico completo, existem fases do trabalho que devem ser trabalhadas para se chegar aos resultados finais do estudo. As principais fases so: definio do problema delimitao do problema; planejamento organizao das aes que sero realizadas na pesquisa de campo; coleta de dados ir a campo buscar as informaes; apurao dos dados organizao das informaes coletadas; apresentao dos dados grficos e tabelas; anlise e interpretao dos dados por meio da linguagem matemtica (mdia, mediana, moda, desvio padro, percentuais etc.). Observe quais so as fases principais do mtodo estatstico compem a organizao de um projeto, sua execuo e apresentao final.
1.5 Dados estatsticos

Quando se trabalha com a observao, a mensurao, a anlise e a interpretao de nmeros, esses nmeros nos conduzem a ndices inflacionrios, ndices de desemprego, probabilidade de determinado candidato ganhar as eleies etc. Esses nmeros, portanto, sero chamados de dados estatsticos, os quais precisaro ser organizados e sumarizados para sua correta interpretao. O dado bruto significa que os dados no esto numericamente organizados e processados. o processamento e a organizao dos dados que os transformam em informao, enfatizando 13

Unidade I
seus aspectos mais importantes. A informao, portanto, resultado de um tratamento dos dados. Para organizar e processar os dados estatsticos, podem-se utilizar resumos visuais e numricos, como grcos, mapas, tabelas e modelos numricos. A mensurao ou a observao de itens como ndices de preos, renda mensal per capita de um Estado etc. do origem aos dados estatsticos. Como esses itens originam valores que tendem a apresentar certo grau de variabilidade quando so medidos sucessivas vezes, iremos cham-los, ento, de variveis. importante identificar os quatro tipos de variveis: variveis contnuas, variveis discretas, variveis nominais e variveis ordinais. Variveis contnuas: podem assumir qualquer valor num intervalo contnuo (dado contnuo), ou seja, ser um nmero real. Exemplos: altura, peso, velocidade etc. Variveis discretas: em geral, originam-se da contagem de itens e s podem assumir valores inteiros. Exemplos: nmero de alunos em sala de aula, nmero de professores que trabalham na escola etc. Variveis nominais: so aquelas que existem com o objetivo de definir categorias, e as observaes, mensuraes e anlises so feitas levando-se em conta essas mesmas categorias. Exemplos de categoria seriam: separao por sexo, estado civil, esporte predileto, cor etc. Variveis ordinais: quando existe o desejo de dispor os elementos observados segundo uma ordem de preferncia ou desempenho, atribuem-se valores relativos para indicar essa ordem. Exemplo: primeiro, segundo, terceiro grau de escolaridade etc. As variveis discretas e contnuas so ditas variveis quantitativas porque envolvem dados numricos. J as variveis nominais e ordinais precisam ser transformadas em valores numricos para serem objeto da anlise estatstica, e so ditas variveis qualitativas. Por exemplo: em um departamento da empresa JJ, que tem 36 funcionrios, fez-se uma pesquisa para verificar alguns dados. Classifique as variveis, conforme os dados da tabela a seguir. Tabela 1
Estado civil Solteiro Casado Casado Solteiro Solteiro Grau de instruo Ensino Fundamental Ensino Fundamental Ensino Superior Ensino Mdio Ensino Mdio N filhos 1 3 Salrio (X. min) 4,00 4,56 19,40 10,53 16,22 Idade (anos-meses) 23 03 32 10 48 11 25 08 31 05

14

Estatstica Aplicada
Resoluo Varivel qualitativa nominal: estado civil. Varivel qualitativa ordinal: grau de instruo. Varivel quantitativa discreta: nmero de filhos. Varivel quantitativa contnua: salrio e idade. Variveis discretas e contnuas = variveis quantitativas. Variveis nominais e ordinais = variveis qualitativas. E ainda: Dados qualitativos: consistem em atribuir qualidade ou atributo varivel pesquisada. Dados quantitativos: consistem em nmeros que representam contagens ou medidas.
1.6 Formas iniciais de tratamento dos dados

Em geral, quando nos propomos a buscar ou construir informaes a partir de dados, deparamonos, inicialmente, com um conjunto de dados brutos que pouco nos dizem. preciso organiz-los minimamente para que comecem a fazer algum sentido, viabilizando sua anlise. Exemplo 1: a tabela a seguir apresenta as notas de 40 estudantes da disciplina de estatstica. Tabela 2 50 32 24 80 60 96 54 45 35 20 75 25 80 96 45 87 69 90 47 89 65 72 64 65 20 45 30 95 70 90 72 81 23 73 80 10 20 90 63 70

Essa tabela chamada de tabela primitiva ou dados brutos, pois os dados coletados esto dispostos conforme a ordem da coleta e no na ordem de numerao. Observando os dados anteriores, tabela primitiva, fica difcil visualizar em torno de que valor tendem a se concentrar as notas dos estudantes, qual a maior ou qual menor nota, e ainda quantos alunos se acham abaixo de uma dada nota. 15

Unidade I
Uma primeira forma de organizao dos dados brutos o chamado rol. Obtemos o rol quando organizamos os dados brutos em ordem crescente ou decrescente de grandeza. Ainda com respeito tabela de nota dos 40 estudantes da disciplina de estatstica, vejamos como fica: Tabela 3
10 32 60 72 87 20 35 63 72 89 20 45 64 73 90 20 45 65 75 90 23 45 65 80 90 24 47 69 80 95 25 50 70 80 96 30 54 70 81 96

Agora, podemos saber, com relativa facilidade, qual a menor nota (10) e qual a maior nota (96). Para determinar a amplitude do rol, basta realizar a diferena entre o maior e o menor nmero do rol, ou seja, para o exemplo, a amplitude de variao foi de 96 10 = 86. Exemplo 2: seja A = {10, 7, 3, 9, 1, 5, 10, 4, 2, 8} o conjunto das notas dos alunos, determine o rol e a amplitude do rol: {10, 7, 3, 9, 1, 5, 10, 4, 2, 8} dado bruto {1, 2, 3, 4, 5, 7, 8, 9, 10, 10} rol Amplitude = {maior valor do rol menor valor do rol} A = 10 1 = 9 Limites de classe: so os nmeros extremos de cada classe; sendo assim, temos um limite inferior e um superior, que denominamos de amplitude de variao. A = Lsup. - Linf.
1.7 Notaes por ndices

A notao por ndices bastante utilizada na estatstica, sendo importante esclarecer seu significado. O smbolo xi (l-se x ndice i) ir representar qualquer um dos n valores assumidos pela varivel x, x1, x2, x3, x4, ..., x. n denominado ndice e poder assumir qualquer dos nmeros entre 1, 2, 3, 4,..., n. 1.7.1 Notao sigma () A maioria dos processos estatsticos vai exigir o clculo da soma de um conjunto de nmeros. A letra maiscula grega sigma () utilizada para representar o somatrio. 16

Estatstica Aplicada
Assim, se determinada varivel y tiver os valores 3, 5, 7, 9 e 11, o y ser: y = 3 + 5 + 7 + 9 + 11 y = 35 Por outro lado, se o consumo semanal de arroz por x, durante um ms, foi 2 kg, 4 kg, 3 kg, 5 kg, o total consumido por x no ms teria sido: x = 2 + 4 + 3 + 5 x = 14, x teria consumido 14 kg de arroz durante o ms referido. A notao sigma possui algumas propriedades que precisamos desenvolver para facilitar os contedos que estudaremos nesta disciplina.
A)

x1 = xi = x , isso signica que devemos somar as n observaes de x, comeando com


a primeira.
i=1

Por exemplo, num conjunto de dados x = {2, 4, 6, 8, 10, 12}, em que n = 6, temos:

xi = xi = 2 + 4 + 6 + 8 + 10 + 12 xi = 42
i=1 i=1

Por outro lado, possvel utilizar essa notao quando se pretende analisar a soma de apenas uma parte dos dados disponibilizados, podendo-se, portanto, abreviar a soma de um conjunto de dados. Dessa forma, podemos ter: x1 + x2 + x 3 = xi
1 3

x8 + x 9 + x10 + x11 = xi
i=8

B) Se cada valor da varivel

x multiplicado ou dividido por uma constante, temos que isso ser igual ao valor da constante multiplicado ou dividido pela somatria de x.

c.x = c. x

17

Unidade I
Assim,

4 xi = 4 x1 + 4 x2 + 4 x3 + 4 x4
i=1

= 4( x1 + x2 + x 3 + x 4 ) = 4 xi
i=1

Por exemplo: se xi = {2, 4, 6, 8, 10, 12}, n = 6, e cada valor de x multiplicado pela constante c = 2, temos:

cx = c x cxi =c xi =2(2) + 2(4) + 2(8) + 2(10) + 2(12) =


i=1 6 i=1 6 6

= 2(2 + 4 + 6 + 8 + 10 + 12)

2xi = 2 xi = 2(42) = 84
i=1 i=1

C) O somatrio de uma constante c ser igual ao produto da constante pelo nmero de vezes (n) que

ela se repete. Assim, temos:

ci = nc
i=i

Por exemplo, numa determinada observao, o conjunto de dados de xi = {7, 7, 7, 7, 7, 7}, n = 6, temos que xi uma constante c que se repete. Ento, temos: xi = ci
6 6

xi = ci = nc = 7 + 7 + 7 + 7 + 7 + 7 = 6(7) = 42
i=1 i=1

D) O somatrio de uma soma ou de uma diferena de duas variveis ser igual soma ou diferena

dos somatrios individuais das duas variveis. Assim, temos:

( xi + yi ) = xi + yi ( xi yi ) = xi yi
i=1 i=1 i=1 i=1 n i=1 n i=1 n

18

Estatstica Aplicada
Por exemplo:
i 1 2 3 4 X 8 3 4 5 20 Y 5 2 0 4 11 (X-Y) 3 1 4 1 9 Figura 3

(x y) = 9 x y = 20 11 = 9

E) O somatrio de um conjunto de dados x ao quadrado nos obriga a elevar cada elemento de xi ao

quadrado para efetuar a soma. Assim, temos:


2 2 2 + x2 xi2 = x1 2 + x 3 + ... + xn i=1 n

Por exemplo, numa dada observao, o conjunto de dados de xi = {2, 4, 6, 8, 10}, n = 5; temos, ento:

xi2 = 22 + 42 + 62 + 82 + 102 =
i=1

= 4 + 16 + 36 + 64 + 100 = 220
F) O somatrio ao quadrado de um conjunto de dados ser obtido tomando-se a soma dos valores

de xi e elevando-se ao quadrado. Assim, temos: ( xi )2 = ( x1 + x2 + x 3 + ... + xn )2


i=1 n

Por exemplo, se temos um mesmo conjunto xi = {2, 4, 6, 8, 10}, n = 5, tal qual no exemplo do item E, teremos um resultado distinto. Vejamos, neste caso: ( xi )2 = (2 + 4 + 6 + 8 + 10)2 = (30)2 = 900
i=1 5

No confunda sero diferentes.

xi2

n com xi , pois, conforme se observa no exemplo anterior, seus resultados i

1.8 Sries estatsticas simples e compostas

Uma srie estatstica dene-se como qualquer tabela na qual haja distribuio de um conjunto de dados estatsticos destinados a uma mesma ordem de classicao: quantitativa. Ou, ainda, no sentido 19

Unidade I
mais amplo, srie uma sucesso de nmeros referidos a qualquer varivel. Caso os nmeros expressem dados estatsticos, a srie ser chamada de srie estatstica. As tabelas so utilizadas para apresentar sries estatsticas. Os trs caracteres presentes na tabela que as apresenta so: a poca (fator temporal ou cronolgico) a que se refere o fenmeno estudado; o local (fator espacial ou geogrfico) onde o fenmeno acontece; o fenmeno (espcie de fato ou fator especfico) que descrito de forma categrica. As sries so divididas em dois grupos: As sries so divididas em dois grupos: 1. Sries homgradas: onde h variao discreta ou descontnua na varivel descrita. - Srie temporal Sries homgradas: - Srie geogrca - Srie especca. 2. Sries hetergradas: so aquelas nas quais o fenmeno/fato apresentam gradaes ou subdivises. Sries hetergradas: Distribuio de frequncias

2 Apresentao de dados grficos e tabelas

A representao grfica das sries estatsticas tem por finalidade sintetizar os resultados obtidos e, assim, chegar a concluses sobre a evoluo do fenmeno ou sobre como se relacionam os valores da srie. O grfico mais apropriado ficar a critrio do pesquisador, respeitando os elementos de clareza, simplicidade e veracidade (NOGUEIRA, 2009). Diretrizes para a construo de um grfico: o ttulo do grfico deve ser o mais claro e completo possvel, sendo necessrio acrescentar subttulos; a orientao geral dos grficos deve ser da esquerda para a direita; as quantidades devem ser representadas por grandezas lineares; sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a linha 0 (zero); s devem ser includas no desenho as coordenadas indispensveis para guiar a vista na leitura, um tracejado muito cerrado dificulta o exame do grfico; a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo para cima; 20

Estatstica Aplicada
os ttulos e as marcaes do grfico dispor-se-o de maneira que sejam facilmente legveis, partindo da margem horizontal inferior ou da margem esquerda. Leitura e interpretao de um grfico: declarar qual o fenmeno ou fenmenos representados, a regio considerada, o perodo de tempo, a fonte dos dados etc.; examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar a sua execuo, no conjunto e nos detalhes; analisar cada fenmeno separadamente, fazendo notar os pontos mais em evidncia, o mximo e o mnimo, as mudanas mais bruscas; investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o fato exposto estacionrio; procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo aproximado etc. Eis os tipos mais comuns de grficos: Grfico em linha
500 400 300 200 100 0 1 2 3 4 5 6 7 Figura 4 Srie 1 Srie 2

Grfico em colunas
Populao 100 80 60 40 20 0 1940 1950 1960 1970 Figura 5 Populao

21

Unidade I
Grfico em barras semelhante ao grfico em colunas, porm os retngulos so dispostos horizontalmente.
Populao do Brasil 1970 1960 1950 1940 0 20 40 60 50 100 Figura 6 Populao do Brasil

Grfico em setores
Anos 2008 2009 2010 Total Figura 7 Faturamento de uma empresa (em milhes) 3 4 5 12

a representao grfica de uma srie estatstica, em crculo, por meio de setores. utilizado principalmente quando se pretende comparar cada valor da srie com o total. Total __________360 Parte___________ x Para 2008: 12 - 360 3 - x x = 90 Para 2009: 12 - 360 4 - x x = 120 Para 2010: 12 - 360 5 - x x = 150 22

Estatstica Aplicada

2008 2009 2010

Figura 8

Grfico polar a representao de uma srie por meio de um polgono. Movimento mensal de compras de uma agncia em 1972. Tabela 4
Meses Janeiro Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Valores (R$ 1.000,00) 12 13 14 12 15 19 17 18 14 16 12 18

Dez Nov Out

20 15 10 5 0

Jan

Fev Mar Srie 1 Abr

Set Ago Jun Jul Figura 9

Mai

23

Unidade I
Grfico carta geogrfica a representao grfica de um mapa geogrfico indicando um acontecimento, por exemplo, a previso de tempo para determinado dia em determinado Estado ou pas. A figura a seguir um cartograma que informa a produo de petrleo segundo suas regies geogrficas. Cartograma 1.2 Produo de petrleo, segundo regies geogrficas (milhes b/d) 2003
Europa e Ex-Unio Sovitica

7,9 14,2
Amrica do Norte

22,6 8,4
frica Amricas Central e do Sul

7,9
sia-Pacfico

Oriente Mdio

6,7

Figura 10

Nota: inclui leo de xisto, leo de areias betuminosas o LGN, exceto para o Brasil. Para o Brasil, inclui LGN e no inclui leo de xisto e leo de areias betuminosas. Pictograma a representao grfica mais utilizada na atualidade por jornais e revistas, pois um grfico de forma atraente e de fcil interpretao. Mostra o fenmeno estudado inserido com um grfico de linha, coluna, barra ou de setor, conforme o exemplo a seguir, em que um outdoor aponta a verba gasta com publicidade junto com um grfico de linha para mostrar seu desempenho anual.

24

Estatstica Aplicada

Figura 11

Publicidade em alta

Institucional Oramento prev aumento de 20% em gastos da administrao direta Valor da publicidade Em R$ Milhes
120,2 158,1

167

De utilidade pblica 532,1


425,1

294,7

152,6 80,1 2007 2008 2009 2010 2007 2008 2009 2010

Figura 12

Saiba mais Aplicao de grficos de controle de Soma Acumulada (CUSUM) para monitoramento de um processo de usinagem. Disponvel em: <http:// dspace.universia.net/bitstream/2024/542/1/ArtigoXVISIMPEP2009.PDF>. Acesso em: 20 jul. 2012. 25

Unidade I
2.1 Elementos bsicos das tabelas

Uma forma de sintetizar os valores que uma ou mais variveis podem assumir por meio de uma tabela. Uma tabela constituda dos seguintes elementos: Quadro 1
Ttulo Cabealho Corpo da tabela Fonte o conjunto de informaes que precede a tabela e contm a indicao dos fatores: o qu? Quando? Onde? a parte superior da tabela que especifica o contedo das colunas. o espao que contm as informaes sobre o fenmeno observado. a indicao da entidade responsvel pelo levantamento dos dados.

Ttulo

Produo de petrleo em barris/dia Estado e Regio Rio de Janeiro Total Barris/dia 1.597.387 193.962 52.964 49.472 60.861 42.072 16.983 6.300 7.530 3.393 Cabealho

Coluna indicadora

Esprito Santo Amazonas Bahia Rio Grande do Norte Sergipe So Paulo Alagoas Cear Paran (xisto)

Rodap Figura 13

3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA DADOS SIMPLES

No desenvolvimento de um estudo estatstico, muitas vezes invivel examinar todos os elementos da populao de interesse para tirar concluses; pensando nisso, h medidas que possibilitam condensar as informaes para esclarecer a fase analtica da estatstica descritiva. A inferncia estatstica nos d elementos para generalizar, de maneira segura, as concluses obtidas da amostra para a populao. Quando se trata de amostra, a preocupao central que ela seja representativa. 26

Estatstica Aplicada
Assim que decidimos extrair informaes por meio de um levantamento amostral, temos imediatamente dois problemas: definir cautelosamente a populao de interesse; selecionar a caracterstica que iremos pesquisar. Portanto, temos situaes profissionais em que nos bastam poucos dados ou estatsticas de dados simples. Por outro lado, tm-se tambm situaes em que um nmero maior de elementos deve ser investigado e tratado como distribuies de frequncia. Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral buscamos medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado conjunto de nmeros. E as medidas mais usadas nesse sentido so as chamadas medidas de tendncia eventual ou central, que so a mdia, a mediana e a moda. Sabe-se que esses valores sero medidos de forma distinta conforme um grande conjunto de dados ou um pequeno conjunto de dados. Tambm o clculo desses valores ser afetado caso as variveis sejam discretas ou contnuas. Em estatstica, a mdia o valor mdio de uma distribuio ou de um conjunto de dados, determinado segundo uma regra estabelecida a priori e que se utiliza para representar todos os valores da distribuio. Existem diversas formas de calcular a mdia de um conjunto de nmeros, por exemplo, algumas delas so: mdia aritmtica, mdia aritmtica ponderada, mdia geomtrica e mdia harmnica. Observao Neste mdulo, trataremos do clculo dessas estatsticas para os chamados dados simples ou conjuntos de dados com menos de 30 elementos.
3.1 A mdia aritmtica simples (x)

A mdia aritmtica um dos valores mais representativos de um conjunto de dados. Obtm-se o valor da mdia aritmtica dividindo-se o somatrio dos valores do conjunto de dados pelo nmero de valores total desse conjunto. Na mdia aritmtica, temos como smbolo: x (l-se x trao ou x barra). Assim, temos que, para a amostra, se calcula o valor mdio utilizando-se os seguintes parmetros:

27

Unidade I
x Mdia aritmtica da amostra (estimativa) n Nmero de dados da amostra xi Cada varivel da amostra

x=

xi , onde
i=1

Vamos, agora, tomar um exemplo de mdia aritmtica. Supondo um conjunto de dados x i = {2, 4, 6, 8, 10,12}, onde n = 6, temos:

x=

xi
i=1

2 + 4 + 6 + 8 + 10 + 12 =7 6

Exemplo 1: Uma amostra das notas das provas de matemtica dos estudantes da 7 srie de uma grande escola de So Paulo xi, em que: xi = {87, 42, 64, 58, 90, 90, 85, 63, 47, 74, 100, 94} e n = 12, temos:

x=

xi
i=1

87 + 42 + 64 + 58 + 90 + 90 + 85 + 63 + 47 + 74 + 100 + 94 = 74, 5 12

A nota mdia na prova de matemtica dos estudantes da 7 srie dessa escola de So Paulo, por amostragem, 74,5. Observao So as propriedades que a mdia aritmtica simples possui que a fazem a medida de tendncia central mais usada e mais importante de todas. So propriedades da mdia aritmtica: em um conjunto de dados, sempre possvel o clculo da mdia, independentemente de quais elementos compem esse conjunto de dados; em um determinado conjunto de dados, o valor da mdia ser nico e corresponder a uma constante; todos os valores de determinado conjunto de dados iro afetar a mdia, se um valor se modifica, a mdia aritmtica tambm se modificar; somando-se ou subtraindo-se uma determinada constante c a cada elemento de um determinado conjunto de dados xi = x1, x2, x3, ..., xn, a mdia 28

Estatstica Aplicada
aritmtica ficar aumentada ou diminuda dessa constante c; se, por outro lado, multiplicarmos cada elemento desse conjunto de dados por uma constante c, a nova mdia ser tambm multiplicada por essa constante c; se dividirmos cada elemento do conjunto de dados por essa mesma constante c, a mdia ser dividida por c. Assim, se temos um conjunto xi = x1, x2, x2, ..., xn, a mdia ser:

x1 =

x1 , logo:
i=1 n

x2 =

(c + x i )
i=1

x2 =

xi
i=1

nc x2 = x1 + c n

a soma algbrica dos desvios dos nmeros de um conjunto de dados em torno da mdia zero, isso pode ser representado da seguinte forma:

xi x = 0
Por exemplo, se temos um conjunto de dados xi = (2, 4, 6, 8, 10), onde n = 5, temos que:

x=

xi
i=1

2 + 4 + 6 + 8 + 10 =6 5

Se aplicarmos a frmula acima, temos:

xi x = xi 6 = (2 6) + (4 6) + (6 6) + (8 6) + (10 6) xi x = 4 2 + 0 + 2 + 4 xi x = 0
Observao A mdia aritmtica a mais utilizada em nosso dia a dia. obtida dividindo-se a soma das observaes pelo nmero delas.
3.2 A mdia aritmtica ponderada xp

Num conjunto de dados em que cada elemento ou cada observao possui a mesma importncia, o clculo da mdia aritmtica simples mostrar bem a populao ou a amostra estudada. No entanto, se queremos atribuir pesos distintos ou importncias distintas aos elementos de um 29

Unidade I
conjunto de dados, a estatstica a ser adotada a mdia aritmtica ponderada, em que a cada valor xi dever ser atribudo um determinado peso pi. A expresso estatstica para o clculo da mdia ponderada :

xp =

xipi
i=1 n

pi
i=1

Supondo que um estudante tenha de efetuar uma srie de quatro exames para obter sua mdia final e passar de ano, cada exame possui um peso diferente na composio dessa mdia, conforme a tabela a seguir:
Exame
1 2 3 4

Nota
68 89 45 100

Peso
0,30 0,20 0,40 0,10 1,00

xp =

xipi
i=1 n

, logo

pi
i=1

(0, 30)68 + (0,20)89 + (0, 40)45 + 0,10(100) xp = 0, 30 + 0,20 + 0, 40 + 0,10 xp = 20, 4 + 17,8 + 18 + 10 = 66,2 Figura 14

A nota mdia ser, ento, 66,2, resultado diferente do que seria obtido se utilizssemos a mdia aritmtica simples. Num conjunto de dados, em que cada elemento ou cada observao possui importncia diferente, utilizamos a mdia aritmtica ponderada. Exemplificando as mdias aritmtica e ponderada: Mdia aritmtica exemplo: um aluno tirou as notas 5, 8 e 6 em trs provas. A sua mdia aritmtica ser (5 + 8 + 6)/3 = 7,25. Mdia ponderada exemplo: um aluno fez um teste (peso 1) e duas provas prova (peso 2), tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua mdia (ponderada) ser [(1 x 8) + (2 x 5) + (2 x 6) ]/3 = 6. Se o teste e a prova tivessem o mesmo peso (e no importa qual o valor do peso, importa apenas a relao entre os pesos), a mdia seria, aproximadamente, 6,33. Distribuio por frequncia a tabela em que se organizam grandes quantidades de dados, determinando o nmero de vezes que cada dado ocorre frequncia (fi) e a porcentagem com que aparece frequncia relativa (fr). 30

Estatstica Aplicada

Observao fi = n nmero total de observaes; xi = valor da varivel ou pontos mdios de classes; k = nmero de classes ou de valores individuais diferente da varivel. Exemplo: em uma turma, a nota atribuda a 30 alunos, referente a um teste de estatstica, foi disposta em ordem crescente: 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10. Observando que algumas notas se repetem, podemos utilizar o nmero de observaes ou frequncia de cada um deles como o peso ou fator de ponderao. Assim: (4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10) x = = 6,29 4+7+5+5+4+2+1 Utilizando uma tabela para representar a distribuio de frequncia, temos: Tabela 5
xi 4 5 6 7 8 9 10 fi 4 7 5 5 4 2 1 28 xi fi 4x4 = 16 5 x 7 = 35 6 x 5 = 30 7 x 5 = 35 8 x 4 = 32 9 x 2 = 18 10 x 1 = 10 176

xi fi 176 x = = = 6,29 n 28

3.3 A mediana (Md)

Outra medida importante de um conjunto de dados a mediana. A mediana divide determinado conjunto de dados que dever estar ordenado em dois grupos iguais, em que metade ter valores menores, e metade ter valores maiores que a mediana. Antes de calcular a mediana, preciso organizar os valores num rol em ordem crescente, para ento contar at a metade dos valores e encontrar a mediana. Em geral, aps organizarmos os dados em um rol, podemos calcular a posio da mediana com a frmula a seguir: 31

Unidade I
(n+1) Md = 2 Em que n o nmero de dados observados. Por exemplo, para um conjunto de dados xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13, temos primeiro que organizar esses dados em um rol e depois encontrar a posio da mediana para ento saber qual ser a mediana. Seno, vejamos: rolxi - {1, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9} (n+1) 13+1 Md = -= = 7 2 2 Md = 5 A mediana outra medida de posio definida como o nmero do meio, quando as medidas so organizadas em ordem ascendente ou descendente. Em outras palavras, a mediana de um conjunto de termos ordenados o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. Observao Se o nmero de elementos for mpar, ento a mediana ser exatamente o valor do meio. Se o nmero de elementos for par, ento a mediana ser exatamente a mdia dos dois valores do meio. Para determinar a mediana: organize o conjunto de dados em um rol; para um conjunto de dados cujo n = mpar, a mediana ser o valor do meio; para um conjunto de dados cujo n = par, a mediana ser a mdia dos dois valores do meio. Para um conjunto de dados xi = {6, 4, 8, 3, 2, 9, 7, 1}, em que n = 8, temos, ento: rolxi = {1, 2, 3, 4, 6, 7, 8, 9} (n+1) 8+1 Posio mediana = -= = 4,5 2 2 A mediana ser o valor que est a meio caminho dos dois valores mdios; nesse caso, entre 4 e 6. Como fazer? Deve-se tirar a mdia entre os dois valores do meio para obter o valor da mediana. 32

Estatstica Aplicada
Assim, temos: 4 + 6 Md = = 5 2 Observao Quando usamos a mediana? Empregamos a mediana quando: desejamos obter o ponto que divide a distribuio em partes iguais; h valores extremos que afetam de maneira acentuada a mdia; a varivel em estudo salrio. Em teoria da probabilidade e em estatstica, a mediana uma medida de tendncia central, um nmero que representa as observaes de determinada varivel, de tal forma que esse nmero, a mediana, de um grupo de dados ordenados, separa a metade inferior da amostra, populao ou probabilidade de distribuio, da metade superior. Mais concretamente, 1/2 da populao ter valores inferiores ou iguais mediana, e 1/2 da populao ter valores superiores ou iguais mediana. n + 1 . Em casos de populaes (n) mpares, a mediana ser o elemento de posio central 2 Para os casos de populaes (n) pares, a mediana ser o resultado da mdia simples dos elementos n n + 1 de posio central e . Por exemplo, para as seguintes sries, temos: 2 2 Exemplo 1 1, 3, 5, 7, 9, o n da srie mpar, temos: n + 1 2 5 + 1 2 3 posio A mediana igual a 5, pois a 3 posio da srie.

33

Unidade I
Exemplo 2 1, 2, 4, 7, 9, 10, o n da srie par, temos: n n + 1 e 2 2 6 n + 1 e 3 2 3ee4 4 3 A mdia ser a mdia entre o 3 e o 4 elemento da srie, que ser: 3 = 4 4 = 7 4 + 7 Md = 2 Md = 5,5 5, 5 Md
3.4 A moda

Muitas vezes, em um conjunto de dados, existem valores que se repetem com frequncia maior. A moda justamente esse valor ou esses valores que mais se repetem em um conjunto de dados. possvel haver estatsticas que no possuam moda ou que possuam mais de uma moda. No exemplo que demos anteriormente, para um conjunto de dados xi = {1, 2, 3, 4, 6, 7, 8, 9}, no existe moda, e diz-se que o conjunto ou distribuio amodal. A moda uma estatstica muito mais descritiva e sua importncia cresce medida que um valor ou grupo de valores se repete mais que outros, e nesse sentido a moda indicaria o valor tpico daquele conjunto de dados com maior ocorrncia. Por exemplo, o conjunto de dados xi = {2, 2, 7, 9, 9, 9, 10, 10, 11, 12, 18} tem moda igual a 9, porque o nmero 9 aquele com maior frequncia, repetindo-se trs vezes. Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maior frequncia em uma srie. Por exemplo: o salrio modal dos professores de uma escola o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregados dessa escola. A moda pode apresentar mais de um valor, diferentemente da mdia ou da mediana. especialmente til quando os valores ou observaes no so numricos, uma vez que a mdia e a mediana podem no ser bem definidas. A moda de {pera, pera, banana, limo, limo, limo, pssego} limo. 34

Estatstica Aplicada
A srie {1, 3, 4, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6. A srie {1, 3, 2, 5, 8, 7, 4, 9} no apresenta moda. Exemplo Sabendo-se que a produo leiteira diria de uma vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, pede-se que se encontre a mdia, a moda e a mediana para a produo diria de leite dessa vaca. Mdia

x=

xi
i=1

10 + 14 + 13 + 15 + 16 + 18 + 12 98 = = 14 7 7

Logo, x = 14 litros de leite em mdia por dia, o que significa uma produo de 98 litros de leite em mdia por semana. Observao A mdia pode ser um nmero diferente de todos os valores da amostra que ela representa. Moda Como no possui um valor que aparece com maior frequncia que os outros, no h valor de moda para esse exemplo. Mediana Ordenando os dados de forma crescente, temos: 10 - 12 - 13 - 14 - 15 16 18 n + 1 Md = 2 7 + 1 Md = 2 Md = 4 Mediana ser o 4 elemento da srie, que igual a 14 litros de leite por dia.

35

Unidade I

Observao Cada frequncia acumulada a soma das frequncias anteriores classe. f1a = f1 f2a = f1a + f2 f3a = f2a + f3 f4a = f3a + f4 ........... fna = f(n-1)a + fn
3.5 Posio relativa da mdia, moda e mediana

Em uma distribuio de frequncias simtricas, as medidas de mdia, mediana e moda coincidem. J quando a assimetria torna-se diferente, essa diferena tanto maior quanto a assimetria. Resumidamente, temos:
(a) (b) (c)

x = Md = Mo

Mo Md x Figura 15 - Distribuies: (a) simtrica, (b) assimtrica e (c) assimtrica negativa.

x Md Mo

a) x = xmd = Mo curva simtrica b) Mo< xmd < x curva assimtrica positiva c) x < xmd < Mo curva assimtrica negativa
4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES

Observamos que a moda, a mediana, e a mdia podem ser usadas para condensar, num nico nmero, aquilo que mdio ou tpico de um conjunto de dados. No entanto, a informao fornecida pelas medidas de posio necessita, em geral, ser complementada pelas medidas de disperso. Essas medidas so usadas para indicar o quanto os dados se apresentam dispersos em torno da regio central. Dessa forma, caracterizam o grau de variao existente no conjunto de valores. As medidas de disperso mais utilizadas so: amplitude total; 36

Estatstica Aplicada
desvio padro; varincia; coeficiente de variao. Note que, quanto maiores forem as medidas de disperso, mais heterogneos so os dados e, ao contrrio, quanto menores forem essas medidas, mais homogneo o conjunto. Vejamos a seguir alguns exemplos que mostram a necessidade de conhecermos as medidas de disperso. Exemplo 1 Sabe-se que em Honolulu (Hava) e em Houston (Texas) a temperatura mdia diria quase a mesma, em torno de 23,9 C. Pergunta-se: ser que, por isso, podemos inferir que a temperatura seja basicamente a mesma em ambas as localidades? Ou no ser possvel que, enquanto uma cidade melhor para natao, a outra o seja para atividades externas? A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral, entre 21,1 C e 26,7 C. Por outro lado, a temperatura em Houston pode diferir sazonalmente (nas estaes do ano), isto , apresentar-se baixa em janeiro (cerca de 4,4 C) e alta em julho e agosto (bem perto de 37,8 C). Logo, podemos perceber uma oscilao significativa. Desnecessrio dizer que as praias em Houston no esto cheias de gente o ano todo. Exemplo 2 Suponha que, numa particular cidade, tanto ladres quanto professores secundrios tenham uma renda mdia mensal de R$ 900,00. Ser que essa informao indica que as duas distribuies de renda so, necessariamente, semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem, e muito, num outro aspecto importante, que o fato de as rendas dos professores concentrarem-se ao redor de R$ 900,00 (serem constantes, homogneas), enquanto as dos ladres espalham-se mais (so descontnuas, heterogneas), o que reflete, portanto, maiores oportunidades para prises, desemprego, pobreza e, em alguns casos, fortunas excepcionais. Os fatos mostram que precisamos, alm de uma medida de tendncia central, de um ndice que sinalize o grau de disperso dos dados em torno da mdia. Esse ndice uma medida indicativa do que costumamos chamar de variabilidade ou disperso. Retornando ao exemplo 1, poderamos concluir que a distribuio de temperatura em Houston (Texas) tem maior variabilidade do que a distribuio de temperaturas em Honolulu (Hava). Da mesma forma, podemos dizer que a distribuio de rendas entre professores apresenta menos variabilidade do que a distribuio de rendas entre ladres. Assim, quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessrio dispor no apenas de informaes relativas s medidas de posio. preciso 37

Unidade I
que se disponha de informaes relativas variabilidade (disperso) daqueles nmeros que compem o referido conjunto de dados. Essas medidas de variabilidade ou disperso indicam se os dados observados esto prximos ou separados uns dos outros. Diferente das medidas de posio, as medidas de disperso no so autoexplicativas, sua aplicabilidade depende da comparao de populaes ou de amostras do mesmo tamanho e da mesma caracterstica para que se obtenha alguma informao importante a partir daquela determinada variabilidade. As principais medidas de disperso so: a amplitude total (ou intervalo), o desvio mdio, a varincia e o desvio padro. A mdia serve de referncia para todas essas medidas, exceto para o intervalo (ou amplitude total). proporo que essas medidas se elevam, isso representa um aumento da disperso, o que significa que, se a medida for igual a zero, no existe disperso. As medidas de variabilidade, que tm a mdia aritmtica como ponto de referncia, so importantes porque nos permitem avaliar o grau de disperso das observaes em relao a essa mesma mdia, isto , permitem-nos avaliar o quo distante os dados de um determinado grupo de observaes esto da mdia calculada, dando-nos uma noo mais precisa da situao de determinada populao ou amostra, alm de condies de tirar concluses e informaes importantes daqueles dados disponveis. Exemplo 3 Um estudante de economia resolve fazer uma pesquisa sobre os salrios mdios dos funcionrios de determinado setor industrial em So Paulo. Nessa pesquisa, esse estudante conseguiu os seguintes dados em termos de salrios mnimos mensais: xi = {1.0; 1.5; 2.0; 2.0; 2.0; 2.5; 3.0; 3.0; 80.0; 85.0} Ao calcular o salrio mdio desse setor, ele chegou ao valor mdio de 18,2 salrios mnimos por ms. Ora, mas esse dado, sem o clculo de sua disperso em relao mdia aritmtica, pouco nos diz sobre a realidade dessa populao, e acabamos por ter uma viso distorcida do padro de vida da maior parte dos funcionrios desse setor analisado pelo estudante. As medidas de variabilidade ou disperso nos permitem perceber essa distoro. Temos, como principais medidas de disperso, intervalo, desvio mdio, varincia e desvio padro. As medidas mais comuns de variabilidade para dados quantitativos so a varincia; a sua raiz quadrada e o desvio padro. A amplitude total, a distncia interquartlica e o desvio absoluto so mais alguns exemplos de medidas de disperso.
4.1 Amplitude total

O intervalo ou amplitude total de determinado conjunto de dados obtido pela diferena entre o maior e o menor valor nesse conjunto de nmeros. Indica, portanto, a distncia entre a maior e a menor observao de um conjunto de dados. Assim, temos: 38

Estatstica Aplicada
Amplitudetotal = Valormximo - Valormnimo Por exemplo, num conjunto de dados xi = {2, 3, 3, 5, 5, 5, 8, 10, 12}, em que n = 9, a amplitude total ser: Atotal = Vmximo - Vmnimo = 12 - 2 = 10 Em alguns casos, o intervalo ou amplitude total pode ser expresso simplesmente pela indicao do menor e do maior nmero do conjunto de dados. No caso do exemplo anterior, a amplitude total poderia ser expressa simplesmente pela identificao do menor e do maior nmero, indicada como sendo de (2 a 12) ou (2 12). A grande vantagem da amplitude total que ela apresenta certa facilidade de ser calculada, mesmo quando o conjunto de dados observados relativamente grande. No entanto, como a amplitude total apenas leva em conta os dois extremos do conjunto de nmeros, em alguns casos ela pode ser uma medida enganosa quanto indicao da disperso de um conjunto de nmeros, tendo, portanto, uma utilidade limitada. O intervalo de determinado conjunto de dados obtido pela diferena entre o maior e o menor valor nesse conjunto de nmeros.
4.2 Desvio mdio absoluto

O desvio mdio absoluto inaugura o estudo das medidas de variabilidade que tm a mdia como ponto de referncia. O chamado desvio nada mais que a diferena entre cada valor de determinado conjunto de dados e a mdia desse mesmo conjunto de nmeros (xi - x). O valor absoluto de um nmero ser ele prprio, sem o sinal que lhe associado, e indicado por meio de duas linhas verticais que o enquadram. Assim, |-67| = 67; |9| = 9. preciso calcular primeiro a mdia aritmtica dos dados disponveis, que em geral se apresentam como dados amostrais. O desvio mdio absoluto ser calculado pela mdia dos desvios dos valores a contar da mdia, ignorando o sinal (+ ou -) do desvio, ou seja, convertendo os valores dos desvios em valores absolutos, considerando-os todos desvios positivos. Assim, temos: Dmdio =

xi x
i=1

n 39

Unidade I
Em que n o nmero de observaes. Vamos, agora, tomar um exemplo de desvio mdio. Num conjunto de dados amostrais xi = {2, 4, 6, 8, 10, 12}, em que n = 6, determine o desvio mdio. Temos, ento: Dmdio = xi x n Precisamos, primeiro, calcular a mdia, para ento passarmos ao clculo do desvio mdio. Relembrando a frmula do clculo da mdia aritmtica, temos: x=

xi x = 2 + 4 + 6 + 8 + 10 + 12 = 7 x = 7
n 6

Agora, podemos calcular os desvios para cada valor do conjunto de dados. Assim, temos:
xi - x 27 47 67 87 10 7 12 7 -5 -3 -1 1 3 5 0 Figura 16 Dmdio =

xi x
n

5 + 3 + 1 + 1 + 3 + 5 6

Dmdio = 5 + 3 + 1 + 1 + 3 + 5 = 3 6 Dmdio = 3

O valor encontrado anteriormente representa a diferena mdia de cada observao e a mdia da distribuio, mas tambm nesse caso s seria possvel obter mais informaes a partir do desvio mdio comparando com outras populaes ou amostras de mesmas caractersticas. Por exemplo, se outro conjunto de dados, com as mesmas caractersticas e tamanho, apresentasse um desvio mdio absoluto igual a 2,4, ou seja, menor que o desvio mdio absoluto calculado no exemplo anterior, poder-se-ia dizer que esse segundo conjunto de valores mais homogneo do que o nosso exemplo, j que a diferena de cada um dos seus elementos em relao mdia aritmtica menor. Teramos, assim, uma disperso menor. O desvio que a diferena entre cada valor de determinado conjunto de dados a mdia desse mesmo conjunto de nmeros.
4.3 Varincia

Como no clculo do desvio mdio, para o clculo da varincia, precisaremos utilizar o desvio de cada elemento de um conjunto de dados em relao mdia aritmtica (xi - x). No entanto, ao invs de 40

Estatstica Aplicada
trabalharmos com os valores absolutos (em mdulo), agora os desvios so elevados ao quadrado antes da soma. Para o caso de dados amostrais, ao invs de dividirmos por n, dividimos por n 1 (que o total da amostra menos uma unidade). A varincia ir nos dizer o grau de disperso de determinado grupo de dados com relao mdia aritmtica desses nmeros. Assim, a varincia populacional poder ser calculada da seguinte forma: 2: Varincia populacional; xi: Cada observao do conjunto de dados populacional; : Mdia da populao; n: Nmero de observaes.

( xi )2 , onde = n

A varincia amostral poder ser calculada pela seguinte frmula: s2: Varincia da amostra; xi: Cada observao do conjunto amostral; x: Mdia da amostra; n: Nmero de observaes da amostra.

( xi x )2 , onde = n 1

Por exemplo, seja determinado conjunto de dados xi = {1, 3, 5, 7, 9, 11, 13}, em que n = 7. Calcule a varincia desse conjunto de dados, supondo: que esse conjunto de dados representa toda uma populao; que esse conjunto de dados representa uma amostra.
A) Para calcular a varincia desse conjunto de dados, considerando que ele representa toda uma

populao, devemos utilizar a seguinte frmula:


2

( xi )2 = n

Devemos passar ao clculo da mdia desse conjunto de dados para, ento, proceder ao clculo da varincia. Sendo assim, temos: =

n 1 + 3 + 5 + 7 + 9 + 11 + 13 = = 7 (mdia populacional) 7 =7 41

xi =

Unidade I
Partindo da mdia, podemos agora calcular os desvios e partir para o clculo da varincia populacional, j que supomos que o conjunto de dados representava toda a populao. Assim, temos:
7 7 7 7 7 7 7 xi - 71=6 73=4 75=2 77=0 79=-2 7 11 = - 4 7 13 = - 6 0 (xi - )2 62 42 2
2

2 = 2 =

(xi )2
N
2

0 (-2)2 (-4)2 (-6)2 112

6 + 42 + 22 + ( 2)2 + ( 4 )2 + ( 6)2 7 36 + 16 + 4 + 4 + 16 + 36 2 = 16 = 7 2 = 16

Figura 17

Desse modo, a varincia populacional desse conjunto de dados seria igual a 16.
B) Se, por outro lado, temos o mesmo conjunto de dados e supondo que ele representa apenas dados

amostrais, devemos calcular a varincia amostral de outra forma, partindo do clculo da mdia para, ento, calcularmos a varincia. Como vimos no item 2, a expresso para o clculo da mdia aritmtica em uma amostra a mesma do clculo da mdia para uma populao, mas utilizaremos para as amostras outra notao. Vejamos: n Normalmente, a mdia amostral aproxima-se da mdia populacional quanto maior o tamanho da amostra, mas no se iguala a ela. Passemos, ento, ao clculo da varincia amostral. Utilizaremos os mesmos passos do clculo da varincia populacional. Dessa forma: s2 = x=

xi x = 7 (mdia amostral).

(xi x)2
n 1
x 7 7 7 7 7 7 7 xi - x 71=6 73=4 75=2 77=0 79=-2 7 11 = - 4 7 13 = - 6 0 (xi - x)2 62 42 22 0 (-2)2 (-4)2 (-6)2 112 Figura 18 S
2

( xi x )2 = n 1

62 + 42 + 22 + ( 2)2 + ( 4 )2 + ( 6)2 S2 = 7 1 16 + 36 112 + 36 16 4 4 + + + = S2 = 7 1 6 S2 = 18,666...

42

Estatstica Aplicada
A varincia amostral desse conjunto de dados igual a 18,666. Como a mdia aritmtica, a varincia possui algumas propriedades importantes que devemos colocar em destaque e que facilitam o clculo de alguns problemas mais complexos.
A) Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de dados, o valor

da varincia no se altera. Por exemplo, um conjunto de dados xi = {2, 4, 6, 8}, em que n = 4, e a mdia igual a 5. A varincia desse conjunto ser dada como segue: ( xi )2 (2 5)2 + (4 5)2 + (6 5)2 + (8 5)2 2 = 2 = 4 n
2 2 2 3) + ( 1) + 12 + 32 9 + 1 + 1 + 9 20 ( = = =5 =

Se somarmos uma constante c = 4 a cada um dos elementos do conjunto de dados, temos um novo conjunto de dados yi = {6, 8, 10, 12}, em que a mdia ser igual a 9. A varincia ser, ento: 22 2 2

( yi 2 ) =
n

2 2 2 2 6 9) + (8 9) + (10 9) + (12 9) ( =

2 2 2 2 3) + ( 1) + (1) + (3) 9 + 1 + 1 + 9 20 ( = = = =5

Sendo assim, demonstramos que 2 = 2 2 =, ou seja, ao somarmos uma constante a cada elemento de um conjunto de dados, a varincia permanece a mesma.
B) Ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova

varincia ao multiplicarmos a varincia do conjunto de dados original por c2. Assim, a nova varincia ser representada da seguinte forma:
2 2 2 2 = c .1

C) Ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtemos a nova varincia dividindo-se a antiga varincia por c2. Assim, podemos apresentar a nova varincia da seguinte forma: c2 D) A varincia de uma constante igual a zero. 43 2 2=
2 1

Unidade I
Existe uma frmula alternativa e reduzida para o clculo da varincia populacional, deduzida da frmula original, que : n Para a varincia amostral, tambm existe uma frmula alternativa bastante utilizada que no exige o clculo da mdia e que decorre da frmula anterior: s2 x xi2 ( xi )2 = n 1 n
2

xi2 = 2

Lembrete Relembrando as propriedades de varincia: ao somarmos uma constante a cada elemento de um conjunto de dados, a varincia permanece a mesma; ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova varincia ao multiplicarmos a varincia do conjunto de dados original por c2; ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtm-se a nova varincia dividindo-se a antiga varincia por c2; varincia de uma constante igual a zero.

Saiba mais Para aprofundamento do tema desta unidade, seguem alguns links que podem auxili-lo: Mtodos quantitativos e estatsticos para a tomada de deciso. Disponvel em: <http://www.santahelena.ueg.br/posgraduacao/mba/2007/ download/metodosquantitativos/METODOS_QUANTITATIVOS_PARTE_I.pdf>. Acesso em: 25 jul. 2012. Estatstica exploratria. Disponvel em: <http://www.cin.ufpe.br/~psb/ EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>. Acesso em: 25 jul. 2012.

44

Estatstica Aplicada
4.4 Desvio padro

Obtm-se o desvio padro extraindo-se a raiz quadrada da varincia. Assim como a varincia e o desvio mdio, o desvio padro tambm representa uma medida de variabilidade absoluta, e indica o desvio de cada um dos nmeros xi de um dado conjunto de observaes em relao mdia . tambm chamado por alguns autores de desvio da raiz mdia quadrtica. Matematicamente, o desvio padro poder ser representado da seguinte forma: Desvio padro populacional Desvio padro amostral =

(xi )2
n

s =

(xi x)2
n 1

Por exemplo, um conjunto de dados amostrais xi = {2, 4, 6}, em que n = 3 e a mdia igual a 4. Vamos, ento, calcular o desvio padro para a amostra: s= s=

(xi x)2 =
n 1

(2 4 )2 + (4 4 )2 + (6 4 )2 = 3 1

( 2)2 + 0 + 22 8 = = 4 =2 2 2

Esse conjunto de dados ir apresentar um desvio padro igual a 2. As propriedades da varincia tambm so aplicveis ao desvio padro. No entanto, existem duas propriedades que sero distintas no caso do desvio padro por causa de sua caracterstica de raiz quadrada mdia positiva da varincia. Assim, ao multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo desvio padro ser igual ao antigo multiplicado pela constante. Temos, ento: 2 = c . 1 Por outro lado, se dividirmos cada elemento de um conjunto de dados por uma constante c, o novo desvio padro ser igual ao anterior dividido pela constante c. Assim, temos: 2 = 1 c

As demais propriedades da varincia sero as mesmas para o desvio padro.

45

Unidade I
4.5 Coeficiente de variao

Em estatstica descritiva, o coeficiente de variao serve para indicar se o desvio padro grande ou pequeno em relao mdia aritmtica da srie que est sendo estudada; portanto, uma comparao entre o desvio padro e a mdia aritmtica de uma pesquisa que vai determinar em porcentagem o quanto houve de desvio em relao mdia. O coeficiente de variao calculado por: s , onde: x S = desvio padro; Cv = x = mdia aritmtica, que pode ser de uma srie populacional ou amostral. Por exemplo, no item 3.4, foi determinado o desvio padro de uma srie amostral, portanto, vamos calcular o coeficiente de variao dessa srie, que ser: S x 2 Cv = 4 Cv = 0, 5 Cv = 50% Cv = Nesse exemplo, o coeficiente de variao grande, indica que a variabilidade foi a metade em relao mdia dessa srie. As propriedades da varincia se aplicam ao desvio padro, exceto: quando multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo desvio padro ser igual ao antigo multiplicado pela constante; quando dividirmos cada elemento de um conjunto de dados por uma constante c, o novo desvio padro ser igual ao anterior dividido pela constante c. Em probabilidade e estatstica, o desvio padro a medida mais usada da disperso estatstica. No seno como a raiz quadrada da varincia, ou, ainda, a raiz quadrada da mdia aritmtica dos quadrados dos desvios, tomados a partir da mdia aritmtica. definido dessa forma de modo a dar-nos uma medida da disperso que seja: um nmero que no seja negativo; use as mesmas unidades de medida que os nossos dados. 46

Estatstica Aplicada
Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel aleatria e o desvio padro s de um subconjunto em amostra. O termo desvio padro foi introduzido na estatstica por Karl Pearson, em seu livro Sobre a disseco de curvas de frequncia assimtricas, de 1894. Exemplo Utilizando-se o exemplo apresentado anteriormente, temos que a produo leiteira diria de uma vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio padro (S), a varincia (S2) e 5 o coeficiente de variao (CV). Soluo Amplitude R = 18 10 = 8 litros de leite, ou seja, a maior variao do nmero de litros de leite produzido por dia pela vaca de 8 litros. Observao Sabemos que a mdia para esses dados : x = 14 litros de leite por dia. Desvio padro

s=

( x1 x )
i=1

n 1

( x1 x )2 + ( x2 x )2 + ... + ( xn x )2
n 1

(10 14 )2 + (14 14 )2 + (13 14 )2 + (15 14 )2 + (16 14 )2 + (18 14 )2 + (12 14 )2


7 1

( 4 )2 + (0)2 + ( 1)2 + (1)2 + (2)2 + (4 )2 + ( 2)2 + =


6 7 2,65 litros de leite por semana Varincia S2 = (S)2 = (2,65)2 7 (litros de leite)2 Coeficiente de variao

16 + 0 + 1 + 1 + 4 + 16 + 4 42 = = 6 6

47

Unidade I
S 2, 65 = = 0,1893 ou seja, existe uma variabilidade de 18,93% dos dados em relao mdia. x 14

cv =

Saiba mais Dica de leitura: Anlise do risco na avaliao de projetos de investimentos: uma aplicao do mtodo de Monte Carlos. Disponvel em: <http://www. regeusp.com.br/arquivos/c6-Art7.pdf>. Acesso em: 18 jul. 2012.

Resumo Nesta unidade, vimos que a estatstica utiliza mtodos matemticos para solucionar problemas reais de tomada de deciso quando h incerteza. Em situaes nas quais poderamos contar unicamente com a sorte, temos um instrumento que nos possibilita aumentar as chances de tomar a melhor deciso. Utiliza ferramentas matemticas definidas e, mesmo lidando com grande nmero de dados, essas ferramentas resumem a anlise em tabelas ou grficos. Na prtica, a estatstica pode ser empregada como base conceitual e fundamental em vrias outras cincias, inclusive em anlises gerenciais. Foram apresentados tambm os clculos de medidas de tendncia central (mdia, mediana, moda), as quais so utilizadas para representar a srie pesquisada. Vimos que, por meio delas, podemos observar o comportamento da varivel que as originou, isto , nos d uma ideia da tendncia de todo um conjunto de dados. E, ainda, foram apresentadas de forma resumida as ideias de simetria e assimetria em funo das medidas de tendncia central. Foram abordadas questes a respeito da distribuio de frequncia e suas representaes grficas, estudo das medidas de disperso e variabilidade; e, por fim, foi apresentado um estudo de introduo ao clculo da probabilidade que nos ajuda a entender o significado de fenmenos aleatrios para o entendimento do que provvel e presumvel e ainda os vrios tipos de fenmenos em distribuio de probabilidade. 48

Estatstica Aplicada

Exerccios Questo 1 (ENEM/2011 adaptada). Uma equipe de especialistas do centro meteorolgico de uma cidade mediu a temperatura do ambiente, sempre no mesmo horrio, durante 15 dias intercalados, a partir do primeiro dia de um ms. Esse tipo de procedimento frequente, uma vez que os dados coletados servem de referncia para estudos e verificao de tendncias climticas ao longo dos meses e anos. As medies ocorridas nesse perodo esto indicadas a seguir:
Dia do ms Temperatura (em C) 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 15,5 14 13,5 18 19,5 20 13,5 13,5 18 20 18,5 13,5 21,5 20 16

Em relao temperatura, os valores da mdia, mediana e moda so, respectivamente, iguais a: A) 17oC, 17oC e 13,5oC. B) 17oC, 18oC e 13,5oC. C) 17oC, 13,5oC e 18oC. D) 17oC, 18oC e 21,5oC. E) 17oC, 13,5oC e 21,5oC Resposta correta: Alternativa B.

49

Unidade I
Anlise das alternativas Com os dados fornecidos, tem-se a seguinte tabela de frequncias:
xi fi 13,5 4 14 1 15,5 1 16 1 18 2 18,5 1 19,5 1 20 3 21,5 1

1) Para calcular a mdia tem-se:

X=

13, 5.4 + 14.1 + 15, 5.1 + 16.1 + 18.2 + 18, 5.2 + 19, 5.1 + 20.3 + 21, 5.1 255 = = 17 4 + 1+ 1+ 1+ 2 + 1+ 3 + 1 15

A mdia 17oC. 2) A mediana (valor do oitavo termo) 18oC. 3) A moda 13,5oC. Sendo assim, A) Alternativa incorreta. Justificativa: de acordo com os clculos. B) Alternativa correta. Justificativa: de acordo com os clculos. C) Alternativa incorreta. Justificativa: de acordo com os clculos. D) Alternativa incorreta. Justificativa: de acordo com os clculos. E) Alternativa incorreta. Justificativa: de acordo com os clculos. Questo 2 (ENEM/2011). A participao dos estudantes na Olimpada Brasileira de Matemtica das Escolas Pblicas (OBMEP) aumenta a cada ano. O quadro indica o percentual de medalhistas de ouro, por regio, nas edies da OBMEP de 2005 a 2009. 50

Estatstica Aplicada
Regio Norte Nordeste Centro-Oeste Sudeste Sul 2005 2% 18% 5% 55% 21% 2006 2% 19% 6% 61% 12% 2007 1% 21% 7% 58% 13% 2008 2% 15% 8% 66% 9% 2009 1% 19% 9% 60% 11%

Disponvel em: http://www.obmep.org.br. Acesso em: abr. 2010 (adaptado).

Em relao s edies de 2005 a 2009 da OBMEP, qual o percentual mdio de medalhistas de ouro da regio Nordeste? A) 14,6%. B) 18,2%. C) 18,4%. D) 19,0%. E) 21,0%. Resoluo desta questo na plataforma.

51