Você está na página 1de 133

Dossis Didticos

XIII a Estatstica Descritiva com Excel Complementos


LUSA CANTO E CASTRO LOURA MARIA EUGNIA GRAA MARTINS
Departamento de Estatstica e Investigao Operacional da Faculdade de Cincias da Universidade de Lisboa (Janeiro de 2009)

Verso atualizada para Excel 2010


MARIA EUGNIA GRAA MARTINS Outubro 2012

Estatstica Descritiva com Excel Complementos. Complementos

Nota Este dossi uma verso integral do dossi XIII - Estatstica Descritiva com Excel Complementos, em que se procedeu a uma atualizao dos procedimentos realizados em Excel 2003, 2 para Excel 2010. Aproveitou-se para atualizar o ficheiro que serve para exemplificar os conceitos e procedimentos, que agora constitudo pelos pelos dados dos deputados da XII legislatura, gislatura, a que demos o nome de DeputadosXII.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

1. Noes bsicas sobre amostragem


1.1- Introduo1
No uma ma tarefa simples definir o que a Estatstica. Por vezes define-se define se como sendo um conjunto de tcnicas de tratamento de dados, mas muito mais do que isso! A Estatstica uma "arte" e uma cincia que permite tirar concluses e de uma maneira geral fazer inferncias a partir de conjuntos de dados. At 1900, a Estatstica resumia-se resumia ao que hoje em dia se chama Estatstica Descritiva ou Anlise de Dados. Apesar de tudo, deu contribuies muito positivas em vrias reas cientficas. A necessidade de uma maior or formalizao nos mtodos utilizados, fez com que, nos anos seguintes, a Estatstica se desenvolvesse numa outra direco, nomeadamente no que diz respeito ao desenvolvimento de mtodos e tcnicas de Inferncia Estatstica. Assim, por volta de 1960 os textos xtos de Estatstica debruam-se debruam se especialmente sobre mtodos de estimao e de testes de hipteses, assumindo determinadas famlias de modelos, descurando os aspectos prticos da anlise dos dados. Porm, na ltima dcada, em grande parte devido s facilidades facilidades computacionais postas sua disposio, os Estatsticos tm-se tm se vindo a preocupar cada vez mais, com a necessidade de desenvolver mtodos de anlise e explorao dos dados, que dem uma maior importncia aos dados e que se traduz na seguinte frase "Devemos mos deixar os dados falar por si". Do que dissemos anteriormente, podemo-nos podemo nos aperceber que a Estatstica uma cincia que trata de dados e que num procedimento estatstico esto envolvidas duas fases importantes, nomeadamente a fase que diz respeito organizao or de dados - Anlise de Dados, e a fase em que se procura retirar concluses a partir dos dados, dando ainda informao de qual a confiana que devemos atribuir a essas concluses - Inferncia Estatstica. Existe, no entanto, uma fase pioneira, que diz respeito Produo ou Aquisio de Dados. Para realar a importncia desta fase consideremos, por analogia, o que se passa quando se pretende realizar um determinado cozinhado. Comea-se Comea por selecionar cionar os ingredientes, que sero depois manipulados de e acordo com determinada receita. O resultado do cozinhado pode ser desastroso, embora de aspeto to agradvel. Efetivamente Efetivamente se os ingredientes no estiverem em condies, resulta um prato de aspeto aspeto semelhante ao que se obteria com ingredientes bons, mas de sabor intragvel. O mesmo se passa com o procedimento estatstico. Se os dados no forem bons, embora se aplique a tcnica correcta, o resultado pode ser desastroso, na medida em que se pode ser levado e retirar concluses erradas.
1

Este captulo segue de perto o texto Introduo Probabilidade e Estatstica Com complementos de Excel, de Maria Eugnia Graa Martins, edio da Sociedade Portuguesa de Estatstica, 2005.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

Hoje em dia com a utilizao zao cada vez maior de dados nas mais variadas profisses e nas mais diversas situaes do dia a dia, torna-se torna se necessrio acompanhar este processo de uma cultura estatstica que cada vez mais abarque um maior nmero de pessoas, para que mais facilmente se consiga compreender o mundo que nos rodeia. Sendo a Estatstica a cincia que trata dos dados, gostaramos desde j de chamar a ateno para que fazer estatstica muito mais do que fazer clculos e manipular frmulas. Tambm no matemtica, embora utilize ilize a matemtica. Efectivamente, ao fazer estatstica trabalhamos com dados, que so mais do que nmeros! Como diz David Moore (1997) "Data are numbers, but they are not "just numbers". Data are numbers with a context. The number 10.5, for example, carri carries es no information by itself. But if we hear that a friend's new baby weighed 10.5 pounds at birth, we congratulate her on the healthy size of the child. The context engages our background knowledge and allows us to make judgements. We know that a baby weighing hing 10.5 pounds is quite large, and that it isn't possible for a human baby to weigh 10.5 ounces or 10.5 kilograms. The context makes the number informative". Da experincia que temos no dia a dia com os dados j conclumos, com certeza, que estes apresentam variabilidade. Por exemplo comum que um pacote de acar que na embalagem tenha escrito um quilograma, no pese exatamente exatamente um quilograma. Por outro lado ao pesar duas vezes o mesmo pacote possivelmente no obteremos o mesmo valor. Assim, ao dizermos que o peso do pacote um determinado valor, no podemos ter a certeza que esse valor seja correto. correto. Esta variabilidade est presente em todas as situaes do mundo que nos rodeia, pelo que as concluses que tiramos a partir dos dados que se nos apresentam, m, tm inerente um certo grau de incerteza. A Estatstica trata e estuda esta variabilidade apresentada pelos dados. Permite-nos Permite nos a partir dos dados retirar concluses, mas tambm exprimir o grau de confiana que devemos ter nessas concluses. precisamente precisament nesta particularidade que se manifesta toda a potencialidade da Estatstica. Podemos ento, e tal como refere David Moore em Perspectives on Contemporary Statistics, considerar trs grandes reas nesta cincia dos dados: 1. Aquisio de dados 2. Anlise dos dados 3. Inferncia a partir dos dados Neste captulo vamos abordar o primeiro tema considerado, ou seja o que diz respeito Aquisio de Dados, numa perspectiva de que pretendemos obter dados, a partir dos quais seria possvel responder a determinad determinadas as questes, isto , posteriormente retirar concluses para as Populaes a partir das quais esses dados so adquiridos contexto em que tem sentido fazer inferncia estatstica. Vamos assim, preocupar-nos preocupar nos em obter amostras representativas de Populaes que q se pretendem estudar.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

1.2 Aquisio de dados: sondagens e experimentaes. Populao e amostra. Parmetro e Estatstica.


O mundo que nos rodeia ser mais facilmente compreendido se puder ser quantificado. Em todas as reas do conhecimento necessrio necessrio saber o que medir e como medir. Na Estatstica ensina-se se a recolher dados vlidos, assim como a interpret interpret-los. Perante um conjunto de dados podem-se podem distinguir duas situaes: Aquela em que o estatstico confrontado com conjuntos de dados sem ter ter qualquer ideia preconcebida sobre o que que vai encontrar e ento procede a uma anlise exploratria de dados, quase sempre utilizando processos grficos, anlise esta que revelar aspectos do comportamento dos dados. Neste caso no se fala em amostra amostras, mas sim conjuntos de dados (Murteira, 1993) e de uma maneira geral a anlise exploratria suficiente para os fins que se tm em vista; Uma outra em que procede anlise de dados com propsitos bem definidos no sentido de responder a questes especficas. especficas. Neste caso os dados tm que ser produzidos ou adquiridos por meio de tcnicas adequadas de forma a que resultem dados vlidos (amostras representativas). Estas tcnicas, em que fundamental a interveno do acaso, revolucionaram e fizeram progredir a maior parte dos campos da cincia aplicada. Pode-se se dizer que hoje em dia no existe rea do conhecimento para cujo progresso no tenha contribudo a Estatstica.

Abordaremos de seguida algumas das tcnicas de aquisio de dados, , que se enquadram nesta ltima ltima situao, em que se distinguem as Sondagens e Experimentaes (aleatoriezadas) Gostaramos desde j de realar que o objectivo deste texto o de explorar, de uma forma simples, algumas das tcnicas de amostragem, com vista realizao de sondagens sondagens, situaes que se encontram de um modo geral nas Cincias Sociais, ao contrrio das Cincias experimentais, tais como Fsica ou Qumica, em que a recolha de dados se faz fundamentalmente recorrendo a experincias. Por exemplo, a populao constituda pelo pelos eleitores, a populao constituda pela contas sedeadas num banco, etc, que s contm um nmero finito de elementos, ao contrrio da Populao conceptual de respostas geradas por um processo qumico. No demais realar a importncia desta fase, a que chamamos de Produo ou Aquisio de Dados. Como referido em Tannenbaum (1998), pgina 426: Behind every statistical statement there is a story, and like a story it has a beginning, a middle, an end, and a moral. In this first statistics chapter we begin begin with the beginning, which in statistics typically means the process of gathering or collecting data. Data are the raw material of which statistical information is made, and in order to get good statistical information one needs good data.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

1.2.1 Sondagens. agens. Populao e amostra. Parmetro e Estatstica.


Estas noes, que j foram dadas num mdulo anterior, so aqui de novo apresentadas, unicamente com o objectivo de enquadrar o estudo seguinte, ou seja, o de introduzir algumas noes de Amostragem. O objectivo de uma sondagem o de recolher informao acerca de uma populao, seleccionando e observando um conjunto de elementos dessa populao. Sondagem Estudo estatstico de uma populao, feito atravs de uma amostra, destinado a estudar uma ou mais caractersticas aractersticas tais como elas se apresentam nessa populao. Por exemplo, numa fbrica de parafusos o departamento de controlo de qualidade pretende saber qual a percentagem de parafusos defeituosos. Tempo, custos e outros inconvenientes impedem a inspeco o de todos os parafusos. Assim, a informao pretendida ser obtida custa de uma parte do conjunto - amostra, mas com o objectivo de tirar concluses para o conjunto todo - populao. Se se observarem todos os elementos da populao tem tem-se um recenseamento. Por vezes confunde confunde-se se sondagem com amostragem. No entanto a amostragem diz respeito ao procedimento da recolha da amostra qualquer que seja o estudo estatstico que se pretenda fazer, pelo que a amostragem uma das fases das sondagens, j que estas devem vem incluir ainda o estudo dos dados recolhidos, assim como a elaborao do relatrio final. Popuao, unidade, amostra Populao o conjunto de objectos, indivduos ou resultados experimentais acerca do qual se pretende estudar alguma caracterstica comu comum. m. As Populaes podem ser finitas ou infinitas, existentes ou conceptuais. Aos elementos da populao chamamos unidades estatsticas. Amostra uma parte da populao que observada com o objectivo de obter informao para estudar a caracterstica prete pretendida. Geralmente, h algumas quantidades numricas acerca da populao que se pretendem conhecer. A essas quantidades chamamos parmetros. Por exemplo, ao estudar a populao constituda por todos os potenciais eleitores para as legislativas, dois parmetros ros que podem ter interesse so: - idade mdia dos potenciais eleitores que esto decididos a votar; - percentagem de eleitores que esto decididos a votar. Para conhecer aqueles parmetros, teria de se perguntar a cada eleitor a sua idade, assim como a sua inteno no que diz respeito a votar ou no. Esta tarefa seria impraticvel, nomeadamente por questes de tempo e de dinheiro. Os parmetros so estimados por estatsticas, que so nmeros calculados a partir dos dados que constituem a amostra. No caso do exemplo anterior, se se tivesse recolhido uma amostra de dimenso 1000, caracterstica populacional "percentagem de eleitores que esto decididos a votar" corresponde a caracterstica amostral "percentagem dos 1000

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

eleitores, que interrogados disseram disseram estar decididos a votar". Estas quantidades so conceptualmente distintas, pois enquanto a caracterstica populacional (parmetro) pode ser considerada um valor exacto, embora desconhecido, a caracterstica amostral (estatstica) conhecida, embora difira difi de amostra para amostra, , mas que todavia pode ser considerada uma estimativa til da caracterstica populacional respectiva. Um parmetro uma caracterstica numrica da populao, enquanto que a estatstica uma caracterstica numrica da amostra.

Populao Amostra

Parmetro

Estatstica

No entanto, para se poder utilizar as estatsticas, para estimar parmetros necessrio que as amostras sejam representativas das populaes de onde foram retiradas. Observao Anteriormente dissmos que uma estatstica um nmero calculado a partir dos dados da amostra, que se utiliza para estimar um parmetro. Como, de um modo geral, podemos recolher muitas amostras diferentes, embora da mesma dimenso, teremos muitas estatsticas diferentes, como estimativas do parmetro em estudo. Tantas as amostras as diferentes (2 amostras da amesma dimenso sero diferentes se diferirem pelo menos num dos elementos) que se puderem obter da populao, tantas as estimativas eventualmente diferentes que se podem calcular para o parmetro. Ento podemos considerar que todas estas estimativas so os valores observados de uma funo dos elementos da amostra, a que se d o nome de estimador. A esta funo tambm se d o nome de estatstica, utilizando-se se assim, indevidamente, o mesmo termo para a varivel e o valor observado da varivel. oportuno chamar a ateno para o seguinte: por vezes a Populao que se estuda, ou seja a Populao inquirida, no a objecto do estudo Populao alvo ou Populao objectivo. Por exemplo, se se pretende estudar a Populao constituda pelos indivduos adultos de nacionalidade portuguesa - Populao alvo, a Populao inquirida pode, no entanto, ser constituda pelos indivduos adultos de nacionalidade portuguesa e residentes no territrio portugus, data do inqurito. 1.2.1.1 Amostra a enviesada. Amostra aleatria e amostra no aleatria. Uma amostra que no seja representativa da Populao diz diz-se enviesada e a sua utilizao pode dar origem a interpretaes erradas, como se sugere nos seguintes exemplos:
utilizar uma amostra constituda constituda por 10 benfiquistas, para prever o vencedor do prximo Benfica-Sporting! Sporting!

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

utilizar uma amostra constituda por leitores de determinada revista especializada, para tirar concluses sobre a opinio da populao em geral.

Um processo de amostragem diz-se diz enviesado quando tende sistematicamente a seleccionar elementos de alguns segmentos da Populao, e a no seleccionar sistematicamente elementos de outros segmentos da Populao. Surge assim, a necessidade de fazer um planeamento da amostragem, onde se deci decide quais e como devem ser seleccionados os elementos da Populao, com o fim de serem observados, relativamente caracterstica de interesse. De um modo geral, o trabalho do Estatstico deve comear antes de os dados serem recolhidos. Deve planear o modo de os recolher, de forma a que, posteriormente, se possa extrair o mximo de informao relevante para o problema em estudo, ou seja para a populao de onde os dados foram recolhidos e de modo a que os resultados obtidos possam ser considerados vlidos. Vem V a propsito referir a seguinte frase de Fisher: "Ao pedir a um Estatstico que diagnostique dados j recolhidos, muitas vezes s se obtm uma autpsia". O planeamento de um estudo estatstico, que comea com a forma de seleccionar a amostra, deve ser feito eito de forma a evitar amostras enviesadas. Alguns processos que provocam quase sempre amostras enviesadas so, por exemplo, a amostragem por convenincia e a obteno de uma amostra por resposta voluntria. Este ltimo processo usado, com muita frequncia, ia, pelas estaes de televiso ou jornais, com resultados por vezes contraditrios com os que se obtm quando se utiliza um processo correcto (aleatrio) de seleccionar a amostra. A utilizao de uma amostragem por convenincia tambm se realiza frequente frequentemente, quando se selecciona a amostra a partir de uma listagem dos elementos de determinado clube ou grupo, como por exemplo a Ordem dos Engenheiros. A seguir apresentamos exemplos de ms amostras ou amostras enviesadas e resultado da sua aplicao: Amostra 1 - A SIC pretende saber qual a percentagem de pessoas que a favor da despenalizao do aborto. Para isso indicou dois nmeros de telefone, um dos quais para as respostas SIM e o outro para a resposta NO. Resultado - A utilizao da percentagem de respostas respostas positivas como indicao da percentagem da populao portuguesa que a favor da despenalizao do aborto enganadora. Efectivamente s uma pequena percentagem da populao responde a estas questes e de um modo geral tendem a ser pessoas com a mesma me opinio. Amostra 2 - Uma estao de televiso preparou um debate sobre o aumento de criminalidade, onde enfatizou o facto de ter aumentado o nmero de crimes violentos. Ao mesmo tempo, e inserida no mesmo programa, decorria uma sondagem de opinio sobr sobre se as pessoas eram a favor da implementao da pena de morte. Esta recolha de opinies era feita no molde descrito no exemplo anterior, isto , por resposta voluntria. Resultado - A utilizao da percentagem de SIMs, que naturalmente se espera elevada elevada, d uma indicao errada sobre a opinio da populao em geral. As pessoas influenciadas pelo debate e pelo medo da criminalidade sero levadas a telefonar dando indicao de estarem a favor da pena de morte.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

Amostra 3 Recolha de opinies de alguns leitores leitores de determinada revista tcnica, para representar as opinies dos portugueses em geral. Resultado - Diferentes tipos de pessoas lem diferentes tipos de revistas, pelo que a amostra no representativa da populao. Basta pensar que, de um modo geral, a populao feminina ainda no adere s revistas tcnicas como a populao masculina. A amostra daria unicamente indicaes sobre a populao constituda pelos leitores da tal revista. Amostra 4 Utilizao de alguns alunos de uma turma, para tirar concluses concluses sobre o aproveitamento de todos os alunos da escola. Resultado - Poderamos concluir que o aproveitamento dos alunos pior ou melhor do que na realidade . As turmas de uma escola no so todas homogneas, pelo que a amostra no representativa dos s alunos da escola. Poderia servir para tirar concluses sobre a populao constituda pelos alunos da turma. Amostra 5 - Utilizao dos jogadores de uma equipa de basquete de uma determinada escola para estudar as alturas dos alunos dessa escola. Resultado - O estudo concluiria que os estudantes so mais altos do que na realidade so. Os exemplos que apresentmos anteriormente so exemplos de amostras enviesadas porque tiveram a interveno do factor humano. . Com o objectivo de minimizar o enviesamento, no planeamento da escolha da amostra deve ter-se ter presente o princpio da aleatoriedade de forma a obter uma amostra aleatria. Amostra aleatria e amostra no aleatria Dada uma populao, uma amostra aleatria uma amostra tal que qualquer elemento da populao populao tem alguma probabilidade de ser seleccionado para a amostra. Numa amostra no aleatria, alguns elementos da populao podem no poder ser seleccionados para a amostra. Quando se pretende recolher uma amostra de dimenso n, de uma Populao de dimen dimenso N, podemos recorrer a vrios processos de amostragem. Como normalmente o objectivo , a partir das propriedades estudadas na amostra, inferir propriedades para a Populao, gostaramos de obter processos de amostragem que dem origem a bons estimador estimadores. Embora a classificao de um estimador como bom ou no, saia fora do mbito deste trabalho, podemos adiantar que essa anlise s pode ser efectuada se conseguirmos estabelecer um plano de amostragem que atribua a cada amostra seleccionada uma determinada probabilidade, e esta atribuio s pode ser feita com planos de amostragem aleatrios. Assim, importante termos sempre presente o princpio da aleatoriedade, quando vamos proceder a um estudo em que procuramos alargar para a Populao as propriedades es estudadas na amostra. Numa seco posterior apresentaremos tcnicas para obter amostras aleatrias.

Exerccios Populao e Amostra Identifique, no que se segue, Populao e Amostra:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

10

a) Numa determinada empresa, pretende-se pretende saber qual o salrio mdio dos seus empregados, pelo que se recolheu informao sobre os salrios mensais, auferidos pelos empregados dessa empresa; b) Prendia-se se saber a nota mdia obtida na prova global de Matemtica no ano lectivo 2000 20002001, dos alunos do 10 ano da Escola Secundria Secundria Prof. Herculano de Carvalho, pelo que se recolheu informao sobre as notas obtidas nessa disciplina por todos os alunos da Escola; c) Pretendia-se se averiguar a idade mdia dos alunos do 10 ano da Escola Secundria Prof. Herculano de Carvalho, pelo que ue se recolheu informao sobre a idade de 45 alunos do 10 ano dessa Escola; d) Pretendia-se se averiguar a quantidade de vinho produzida no Alentejo, no ano de 1999, pelo que se recolheu informao sobre as quantidades de vinho produzidas por 10 agricultores s da regio do Alentejo; e) Pretendia-se se estudar o salrio mdio auferido pelos trabalhadores da indstria txtil, pelo que se recolheu informao sobre os salrios mensais auferidos por 250 desses trabalhadores; f) Pretendia-se se averiguar a quantidade mens mensal al de batata consumida nos lares portugueses, pelo que se recolheu informao sobre as quantidades de batata consumidas mensalmente em 100 lares portugueses; g) Pretendia-se se estudar a eficcia de um medicamento novo para curar determinada doena, pelo que se seleccionaram 20 doentes padecendo dessa doena; h) Pretendia-se se averiguar o n de carros vendidos num dia por um stand de automveis, pelo que se investigou junto de por cada um dos 5 empregados desse stand, quantos carros tinha vendido; i) Pretendia-se e averiguar o nmero de leitores dos jornais dirios, pelo que se investigou junto de 6 jornais dirios, o nmero de leitores. j) Pretendia-se se averiguar a percentagem de raparigas que frequentam o tronco comum de Matemtica Aplicada da FCUL, pelo que se seleccionaram se 50 alunos do dito curso. Parmetro e Estatstica 1. Diga se so verdadeiras ou falsas as seguintes afirmaes: a) Uma estatstica um nmero que se calcula a partir da amostra;
b) Os parmetros utilizam-se se para estimar estatsticas; c) A mdia populacional um parmetro;

d) Um parmetro uma caracterstica numrica da varivel que se est a estudar na Populao. 2. Identifique cada uma das quantidades seguintes, a carregado, como parmetro ou estatstica: a) Nas ltimas eleies para a Associao Assoc de Estudantes da Escola, 67% dos estudantes que votaram, fizeram-no no na lista vencedora; b) Para obter uma estimativa do nmero de irmos dos alunos que frequentam o 4 ano de uma escola bsica, perguntou-se a 30 alunos, escolhidos ao acaso, quantos irmos rmos tinham. Verificou-se se que em mdia, tinham 1.5 irmos. c) Dos 230 deputados que compem a VIII legislatura, 21.3% so mulheres. d) Perguntou-se se a 80 deputados qual o partido que representavem, tendo-se tendo se concludo que 49% representavam o PS. e) Perguntou-se se a 10 deputados qual a sua idade, tendo-se tendo se concludo que a idade mdia era de 45 anos.
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

11

Amostras enviesadas e amostras aleatrias 1. (Adaptado de Rossman, 2001) Considere a Populao constituda pelos deputados da VIII legislatura, que se encontra em anexo. anexo. Seleccione 5 deputados de que j tenha ouvido falar. a) Estes deputados constituem uma amostra ou uma populao? b) Quantos deputados, nos 5 seleccionados, pertencem ao crculo eleitoral da sua residncia? c) Suponha que est interessada em estudar o n mdio de anos de servio dos deputados que constituem a VIII legislatura. Considera o conjunto de deputados seleccionados representativos da populao? Porqu? d) Se calculasse a mdia dos anos de servio dos deputados seleccionados esperava obter um valor lor superior ou inferior ao da mdia populacional? e) Se na sua aula ou outros colegas seleccionassem conjuntos de 5 deputados, pelo mesmo processo, isto , deputados que lhe sejam familiares, espera que a mdia dos anos de servio, tenha a mesma tendncia tendncia, , de sistematicamente exibir um enviesamento em determinado sentido? Explique. f) Se tivesse seleccionado pelo mesmo processo 10 deputados, obteria uma amostra mais representativa do que a constituda pelos 5 deputados? Explique.

*1.2.2 - Experimentaes
Enquanto que o objectivo de uma sondagem o de recolher informao acerca de uma populao seleccionando e observando uma amostra da populao tal qual ela se apresenta, pelo contrrio, uma experimentao impe um tratamento s unidades experimentais com o fim de observar a resposta. O princpio base de uma experimentao o mtodo da comparao, em que se comparam os resultados obtidos na varivel resposta de um grupo de tratamento com um grupo de controlo. Exemplo 1.2.2.1 (Moore, 1997) - Ser que a aspirina rina reduz o perigo de um ataque cardaco? O estudo conhecido por Physicians Health Study, foi uma experimentao mdica levada a cabo com o objectivo de responder a esta questo especfica. Metade de um grupo de 22000 mdicos (homens) foram escolhidos aleatoriamente aleatoriamente para tomar uma aspirina todos os dias. A outra metade dos mdicos tomou um placebo, que tinha o mesmo aspecto e sabor da aspirina. Depois de vrios anos 239 mdicos do grupo que tomou placebo, contra 139 do grupo que tomou aspirina, tiveram ataques ataques cardacos. Esta diferena suficientemente grande para evidenciar o efeito da aspirina na preveno dos ataques cardacos. Unidades experimentais, tratamento, varivel resposta, variveis explanatrias Unidades experimentais so os objectos sobre os quais incide a experimentao e a quem aplicado uma condio experimental especfica, a que chamamos tratamento. Varivel resposta a varivel cujo comportamento pretendemos estudar. As variveis explanatrias so as variveis que explicam ou causam mudanas mu na varivel resposta. No estudo considerado anteriormente temos: Unidades experimentais - 22000 mdicos Tratamentos - aspirina ou placebo
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

12

Varivel explanatria - se o indivduo tomou aspirina ou placebo Varivel resposta - se o indivduo teve ou no ataque cardaco.

Sem a comparao de tratamentos os resultados de experimentaes em medicina e em cincias do comportamento, duas reas onde estes mtodos so largamente utilizados, poderiam ser muito influenciados pela seleco dos indivduos, o efeito do placebo, etc. O resultado poderia vir enviesado. Um estudo no controlado de uma nova terapia mdica quase sempre enviesado no sentido de dar ao tratamento um maior sucesso do que ele tem na realidade (efeito placebo). Exemplo 1.2.2.2 (Moore, 1997) - Um tratamento utilizado durante vrios anos para tratar lceras do estmago consistia em pr o doente a aspirar, durante uma hora, uma soluo refrigerada que era bombeada para dentro de um balo. Segundo o Journal of the American Medical Association, uma experimentao levada a efeito com este tratamento permitiu concluir que o arrefecimento gstrico reduzia a secreo de cido, diminuindo a propenso para as lceras. No entanto, veio-se veio se a verificar mais tarde com um planeamento adequado, que a resposta dos s doentes ao tratamento foi influenciada pelo efeito placebo efeito confounding. O que acontece que h doentes que respondem favoravelmente a qualquer tratamento, mesmo que seja um placebo, possivelmente pela confiana que depositam no mdico e pelas expectativas xpectativas de cura que depositam no tratamento. Num planeamento adequado feito anos mais tarde, um grupo de doentes com lcera foi dividido em dois grupos, tratando-se se um com a soluo refrigerada e o outro grupo com um placebo, constitudo por uma soluo o temperatura ambiente. Os resultados desta experimentao permitiram concluir que dos 82 doentes sujeitos soluo refrigerada - grupo de tratamento, 34% apresentaram melhoras, enquanto que dos 78 doentes que receberam o placebo - grupo de controlo, 38% 38 apresentaram melhoras. Num planeamento experimental, uma vez identificadas as variveis e estabelecido o protocolo dos tratamentos, segue-se segue se uma segunda fase que consiste na atribuio de cada unidade experimental a um tratamento. Esta segunda fase deve ser regida pelo princpio da aleatoriedade. Este princpio tem como objectivo fazer com que os grupos que vo ser comparados, tenham partida constituio semelhante, de forma que as diferenas observadas na varivel resposta possam ser atribudas aos efeitos efeitos dos tratamentos. Assim, a atribuio de cada indivduo ao grupo de tratamento ou de controlo feita de forma aleatria. Combinando a comparao com a aleatoriedade, podemos esquematizar da seguinte forma o tipo de planeamento mais simples:
Tratamento Atribuio aleatria
Respostas ao tratamento 1

Grupo 1

Unidades experimentais

Comparao
Grupo 2
Respostas ao tratamento 2

Ao comparar parar os resultados temos de ter presente que haver sempre alguma diferena que se tem de atribuir ao facto de os grupos no serem perfeitamente idnticos e algumas

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

13

diferenas que se atribuem ao acaso. O que se pretende averiguar se as diferenas encontradas radas no sero "demasiado grandes" para que se possam atribuir a essas causas, ou seja, verificar se no tendo em linha de conta a diferena entre os tratamentos, a probabilidade de obter as diferenas observadas no seria extremamente pequena. Se efectivamente amente esta probabilidade for inferior a um determinado valor (de que falaremos mais tarde) dizemos que a diferena estatisticamente significativa, sendo de admitir que foi provocada pelos diferentes tratamentos. Convm ainda observar que numa experimentao experimentao os indivduos seleccionados para cada grupo no devem saber qual o tipo de tratamento a que esto a ser sujeitos, nem o investigador que est a conduzir a experimentao e a medir os resultados deve saber qual o tipo de tratamento que cada indivduo seguiu. seguiu. Temos o que se chama uma experimentao duplamente cega. Esta precauo uma forma de evitar o enviesamento, quer nas respostas, quer nas medies (um mdico ao observar o efeito de um tratamento que provoque, por exemplo, uma mancha vermelha na pele, pele, pode estar condicionado na interpretao da gravidade dessa mancha se souber qual o tratamento a que o doente foi sujeito). Em muitas situaes os investigadores tm de se cingir aos estudos observacionais, j que no possvel conduzir uma experimentao experimentao controlada. Por exemplo, para estudar o efeito do tabaco no cancro do pulmo, o investigador limita limita-se se a observar grupos de indivduos que fumam ou no, no podendo ser ele prprio a seleccionar um conjunto de indivduos e depois p-los aleatoriamente a fumar tabaco ou um placebo. No captulo seguinte abordaremos de forma introdutria o estudo de alguns planos de amostragem, j que um estudo conveniente do planeamento das experincias, assim como da definio da amostra adequada para o estudo em vista contm, por si s, matria suficiente para ser objecto de vrias disciplinas num curso de Estatstica, nomeadamente as disciplinas de Planeamento de Experincias e Amostragem.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

14

1.3 - Tcnicas de amostragem aleatria


Seguidamente apresentaremos alguns dos planeamentos mais utilizados para seleccionar amostras aleatrias. Dos vrios tipos de planeamento utilizados, destacam-se destacam se os que conduzem a amostras aleatrias simples, amostras aleatrias com reposio, amostras sistemticas e amostras estratificadas.

1.3.1 - Amostragem aleatria simples (sem reposio) e amostragem aleatria com reposio
O plano de amostragem aleatria mais bsico o que permite obter a amostra aleatria simples: Amostra aleatria simples - Dada uma populao, uma amostra aleatria simples de dimenso n um conjunto de n unidades da populao, tal que qualquer outro conjunto dos
N conjuntos diferentes de n unidades, teria igual probabilidade de ser seleccionado. n

Se uma populao tem dimenso N e se pretende uma amostra aleatria simples de dimenso n, esta amostra recolhida aleatoriamente de entre todas as =
n N

N! == n! (N - n)!

N(N - 1)(N - 2)...(N - n + 1) amostras distintas que se podem recolher da populao. Isto n(n - 1)(n - 2)...1

implica que cada amostra tenha a mesma probabilidade de ser selecionada selecionada. Uma
n

amostra destas pode ser escolhida sequencialmente da populao, escolhendo um elemento de cada vez, sem reposio, pelo que em cada seleco cada elemento tem a mesma probabilidade de ser seleccionado. Um esquema de amostragem aleatria simples, conduz a que cada elemento da Populao tenha a mesma probabilidade de ser seleccionado para a amostra. No entanto existem outros esquemas de amostragem em que cada elemento tem igual probabilidade lidade de ser seleccionado, sem que cada conjunto de n elementos tenha a mesma probabilidade de ser seleccionado. o que se passa com a amostragem aleatria sistemtica, de que falaremos adiante. Amostragem com reposio Na amostragem com reposio, sempr sempre e que um elemento seleccionado, ele reposto na populao, antes de seleccionar o seguinte, ao contrrio do que acontece na amostragem sem reposio. Intuitivamente conseguimos apercebermo apercebermo-nos nos de que se a dimenso da populao for grande, quando comparada comparada com a dimenso da amostra, estes dois tipos de amostragem podem ser considerados de certo modo equivalentes, j que a probabilidade de seleccionar o mesmo elemento duas vezes muito pequena. Dada uma populao de dimenso N, referir-nos-emos referir a uma amostra aleatria de dimenso n, com reposio, como um conjunto de n unidades da populao, tal que qualquer outro conjunto dos Nn conjuntos diferentes de n unidades, teria igual i probabilidade de ser selecionado. ionado. A probabilidade de cada uma das amostras ser s seleccionada igual a 1/Nn.
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

15

Exemplificamos a seguir um processo de obter uma amostra aleatria simples. Exemplo 1.3.1.1 - Consideremos a populao constituda pelos 18 alunos de uma turma do 10 ano de uma determinada Escola Secundria, em que a caract caracterstica erstica de interesse a estudar a altura mdia desses alunos. Uma maneira possvel de recolher desta populao uma amostra aleatria, seria escrever cada um dos indicadores (n. do aluno, nome, ) dos elementos da populao num quadrado de papel, inserir todos esses bocados de papel numa caixa e depois seleccionar tantos quantos a dimenso da amostra desejada. A recolha tem de ser feita sem reposio pois quando se retira um papel (elemento da populao), ele no reposto enquanto a amostra no estiver completa (com a dimenso desejada). Qualquer conjunto de nmeros recolhidos desta forma dar origem a uma amostra aleatria simples, constituda pelas alturas dos alunos seleccionados (desde que se tenha o cuidado de cortar os bocadinhos de papel todos do mesmo tamanho, para ficarem semelhantes, e de os baralhar convenientemente). A partir de cada amostra, pode pode-se calcular o valor da estatstica mdia, que ser uma estimativa do parmetro a estudar - valor mdio da altura dos alunos da turma. Obter-se-o Obter tantas ntas estimativas, quantas as amostras retiradas. Chama-se se a ateno para o facto de nesta altura no se poder dizer qual das estimativas "melhor", isto , qual delas uma melhor aproximao do parmetro a estimar, j que esse parmetro desconhecido (obviamente obviamente que nesta populao to pequena seria possvel estudar exaustivamente todos os seus elementos, no sendo necessrio recolher nenhuma amostra - este exemplo s serve para ilustrar uma situao)!

1.3.1.1 Nmeros aleatrios2


O processo que acabmos os de descrever no prtico se a populao a estudar tiver dimenso elevada. Neste caso, um dos processos de seleccionar uma amostra aleatria simples consiste em utilizar nmeros aleatrios. Estes eram fornecidos atravs de tabelas de dgitos aleatrios, , cuja utilizao j no se justifica pois, alm a dessass s tabelas existe a possibilidade de utilizar o computador para os gerar ou uma simples mquina de calcular. Este o processo mais utilizado hoje em dia, mas convm ter presente que os nmeros que se obtm so pseudo-aleatrios aleatrios, j que um mecanismo determinista que lhes d origem, embora se comportem como nmeros aleatrios (passam numa bateria de testes destinados a confirmar a sua aleatoriedade). No exemplo seguinte vamos utilizar o computador, mai mais precisamente o programa Excel, para fazer a seleco de uma amostra aleatria simples e de uma amostra aleatria com reposio. Antes de prosseguirmos, convm ter presente que: De um modo geral, quando falamos em nmeros aleatrios, sem qualquer outra referncia, ferncia, estamos a referir referir-nos a nmeros reais do intervalo [0, 1]. Os algoritmos de gerao de nmeros pseudo-aleatrios pseudo aleatrios esto concebidos de modo a que ao considerar uma qualquer sequncia de nmeros gerados se obtenha aproximadamente a mesma proporo de observaes em sub intervalos de igual amplitude do intervalo [0,1].
2

Esta seco foi alterada pois com a facilidade que temos, hoje em dia, de utilizar computadores ou mquinas de calcular, j no justifica a utilizao de tabelas de dgitos aleatrios.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

16

Assim, por exemplo, se se fizer correr o algoritmo 100 vezes, de esperar que caiam 25 dos nmeros gerados em cada quarto do intervalo [0,1]. No Excel, os nmeros pseudo-aleatrios aleatrios ( (no no intervalo [0,1]) so gerados utilizando a funo RAND(): Exemplo de 100 nmeros pseudo-aleatrios pseudo obtidos atravs da funo RAND() do Excel

Para contar quantos nmeros pertencem a cada intervalo, usamos a funo COUNTIF, do Excel:

Como se verifica da tabela anterior, 25 nmeros pertencem ao intervalo [0;0,25[, 24 ao intervalo [0,25;0,50[, 26 ao intervalo [0,50;0,75[ e 24 ao intervalo [0,75;1[. Quaisquer outros 100 nmeros, dariam outros valores para os intervalos. interval

1.3.1.2 - Utilizao do Excel para recolher uma amostra aleatria simples e uma amostra aleatria com reposio

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

17

No exemplo seguinte, apresentamos uma forma simples de utilizar o Excel para seleccionar uma amostra aleatria simples e uma amostra aleatria, aleatria, com reposio, de uma Populao finita, de que se tenha uma listagem dos elementos. Exemplo 1.3.1.2 Considere a populao constituda pelos 230 deputados da actual (XII) legislatura e que se encontra em Anexo. Para obter esta tabela fomos ao site da d Assembleia da Republica, onde est uma lista ordenada com o nome de todos os deputados (coluna B), o respectivo grupo parlamentar (coluna C) e o crculo eleitoral (coluna D). D) Consideramos uma coluna com identificao do sexo (coluna E). Este exemplo vai vai-nos servir para introduzir alguns conceitos importantes, pelo que fomos completar esta lista com a idade dos deputados, acedendo pgina de cada um e recolhendo a informao sobre a data de nascimento (coluna F). Nas situaes de interesse, que surgem na vida real, no se vai recolher a informao sobre determinada caracterstica, para a populao toda, mas unicamente para os elementos seleccionados para a amostra. Apresentamos a seguir uma pequena parcela desse ficheiro, a que chammos DeputadosXII. Este ficheiro tem uma primeira coluna (coluna A), onde indicado o nmero do deputado, quando estes esto ordenados por ordem alfabtica:

Como dissemos anteriormente, vamos utiliz utiliz-lo lo para trabalhar alguns conceitos importantes, tais como: 1. Obteno de uma amostra mostra aleatria simples e de uma amostra aleatria, com reposio, utilizando o Excel 2. Estatstica e parmetro 3. Variabilidade amostral 4. Preciso

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

18

1. Obteno de uma amostra aleatria simples e de uma amostra aleatria, com reposio, utilizando o Excel
Seguidamente vamos ver como seleccionar cionar uma amostra de 10 deputados da populao constituda pelos 230 deputados que constam no ficheiro DeputadosXII. Consideraremos os processos que conduzem a uma amostra aleatria aleat ia simples sem reposio e a uma amostra aleatria com reposio. Amostra aleatria simples 1 passo - Utilizando a funo RAND(), atribuir um nmero aleatrio, entre 0 e 1, a cada deputado. Para isso basta inserir a funo na clula J2 e replic-la replic la tantas vezes, quantos os deputados (ou seja, 230 vezes): es):

Para visualizar as frmulas na folha de Excel basta seleccionar na barra Formulas Show Formulas Conforme a imagem seguinte

Para esconder onder as colunas de C a I, seleccionar essas colunas, carregar com o boto direito do rato em qualquer posio da rea seleccionada, fazendo aparecer o menu da figura seguinte e escolher Hide.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

19

Na folha de Excel coluna B segue-se segue se a coluna J, dando indicao de que as colunas intermdias esto escondidas. Para mostrar as colunas escondidas, seleccionar as colunas adjacentes jacentes (neste caso a coluna B e a coluna J) e depois carregar com o boto direito do rato em qualquer posio da rea seleccionada, fazendo aparecer o menu onde se escolhe Unhide. Uma vez que a funo RAND() uma funo voltil, isto , muda quando se recalcula recalcula a folha, no caso de pretendermos ficar com os valores gerados seleccionar o boto Paste e fazer um Paste Special - Values, como se indica a seguir:

Colmos os valores na coluna K e fizmos o Save. Repare-se se que os valores que estavam inicialmente ente na coluna J foram alterados, dando origem a novos valores (devido ao facto da funo RAND() ser voltil, como referimos anteriormente); 2 passo Ordenar o ficheiro, utilizando como critrio a coluna K; 3 passo Como pretendemos uma amostra de dimenso dimenso 10, seleccionar os primeiros 10 deputados do ficheiro ordenado:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

20

Os deputados seleccionados foram os nmeros 87, 12, 195, 112, 82, 148,181, 153, 198 e 170. Nota: Embora os nmeros anteriores sejam referidos como aleatrios, convm ter presente que os s nmeros que se obtm so pseudo-aleatrios, j que um mecanismo determinista que lhes d origem. No entanto comportam comportam-se se como nmeros aleatrios (passam uma bateria de testes destinados a confirmar a sua aleatoriedade) e da a sua utilizao como tal.

Amostra aleatria com reposio


a) Utilize a funo RANDBETWEEN(m;n), para obter nmeros pseudo-aleatrios aleatrios entre m e n. Esta funo devolve um nmero pseudo pseudo-aleatrio aleatrio entre os limites especificados nos argumentos. Para ara simular a extraco de uma amostra aleatria a de dimenso 10, 10 da populao dos deputados, replicamos na coluna L, nas clulas L2:L11, a funo RANDBETWEEN(1;230):

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

21

Os deputados seleccionados foram os nmeros 3, 226, 143, 131, 158, 131, 214, 44, 129 e 134 (Repare-se se que houve um deputado que foi seleccionado 2 vezes, o que possvel uma vez que a seleco com reposio). Uma vez que a funo RANDBETWEEN uma funo voltil, procedemos como anteriormente com a funo RAND AND, e colmos os 10 valores obtidos, na coluna M:

b) Da tabela dos deputados, seleccionar o Nome e o Grupo rupo parlamentar dos deputados cujo nmero seja um dos elementos da amostra obtida anteriormente. Para seleccionar o nome e o grupo parlamentar dos deputados correspondentes aos 10 nmeros obtidos, vamos utilizar uma fun funo do Excel, a funo VLOOKUP, do seguinte modo:

Esta funo vai tabela dos deputados, constituda pelas clulas (A2:C231) seleccionar o nome (2 coluna da tabela seleccionada) e o Grupo Parlamentar (3 coluna da tabela seleccionada) correspondente ao nmero da coluna A que est na coluna M, obtendo obtendo-se a seguinte amostra:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

22

2. Parmetro e Estatstica.
Como sabemos o parmetro uma caracterstica numrica da populao, enquanto que a estatstica uma caracterstica numrica da amostra. Os parmetros so o normalmente desconhecidos e so estimados pelas estatsticas. No nosso caso, o parmetro Percentagem de deputados do PSD na populao, poderia ser estimado pela estatstica Percentagem de deputados do PSD na amostra, mas no necessitamos de recorrer a uma estimativa, uma vez que podemos calcular o valor do parmetro (esta situao no a normalmente verificada em Estatstica...). c) Calcule a percentagem de deputados do PSD na populao e na amostra
Vamos comear por utilizar a funo COUNTIF, que inserimos nserimos na clula P2, e que conta o n de clulas, de entre um conjunto especificado de clulas, que satisfazem determinado critrio, sendo este critrio, no caso presente, o de serem iguais a PSD:

O valor devolvido pela funo COUNTIF(C2:C231; PSD) foi 108, pelo que o valor do parmetro em estudo 47% (=
108 *100%) (Ver clula Q2 da figura seguinte). 230

Caso no fosse possvel obter o valor do parmetro, teramos calculado uma estimativa desse valor a partir da amostra de 10 elementos anteriormente seleccionados. Assim, uma

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

23

estimativa seria dada pelo n de deputados do PSD na amostra de 10 deputados/10, ou seja 50%

Para visualizar o valor obtido, em percentagem, basta seleccionar no menu o boto Number e a seleccionar %

3. Variabilidade amostral d) Repita 10 vezes o processo descrito nas alneas anteriores, de seleccionar 10 deputados e calcular a percentagem de deputados do PSD, e registe numa tabela os resultados obtidos. Germos 10 amostras e obtivmos os seguintes resultados para a estatstica - percentagem de deputados PSD, em cada uma das amostras: Amostra % PSD 1 40% 2 30% 3 50% 4 30% 5 50% 6 40% 7 60% 8 40% 9 60 60% 10 40%

Repare-se na variabilidade apresentada nos resultados obtidos para as diferentes amostras. Os 10 valores es obtidos para a percentagem de deputados do PSD existentes em cada uma delas, representam outras tantas estimativas para a verdadeira proporo de deputados
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

24

existentes na Populao. Iremos ilustrar esta variabilidade, representando os valores num diagrama a de pontos, utilizando uma opo grfica do Excel, o Scatter. Para obter a representao grfica pretendida, necessrio comear por construir uma tabela adequada:
Para construir esta tabela, pode-se se utilizar a seguinte metodologia: consideram-se se duas colunas, onde na primeira coluna se representam todos os elementos do conjunto de dados, pela ordem em que aparecem, e na segunda coluna indica-se se a frequncia absoluta com que cada elemento surge no conjunto de dados, medida que se vai percorrendo a coluna, de cima para baixo. Por exemplo, ao lado do primeiro elemento que o 60%, indicamos um 1, mas a segunda vez que aparece o 60%, indicamos um 2, etc. Se, partida, dispusessemos de uma tabela de frequncias, para construir esta nova tabela, abela, bastaria repetir cada elemento da amostra, tantas vezes quantas a sua frequncia absoluta.

Na folha do Excel, seleccionam-se as cluas que contm os dados (P13:Q22) e na barra menu selecionar Insert Scatter, 1 subtipo. Obtm-se o diagrama de pontos os com o seguinte aspecto:

Trabalhmos esteticamente esta representao, seguindo os seguintes passos: Com o grfico selecionado, selecionar: sele Legenda e carregar no boto Delete; As linhas e carregar no boto Delete; Layout Axes Primary Vertical Axis None; Layout Axis Titles Primary horizontal Axis Title Title Below Axis Escrever %; Temos finalmente a seguinte representao:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

25

Da representao grfica anterior comeamos a adivinhar que a distribuio das estimativas apresenta um padro com om uma certa simetria relativamente a um valor compreendido entre 40% e 50%. e) Considere agora 20 amostras de dimenso 10, calcule para cada uma o valor da estatstica em estudo, e construa o diagrama de pontos dos valores obtidos. Seleccionmos 20 amostras tras de dimenso 10, caculmos a percentagem de deputados do PSD em cada uma delas e com os resultados obtidos construmos a seguinte representao:

Esta representao mais elucidativa e refora a ideia avanada anteriormente, de que o valor do parmetro ro em estudo percentagem de deputados do PSD, se deve situar perto de 50%. Tendo em conta que a verdadeira percentagem de deputados deputados do PSD na populao 47%, %, apesar de o valor apresentado pela estatstica variar de amostra para amostra variabilidade amostral, estes valores apresentam uma distribuio que nos d informao sobre o parmetro, j que essa distribuio se localiza ou est centrada em torno do parmetro.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

26

4. Preciso f) Considere agora 20 amostras de dimenso 30, calcule para cada uma o valor da estatstica em estudo, e construa o diagrama de pontos dos valores obtidos. Compare a representao obtida, com a que obteve na alnea e). e) Seguimos um processo idntico ao da alnea e), com a particularidade de as dimenses das amostras terem dimenso nso 30, em vez de 10. Com as percentagens de deputados do PSD existentes em cada uma delas construmos a seguinte representao grfica:

Comparando as duas representaes obtidas quando se consideram amostras de dimenso 10 ou de dimenso 30, verificamo verificamos s que a variabilidade apresentada pelos valores da estatstica - percentagem de deputados do PSD, no caso das amostras de maior dimenso, inferior apresentada pela estatstica no caso das amostras de menor dimenso, como se v na figura seguinte:
Percentagem ntagem de deputados do PSD em amostras de dimenso 10 Percentagem de deputados do PSD em amostras de dimenso 30

A preciso de um estimador caracterizada pela variabilidade apresentada pelas diferentes estimativas, , obtidas quando se consideram diferentes amostras. Quanto menor for a variabilidade apresentada pelas diferentes estimativas, maior a preciso apresentada pelo estimador. De um modo geral, diz-se se que uma estatstica um bom estimador de um certo parmetro, metro, se a distribuio dos valores dessa estatstica, calculados para diversas amostras, revelar uma localizao em torno do parmetro e apresentar pequena variabilidade. Em alguns casos essa anlise pode fazer-se fazer do ponto de vista terico. No entanto, hoje oje em dia,

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

27

cada vez se recorre mais simulao para decidir se um estimador ou no, um bom estimador do parmetro de interesse. Observao: Este exemplo que acabmos de descrever tem como objectivo apresentar alguns conceitos importantes, como o da variabilidade variabilidade e das propriedades de um estimador. Efectivamente, neste caso, j que temos informao sobre o grupo parlamentar de cada deputado, no teria muito sentido ir recolher uma amostra para obter a percentagem de deputados em cada grupo parlamentar. Repare-se, se, no entanto, que se o que estivesse em estudo fosse ter uma ideia sobre o nmero mdio de filhos dos deputados portugueses e suas idades, j faria sentido recolher uma amostra, pois para obter a informao desejada no seria necessrio interrogar gar todos os deputados e s se interrogariam os seleccionados para a amostra. 1.3.2 - Amostragem aleatria sistemtica Na prtica o processo de seleccionar uma amostra aleatria simples de uma populao com grande dimenso, no to simples como o descrito descrito anteriormente. Se a dimenso da populao for grande o processo torna-se torna se muito trabalhoso. Ento uma alternativa considerar uma amostra aleatria sistemtica os elementos so escolhidos de uma maneira regular percorrendo a lista. Amostra aleatria sistemtica Dada uma populao de dimenso N, ordenada por algum critrio, se se pretende uma amostra de dimenso n, escolhe-se escolhe se aleatoriamente um elemento de entre os k primeiros, onde k a parte inteira do quociente N/n. A partir desse elemento escolhido, o, escolhem-se escolhem todos os k-simos simos elementos da populao para pertencerem amostra. A amostra aleatria sistemtica no uma amostra aleatria simples, j que nem todas as amostras possveis de dimenso n, tm a mesma probabilidade de serem seleccionadas. 1.3.2.1 - Utilizao do Excel para recolher uma amostra aleatria sistemtica No exemplo seguinte, apresentamos uma forma simples de utilizar o Excel para seleccionar uma amostra aleatria sistemtica de uma Populao finita, de que se tenha uma listagem dos elementos. Exemplo 1.3.2.1 Considere novamente o ficheiro DeputadosXII, que contm o nome, filiao partidria, sexo e data de nascimento dos 230 deputados da actual legislatura e que se encontra em Anexo. Utilizando o processo de amostragem sistemtica, sistemtica, obtenha uma amostra de 12 deputados, registando para cada um deles o sexo. Temos uma populao de dimenso 230 e pretendemos obter uma amostra de dimenso 12. Vamos utilizar a seguinte metodologia:
Passo 1 Dividindo 230 por 12 e retendo a parte inteira, inte obtm-se o valor 19. Passo 2 Dos primeiros 19 elementos da lista ordenada dos deputados, selecciona-se selecciona se um elemento ao acaso. Vimos na seco anterior que basta utilizar a funo Randbetween(1;19), que inserimos na clula T2. . A utilizao desta fun funo devolveu-nos o deputado nmero 15. . Passo 3 A amostra ser constituda pelos deputados nmeros 15, 1 34, 53, 72, 91, 110, 129, 148, 167, 186, , 205, 20 224, que obtivmos adicionando sucessivamente 19, at obtermos 12 elementos (clulas T2:T13).

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

28

Passo 4 - Utilizando a funo VLOOKUP(T2;$A$2:$E$231;5), replicada pelas 12 clulas U2:U13, obteve-se se finalmente a informao solicitada, constituda pelo sexo dos 12 deputados seleccionados para a amostra:

1.3.3 Amostragem estratificada Pode acontecer que a populao lao possa ser dividida em vrias subpopulaes ou estratos, mais ou menos homogneos, relativamente caracterstica a estudar. Nesta situao existe uma tcnica importante e apropriada, que a amostragem por estratificao. Apresentamos de seguida um exemplo xemplo em que privilegiaremos a exemplificao da tcnica, em detrimento da apresentao em Excel, uma vez que o tipo de amostragem utilizado, se resume a uma amostragem aleatria simples, j exemplificada anteriormente. Exemplo 1.3.3.1 (Ted Hodgson and John Jo Borkowski in Getting the Best from Teaching Statistics) Consideremos uma populao constituda por 40 cartes numerados (20 vermelhos e 20 pretos) de acordo com a seguinte tabela:
N Freq. Cor 6 4 Ver 7 4 Ver 8 4 Ver Ve 9 4 Ver 10 4 Ver 26 4 Preto 27 4 Preto 28 4 Preto 29 4 Preto 30 4 Preto

A mdia dos nmeros inscritos nesta populao de 40 cartes de 18 valor mdio da caracterstica populacional em estudo. Pretende-se, se, atravs de uma amostra, obter alguma indicao sobre a mdia dos nmeros inscritos itos nos cartes (a qual neste exemplo fictcio conhecida). Colocam-se Colocam se os cartes num saco e pede-se se a cada aluno da turma que retire uma amostra de 4 cartes amostra aleatria simples, e que calcule a mdia dos nmeros dos cartes seleccionados. Numa turma de 34 alunos, obtiveram-se os seguintes resultados:
Amostra n 1 2 3 4 5 6 7 8 9 26 10 29 6 6 9 7 9 9 7 26 6 8 9 8 7 9 8 10 9 7 9 8 7 30 10 8 6 6 10 29 30 29 9 26 30 Mdia 12,25 12,75 13 13 13,25 13,25 13,25 13,5 13,75

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

29

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

9 10 6 7 28 7 6 9 26 7 27 6 8 6 26 8 26 30 8 10 29 28 27 30 29

10 9 27 7 8 6 29 6 9 10 6 29 29 8 9 11 27 26 26 26 6 9 26 10 30

8 29 6 26 6 29 26 26 8 26 30 28 26 30 30 28 6 27 29 26 30 30 30 29 7

29 9 26 27 26 26 8 29 28 29 9 10 10 30 10 30 27 6 28 30 27 26 10 26 30

14 14,25 16,25 16,75 17 17 17,25 17,5 17,75 18 18 18,25 18,25 18,5 18,75 19,25 21,5 22,25 22,75 23 23 23,25 23,25 23,75 24

Esta distribuio no o nos ajuda muito a dizer qual a estimativa para o valor mdio da populao (mdia dos nmeros inscritos). Gostaramos de ter obtido para a amostra, cujos elementos so as diferentes mdias, uma distribuio com pouca variabilidade, para podermos argumentar r que a mdia destes elementos era uma boa estimativa para o parmetro em estudo, ou seja, o valor mdio dos nmeros inscritos nos cartes (Ver seco seguinte). Diz-se se ento aos alunos que estamos perante duas subpopulaes, a de cartes vermelhos e a de e cartes pretos, embora no seja esta a caracterstica em estudo e sobre a qual seria importante haver diferena entre os estratos ou subpopulaes. De qualquer modo aqueles so informados que poder haver diferenas relativamente caracterstica de inte interesse e que um processo de amostragem adequado levaria em conta essas diferenas. Procede-se se ento a uma seleco da amostra, de forma a obter 2 cartes vermelhos e 2 cartes pretos estes valores devem reflectir a dimenso dos estratos (que no nosso exemplo mplo so iguais). Os resultados obtidos foram os seguintes:
Amostra n 1 2 3 4 5 6 7 8 9 6 8 8 7 9 6 8 10 9 7 9 6 8 9 9 10 6 9 27 26 28 29 26 29 26 27 28 28 27 28 26 26 27 27 28 26 mdia 17 17,5 17,5 17,5 17,5 17,75 17,75 17,75 18

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

30

10 11 12 13 14 15

6 10 10 9 8 9

8 8 7 9 9 10

28 27 28 27 29 28

30 28 29 29 29 29

18 18,25 18,5 18,5 18,75 19

A partir dos dados obtidos para as amostras, confirma confirma-se se que efectivamente temos dois estratos distintos, relativamente caracterstica caracterst de interesse um estrato com cartes com nmeros mais pequenos e outro estrato com cartes com nmeros maiores. Estes resultados mostram que as mdias das amostras estratificadas esto consistentemente prximas do valor mdio da populao (o qual s deve deve ser dito aos alunos depois das simulaes serem feitas), podendo-se podendo se assim observar que a estratificao conduziu a um aumento da preciso. *1.3.4 Estimador centrado e no centrado. Preciso Uma vez escolhido um plano de amostragem aleatrio, ao pretendermos pretendermos estimar um parmetro, pode ser possvel utilizar vrias estatsticas (estimadores) diferentes. Por exemplo, quando pretendemos estudar a variabilidade presente numa Populao, que pode ser medida pela varincia populacional 2, sabemos que podemos a partir de uma amostra, obter duas estimativas diferentes para essa varincia, a partir das expresses

s =

(x i x) 2
i =1

n 1

ou

s =

(x
i =1
2

x) 2

n
2

Quais as razes que nos podem levar a preferir s em vez de s ? Um critrio que costuma ser er aplicado o de escolher um bom estimador como sendo aquele que centrado e que tem uma boa preciso. Escolhido um plano de amostragem, define-se: Estimador centrado Um estimador diz-se diz centrado quando a mdia das estimativas obtidas para todas as amostras possveis que se podem extrair da Populao, segundo o esquema considerado, coincide com o parmetro a estimar. Quando se tem um estimador centrado, tambm se diz que no enviesado. A mdia das estimativas calculadas a partir da expresso s acima ima considerada, coincide com a varincia .
2 2

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

31

Para se evitar o enviesamento, necessrio estarmos atentos, primeiro na escolha do plano de amostragem e depois na escolha do estimador utilizado para estimar o parmetro desconhecido. O facto de utilizarmos um estimador centrado, no nos previne contra con a obteno de ms estimativas, se o plano de amostragem utilizado sistematicamente favorecer uma parte da Populao (isto , fornecer amostras enviesadas). Preciso - Ao utilizar o valor de uma estatstica para estimar um parmetro, vimos que cada amostra tra fornece um valor para a estatstica que se utiliza como estimativa desse parmetro. Estas estimativas no so iguais devido variabilidade presente na amostra. Se, no entanto, os diferentes valores obtidos para a estatstica forem prximos, e o estimador estimador for centrado, podemos ter confiana de que o valor calculado a partir da amostra recolhida (na prtica recolhe-se se uma nica amostra) est prximo do valor do parmetro (desconhecido). A falta de preciso juntamente com o problema do enviesamento da amostra so dois tipos de erro com que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um bom estimador). No se devem, contudo, confundir. Enquanto o enviesamento se manifesta por um desvio nos valores da estatstica, relativamente ao valor do parmetro a estimar, sempre no mesmo sentido, a falta de preciso manifesta manifesta-se por uma grande variabilidade nos valores da estatstica, uns relativamente aos outros. Por outro lado, enquanto o enviesamento se reduz com o recurso a amostras aleatrias, aleatrias, a preciso aumenta-se se aumentando a dimenso da amostra. amostra Exemplo 1.3.4.1 - Suponhamos que ao pretender estudar a percentagem de eleitores que votariam favoravelmente num candidato Cmara de determinada cidade, se recolhia uma amostra de 300 eleitores, ores, dos quais 175 responderam que sim. Considerando como estimador, a proporo de elementos na amostra apoiantes do candidato, ento uma estimativa para a proporo pretendida seria 0.58. Se considerssemos outra amostra de 300 eleitores, suponhamos que o valor obtido para o nmero de sims tinha sido 183. Ento a estimativa obtida seria 0.61. A repetio deste processo 15 vezes permitiria obter 15 valores para o estimador, que seriam outras tantas estimativas do parmetro a estimar proporo de eleitores res da cidade, potenciais apoiantes do tal candidato. Representando num eixo os valores obtidos e admitindo que o verdadeiro valor do parmetro era 0.60, poderamos deparar-nos nos com vrias situaes:

1) reflecte um pequeno ou ausncia de enviesamento, pois os valores para a estatstica (propores obtidas a partir das amostras) situam-se situam se para um e outro lado do valor do parmetro, e verifica-se se ainda a existncia de uma pequena variabilidade entre os resultados obtidos para as vrias amostras, amostras que se traduz em grande preciso. 2) embora se mantenha a preciso, existe um grande enviesamento, pois os valores da estatstica situam-se se sistematicamente para a direita do valor do parmetro. Presume Presume-se

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

32

que o esquema de amostragem no seja aleatrio, pelo pelo que as amostras s reflectem parte da Populao. 3) voltamos a ter uma situao de pequeno enviesamento, mas de pequena preciso devido grande variabilidade apresentada pelos valores da estatstica. Presumimos que as amostras no tm a dimenso suficiente, suficiente, de forma a garantir uma melhor preciso. 4) a falta de preciso da situao 3) acompanhada de um grande enviesamento. Como sugere Moore (1996), fazendo analogia com o que se passa com um atirador que aponta vrias setas a um alvo, em que procurava atingi atingir r o centro do alvo, teramos

O estudo de um estimador feito atravs da sua distribuio de amostragem, ou seja, da distribuio dos valores obtidos pelo estimador, quando se consideram todas as amostras possveis. Distribuio de amostragem Distribuio de amostragem de uma estatstica a distribuio dos valores que a estatstica assume para todas as possveis amostras, da mesma dimenso, que se podem seleccionar da populao. A forma da distribuio de amostragem, permite-nos permite verificar ficar se esses valores se distribuem de forma tal, que a sua mdia coincide com o parmetro a estimar caso em que o estimador centrado, e alm disso se apresenta grande ou pequena variabilidade o que faz com que o estimador apresente, respectivamente, respectivamente menor ou maior preciso. A maior parte das vezes no se consegue obter a distribuio de amostragem exacta, mas tem-se se uma distribuio aproximada, considerando um nmero suficientemente grande de amostras da mesma dimenso e calculando para cada uma delas del o valor da estatstica que uma estimativa do parmetro em estudo.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

33

*1.3.5 - Qual a dimenso que se deve considerar para a amostra? Outro problema que se levanta com a recolha da amostra o de saber qual a dimenso desejada para a amostra a recolher. Este um problema para o qual, nesta fase, no possvel avanar nenhuma teoria, mas sobre o qual se podem tecer algumas consideraes gerais. Pode-se se comear por dizer que, para se obter uma amostra que permita calcular estimativas suficientemente precisas preci dos parmetros a estudar, a sua dimenso depende muito da variabilidade da populao subjacente. subjacente. Por exemplo, se relativamente populao constituda pelos alunos do 10 ano de uma escola secundria, estivermos interessados em estudar a sua idade mdia, a, a dimenso da amostra a recolher no necessita de ser muito grande j que a varivel idade apresenta valores muito semelhantes, numa classe etria muito restrita. No entanto se a caracterstica a estudar for o tempo mdio que os alunos levam a chegar de casa escola, de forma a obter a mesma preciso que no caso anterior, j a amostra ter de ter uma dimenso maior, uma vez que a variabilidade da populao muito maior. Cada aluno pode apresentar um valor diferente para esse tempo. Num caso extremo, se numa populao a varivel a estudar tiver o mesmo valor para todos os elementos, ento bastaria recolher uma amostra de dimenso 1 para se ter informao completa sobre a populao; se, no entanto, a varivel assumir valores diferentes para todos os elementos, ntos, para se ter o mesmo tipo de informao seria necessrio investigar todos os elementos. Chama-se se a ateno para a existncia de tcnicas que permitem obter valores mnimos para as dimenses das amostras a recolher e que garantem estimativas com uma de determinada preciso exigida partida. Uma vez garantida essa preciso, a opo por escolher uma amostra de maior dimenso, uma questo a ponderar entre os custos envolvidos e o ganho com o acrscimo de preciso. Vem a propsito a seguinte frase (Statistics: cs: a Tool for the Social Sciences, Mendenhall et al., pag. 226): "Se a dimenso da amostra demasiado grande, desperdia-se desperdia se tempo e talento; se a dimenso da amostra demasiado pequena, desperdia desperdia-se tempo e talento". Convm ainda observar que a dimens dimenso o da amostra a recolher no directamente proporcional dimenso da populao a estudar, isto , se por exemplo para uma populao de dimenso 1000 uma amostra de dimenso 100 for suficiente para o estudo de determinada caracterstica, no se exige nece necessariamente ssariamente uma amostra de dimenso 200 para estudar a mesma caracterstica de uma populao anloga, mas de dimenso 2000, quando se pretende obter a mesma preciso. Como explicava George Gallup, um dos pais da consulta da opinio pblica (Tannenbaum, 1998 19 ),: Whether you poll the United States or New York State or Baton Rouge (Louisiana) you need the same number of interviews or samples. Its no mystery really if a cook has two pots of soup on the stove, one far larger than the other, and thoroughly stirs them both, he doesnt have to take more spoonfuls from one than the other to sample the taste accurately. Finalmente chama-se se a ateno para o facto de que se o processo de amostragem originar uma amostra enviesada, aumentar a dimenso no resolve nada, antes pelo contrrio contrrio! *1.3.6 Outros tipos de erros num processo de aquisio de dados Alm dos problemas relacionados com a amostragem e apontados anteriormente existem ainda outras fontes de erros que no esto relacionadas com o mtodo da recolha da
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

34

amostra nem com a dimenso da amostra, que so os chamados erros de no amostragem. Se, por exemplo, seleccionarmos uma amostra aleatria simples a partir de uma listagem de elementos que no contenha todos os elementos da populao, poderemos obter um uma amostra enviesada. Efectivamente, e como j foi referido anteriormente, muitas vezes a recolha da amostra faz-se se de uma populao que no a populao que se pretende estudar populao alvo ou populao objectivo, mas sim de outra populao que se p pensa representar a primeira populao inquirida. Por exemplo, se se pretende estudar uma determinada caracterstica dos residentes em Lisboa, comum recolher uma amostra seleccionando aleatoriamente alguns nmeros de telefones da lista telefnica de Lisboa, Lis para representar a populao lisboeta. Este processo introduz algum enviesamento, pois existem zonas de Lisboa onde a percentagem de pessoas com telefone pequena. Alm disso, pode acontecer com alguma frequncia telefonarem para casa das pessoas qua quando elas esto ausentes, no trabalho, pelo que a amostra subestimar a percentagem dos lisboetas que trabalham fora de casa. O exemplo que acabmos de descrever refere refere-se a um erro de seleco. Na recolha da informao tambm se pode ainda verificar que a informao dada no seja verdadeira. Ao responder a um inqurito o inquirido pode sentir sentir-se se condicionado pelo inquiridor, face a determinadas perguntas. Isso poder lev lev-lo lo a mentir. Por exemplo ao perguntarem a um indivduo se ele racista, ele pode dizer dizer que no, quando na verdade o . Finalmente, pode-se se ter feito um planeamento adequado da amostra a recolher, mas ao recolher a informao de entre os elementos da amostra, a pessoa encarregada dessa recolha pode ver-se se defrontada com a no resposta. Este e problema acontece com frequncia quando a amostra constituda por pessoas, das quais algumas das seleccionadas no so encontradas para darem a informao sobre a varivel em estudo, ou ento se recusam a responder. Outro problema que pode surgir devido dev a erros de processamento que no tm nada a ver com o processo de recolha da amostra, mas que podem influenciar o resultado da estatstica, j que esta calculada com base na informao recolhida. Estes erros surgem com alguma frequncia, sendo muitas vezes detectados por serem outliers. Efectivamente, se ao digitar um conjunto de valores correspondentes a pesos de pessoas adultas aparecer 566 quilogramas, ao fazer uma representao grfica aparecer este valor como outlier e imediatamente se concluir que se trata de um problema de processamento: eventualmente ao carregar a tecla do 6 o tempo de apoio foi um pouco maior e apareceram dois 6.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

35

1.4 - Estatstica Descritiva e Inferncia Estatstica


Uma vez recolhida a amostra procede procede-se ao seu estudo. Este ste consiste em resumir a informao contida na amostra construindo tabelas, grficos e calculando algumas caractersticas amostrais - estatsticas. Este estudo descritivo dos dados o objectivo da Estatstica Descritiva. Esta fase a que depende mais da habilidade ou intuio do estatstico (dissemos no incio do captulo que a Estatstica alm de uma cincia, tambm uma arte!). Efectivamente ele vai tentar substituir o conjunto de dados, por um sumrio desses dados de forma a realar a informao que eles contm. Pense-se se o que se passa, por analogia, com um texto comprido e repetitivo em que a pessoa se perde na leitura. Um sumrio bem feito do texto, em algumas linhas, dar a informao relevante sobre o texto, que ocupava muito mais linhas. Ao ler o sumrio a pessoa fica rapidamente informada sobre o assunto que trata. O mesmo se passa com os dados, sendo necessrio que o sumrio desses dados seja feito adequadamente de forma a no se perder muita informao, mas tambm de forma a no sumariar to pouco uco que a pessoa seja submergida por tanta informao! Por exemplo, suponha que perguntou a um aluno se ele foi bom aluno na licenciatura que tirou. Ele responde-lhe lhe com as notas que teve durante os 4 anos que durou a licenciatura:
10 15 11 16 16 15 11 12 17 10 13 16 15 16 16 17 11 13 12 15 14 13 16 16 17 12 15 13 18 14 14 14

Perante estes dados hesitar um pouco, pois no se v facilmente qual o tipo de notas que predomina. No entanto se fizer uma representao repre grfica muito simples:
10
11

**
***

12
13

***
****

14 15 16 17 18

**** ***** ******* *** *

imediatamente concluir que metade das notas so iguais ou superiores a 15, pelo que se pode considerar um aluno bom. Organizmos os dados atravs de uma representao grfica a sugestiva, que permitiu realar a informao desejada. Outro processo seria resumir a informao sob a forma de uma medida que se calculava a partir dos dados (estatstica) - a mdia, que viria igual a 14.2. Seguidamente, o objectivo de um estudo estatstico, estat , de uma maneira geral, o de estimar uma quantidade ou testar uma hiptese, utilizando-se se tcnicas estatsticas convenientes, as quais realam toda a potencialidade da Estatstica, na medida em que vo permitir tirar concluses acerca de uma Populao, Popula baseando-se se numa pequena amostra, dando dando-nos ainda uma medida do erro cometido. A esta fase chamamos Inferncia Estatstica. Esta quantificao do erro cometido, ao transportar para a populao as propriedades verificadas na amostra, feita utilizando a Probabilidade. Efectivamente, nesta fase do processo estatstico que temos necessidade de entrar com este conceito, para quantificar a incerteza associada aos procedimentos aqui considerados. Repare-se Repare se que ao transportar

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

36

para a populao uma propriedade propriedade verificada na amostra no podemos dizer que essa propriedade verdadeira porque no a verificamos em todos os elementos da populao, mas tambm no podemos dizer que falsa, pois a propriedade foi verificada por alguns elementos da populao - a mostra. mostra. Assim, estamos numa situao entre o que verdadeiro e falso, caracterizada por uma incerteza, a qual medida com a utilizao da probabilidade. Exemplo 1.4.1 - O Senhor X, candidato Cmara da cidade do Porto, pretende saber, qual a percentagem de eleitores que pensam votar nele nas prximas eleies. Havendo algumas limitaes de tempo e dinheiro, a empresa encarregada de fazer o estudo pretendido decidiu recolher uma amostra de dimenso 1000, perguntando a cada eleitor se sim ou no pensava votar no Senhor X. Como resultado da amostragem obteve-se obteve se um conjunto de sim's e no's, cujo aspecto no muito agradvel, pois primeira vista no conseguimos concluir nada:

Sim No Sim Sim

No Sim

Procede-se se reduo dos dados, resumindo a informao sobre quantos sim's se obtiveram, obtive chegando-se se concluso que nas 1000 respostas, 635 foram afirmativas. Ento dizemos que a percentagem de eleitores que pensam votar no candidato, de entre os inquiridos, de 63.5%. A funo da Estatstica Descritiva acabou aqui! (Se toda a Populao tivesse sido inquirida, este estudo descritivo dar-nos-ia dar ia a informao necessria para o fim em vista). Poderemos agora inferir que 63.5% dos eleitores da cidade do Porto pensam votar no Senhor X? A resposta a esta pergunta nem sim, nem no, mas talvez. talvez. agora que temos necessidade de utilizar o conceito de Probabilidade, para quantificar a incerteza associada inferncia. Assim, existem processos de inferncia estatstica que, do resultado obtido a partir da amostra, nos permitiro concluir que o intervalo intervalo [60.5%, 66.5%] contm o valor exacto para a percentagem de eleitores da cidade que pensam votar no Senhor X, com uma confiana de 95%. Observao - A confiana de 95% deve ser entendida no seguinte sentido: se se recolherem 100 amostras, cada uma de dimenso 1000, ento poderemos construir 100 intervalos; destes 100 intervalos esperamos que 95 contenham o verdadeiro valor da percentagem (desconhecida) de eleitores da cidade do Porto, que pensam votar no candidato. Como ao fazer um estudo s se recolhe e uma amostra, no sabemos se a nossa uma das que deu origem a um dos intervalos que continha o parmetro. Estamos confiantes que sim! Recorde-se se a forma como as previses so dadas, em noite de eleies, sob a forma de intervalos. Por vezes a guerra de audincias faz com que estas previses tenham pouco sentido, por apresentarem intervalos com uma to grande amplitude que a sua preciso, como estimativas das percentagens pretendidas, muito pequena. Esta situao prende-se prende com o facto de as amostras utilizadas lizadas para a construo dos intervalos terem uma dimenso muito reduzida, havendo assim muito pouca informao disponvel (recorde (recorde-se o que dissemos anteriormente sobre o processo para aumentar a preciso). No entanto, medida que a noite vai avanando, os intervalos vo diminuindo de amplitude, estando esta

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

37

diminuio da amplitude relacionada com a dimenso da amostra que entretanto vai aumentando, at finalmente estarem todos os votos contados. Nesta altura, os intervalos reduzem-se se a pontos, que so as a percentagens pretendidas - a amostra constituda por toda a populao. O seguinte esquema pretende resumir as diferentes etapas que normalmente so seguidas num procedimento estatstico:

Produo de dados Populao Amostra

Caractersticas populacionais parmetros

Estatstica Descritiva
Estudo da amostra:

Estatstica Indutiva

- tabelas - grficos - medidas -

Caractersticas amostrais estatsticas

No esquema anterior a necessidade de utilizar o conceito de probabilidade pro faz-se se sentir ao passarmos das propriedades estudadas na amostra para as propriedades na populao, sendo aqui precisamente que vai ser necessrio invocar o princpio da aleatoriedade. Chama-se se a ateno para que a compreenso do processo estatstico estatstico permitir permitir-nos- interpretar melhor notcias que, frequentemente, se lem nos jornais ou ouvem na televiso. Por vezes alguns estudos sobre os mesmos assuntos, apresentam resultados contraditrios! Isto acontece nomeadamente no estudo de certos aspecto aspectos do comportamento humano, utilizando testes psicolgicos, ou no estudo de certas doenas utilizando cobaias. Muitas das inferncias feitas so imperfeitas, a maior parte das vezes por terem como base dados imperfeitos.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

38

2. Representao e reduo de dados. dados. Tabelas e grficos 2.1- Introduo


Num mdulo anterior de Estatstica, j foram apresentados vrios processos de organizar os dados, de forma a realar as caractersticas principais e a estrutura subjacente da populao de onde esses dados foram retirados. retirad Quer estejamos perante uma varivel de tipo discreto ou contnuo, o processo de organizar a informao consiste em, de um modo geral, comear por construir tabelas de frequncia e proceder a representaes grficas adequadas. Vamos seguidamente utilizar utilizar o Excel na construo dessas tabelas de frequncia.

2.2 Utilizao do Excel na obteno de tabelas de frequncia


Vamos exemplificar a utilizao do Excel na construo de tabelas de frequncia a partir do ficheiro DeputadosXII, apresentado no captulo anterior.

2.2.1 Tabela de dados qualitativos ou quantitativos discretos


O procedimento para a construo das tabelas de frequncia idntico, quer tenhamos um conjunto de dados qualitativos ou quantitativos discretos, discretos, j que as classes que se consideram so as diferentes categorias ou valores que surgem, respetivamente, no conjunto de dados. A seguir apresentamos a construo destas tabelas utilizando a funo COUNTIF. Numa seco posterior veremos mos a sua construo construo utilizando a metodologia da funcionalidade PivotTables. Exemplo 2.2.1 Considere o ficheiro DeputadosXII. Obtenha uma tabela de frequncias para a varivel Grupo Parlamentar. Comemos por copiar a coluna correspondente ao Grupo parla parlamentar mentar para um novo ficheiro. Ordenmos os elementos por ordem crescente e inserimos na coluna Classes os diferentes elementos do conjunto de dados. Utilizmos de seguida a funo COUNTIF para obter as frequncias absolutas de deputados de cada um dos grupos parlamentares:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

39

As frmulas apresentadas anteriormente, deram origem seguinte tabela:

2.2.2 Tabela de dados quantitativos contnuos


Como se viu no mdulo anterior de Estatstica, no caso de dados contnuos o processo de construo o das tabelas um pouco mais elaborado, j que a definio das classes no to imediata. De um modo geral as classes so intervalos com a mesma amplitude, fechados esquerda e abertos direita ou abertos esquerda e fechados direita. Em certos cas casos no conveniente que as classes tenham a mesma amplitude, o que em si no um problema para a construo da tabela de frequncias, mas que implica alguma complicao na construo do histograma associado, quando pretendemos utilizar Excel. Vamos utilizar zar ainda o ficheiro DeputadosXII para estudar a varivel Idade, que uma varivel quantitativa contnua. Exemplo 2.2.2 Utilizando a informao contida no ficheiro DeputadosXII, construa uma tabela de frequncias para a varivel Idade. Vamos dividir esta ta tarefa em duas partes: uma primeira parte consistir na definio das classes e uma segunda parte no clculo das frequncias.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

40

Antes de iniciar o procedimento estatstico, temos de obter a Idade dos deputados, utilizando, por exemplo, o seguinte procedimento: procedim Copie a coluna Data de nascimento para um ficheiro novo com 230 elementos que ocupam as clulas A2:A231. Para obter a idade em 31/12/2011, podemos utilizar a seguinte metodologia: Passo 1 Inserir na clula B1 a data 31/12/2011; Passo 2 Colocar o cursor na clula B2 e introduzir a expresso: =Int(($B$1 =Int(($B$1A2)/365,25); Passo 3 Replicar esta funo atravs das clulas B3 a B231;

Definio das classes: a) Determinar a amplitude da amostra, subtraindo o mnimo do mximo; b) Dividir essa amplitude pelo nmero nmero K de classes pretendido. Existe uma regra emprica que nos d um valor aproximado para o nmero K de classes e que consiste no seguinte: para uma amostra de dimenso n, considerar para K o menor inteiro tal que 2Kn. Uma express expresso equivalente para obter er K, consiste em considerar K=INT(LOG(n;2))+1 LOG(n;2))+1 ou K=ROUNDUP(LOG(n;2);0), LOG(n;2);0), em que a funo ROUNDUP(x;m), devolve um valor de x, arredondado por excesso, com m casas decimais; c) Calcular a amplitude de classe h, dividindo a amplitude da amostra por K e tomando para h um valor aproximado por excesso do quociente anteriormente obtido; d) Construir as classes C1, C2, ..., Ck. Vamos considerar como classes os intervalos [mnimo, mnimo + h[,[mnimo + h, mnimo + 2h[, ..., [mnimo + (k-1)h, (k mnimo nimo + kh[. Uma alternativa a este procedimento seria considerar as classes abertas esquerda e fechadas direita, da seguinte forma: ]max Kh, max (K-1)h], 1)h], ]max (K-1)h, max (K-2)h], ]max h, max]. Estes passos so representados na figura seguinte: seguin

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

41

com os seguintes resultados:

Clculo das frequncias: Para obter as frequncias absolutas das classes anteriormente definidas, , vamos utilizar a funo COUNTIF do seguinte modo:

Nota: As classes so fechadas esquerda e abertas direita. Na tabela anterior inserimos uma coluna com as frequncias relativas, tendo-se tendo se obtido os seguintes resultados:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos Complementos.

42

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

43

2.2.3 - Construo de uma tabela de frequncias utilizando a funo Frequency do Excel


O Excel tem uma funo, que a funo Frequency(Data_array;Bins_array), que calcula o nmero de elementos da varivel - cujos valores se encontram no vector Data_array, existentes nas classes - cujos limites se encontram em Bins_array:

Este vetor Bins_array constitudo onstitudo por um conjunto de k valores b1, b2, ..., bk, formando (k+1) classes, tais que: A 1 classe dada por (( , b1], isto , conter todos os elementos b1; A 2 classe dada por ]b1, b2]; A 3 classe dada por ]b2, b3]; A k-sima sima classe dada por ]bk-1, bk]; A (k+1)sima classe dada por ]bk, +);

Vamos exemplificar construindo uma tabela t de frequncias para a varivel idade. Definio das classes: Considerando a amplitude de classe igual a 5,7 (considerada na seco anterior) e tendo em considerao que agora as classes so fechadas direita, vamos constru-las constru las subtraindo a amplitude de de classe ao mximo, como sugerido em 2.2.2, pelo que para a utilizao da funo Frequency, o nosso conjunto de valores para o Bins_array, ser constitudo por {30,1; 35,8; 41,5; 47,2; 52,9; 58,6; 58,6 64,3}; Para utilizar a funo Frequency cy(Data_array;Bin_array), procede-se se do seguinte modo: Definir a coluna de separadores ou limites das classes, que constituir o Bins_array; Selecionar ionar tantas clulas em coluna, quantas as classes consideradas para a tabela de frequncias (no esquecer que o nmero de classes superior em uma unidade ao nmero de separadores, pelo pe que o nmero de clulas selecionadas cionadas dever ser, neste caso, de 8);

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

44

Introduzir a funo Frequency, considerando como primeiro argumento o conj conjunto de clulas onde se encontram os dados a agrupar, chamado de Data_array, e como segundo argumento as clulas que constituem o Bins_array; Carregar CTRL+SHIFT+ENTER

Na figura seguinte apresentamos o resultado deste procedimento:

Verifique que os valores es devolvidos pela funo Frequency, nas clulas L3: L10, no so iguais s frequncias obtidas anteriormente e apresentadas na tabela de frequncias j construda, , situao previsvel devido ao facto de os limites das classes terem sido alterados. Efetivamente, , neste caso as classes so ]24,4;30,1], ]30,1;35,8], ]35,8;41,5], ]41,5;47,2], ]47,2;52,9], ]52,9, 58,6], ]58,6;64,3], ]64,3;70].
Nota Apesar de na coluna que contm os separadores das classes aparecer o 70, este no tomado em considerao. Foi utilizado para construir os separadores das clulas k3:k9.

2.3 Utilizao do Excel na representao grfica de dados


De forma idntica que fizemos para a construo das tabelas de frequncias, vamos tambm considerar separadamente o caso caso da varivel em estudo ser de natureza qualitativa ou quantitativa discreta, ou de natureza quantitativa contnua.

2.3.1 Variveis qualitativas ou quantitativas discretas. Diagrama ou grfico de barras


Neste caso vimos que a construo da tabela de frequncias frequncias se resume, de um modo geral, a considerar como classes as diferentes categorias ou valores que surgem na amostra. Uma representao grfica adequada para estes dados, o diagrama de barras, barras, que j foi introduzido no mdulo dulo de Estatstica. Diagrama (ou grfico) de barras Representao grfica que consiste em marcar num sistema de eixos coordenados, no eixo dos xx, pontos representando as categorias ou os valores considerados para as classes na tabela de frequncias, e nesses pontos barras verticais de altura igual ou proporcional frequncia absoluta ou frequncia relativa. No

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

45

caso dos dados qualitativos, a ordem por que se colocam as barras qualquer, a no ser que exista alguma ordem subjacente, como nos qualitativos qualitativos ordinais. Neste caso, respeita-se respeita a ordem, colocando da esquerda para a direita as diferentes categorias, comeando na de menor nvel para a de maior nvel. 2.3.1.1 - Varivel de tipo qualitativo Exemplo 2.3.1 - Vamos exemplificar a construo de um diagrama diagrama de barras de uma varivel qualitativa, considerando a tabela de frequncias construda em 2.2.1, para estudar a varivel Grupo Parlamentar, do ficheiro DeputadosXII:

A metodologia seguida para construir construir o diagrama de barras, consiste em, na folha Excel, que contm a tabela: Selecionar as clulas que contm as classes e as frequncias absolutas (por exemplo), incluindo (ou no) os ttulos; Na barra de ferramentas, seleccionar Insert e o cone Chart ; Selecionar a opo Column para o grfico a 2 dimenses, obtendo-se se o grfico seguinte:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

46

Como no pretendemos este ttulo nem esta legenda, selecionamos as caixas respetivas e fazemos Delete. Uma forma de evitar que aparea o ttulo e a legenda, enda, selecionar unicamente as clulas C3:D8 ou ento deixar em branco as clulas anteriores aos valores a serem representados, selecionando tambm essas clulas (no caso do exemplo teramos de apagar os contedos das clulas C2 e D2 e selecionar C2:D8. C2:D8 Nota Esta metodologia de colocar as clulas em branco fundamental no caso de os dados serem quantitativos discretos, considerando como classes os diferentes dados. Consideramo-la la aqui tambm como uma questo de uniformizao na construo do grfico de barras. Para acrescentar os ttulos nos eixos, selecionamos LayoutAxis Titles e escrevemos os ttulos pretendidos. Finalmente temos o grfico de barras com o seguinte aspeto:

2.3.1.2 - Varivel de tipo quantitativo discreto 2.3.1.2.1 Diagrama de barras arras No caso de dados discretos, para construir a tabela de frequncia consideram consideram-se como classes os diferentes valores que surgem na amostra. Estes valores devem ser apresentados, na tabela de frequncia, freq ordenados. Exemplo 2.3.2 Suponhamos que para uma u amostra de 30 deputados da atual tual legislatura, se tinha recolhido a informao sobre o nmero de filhos, tendo-se tendo se obtido os seguintes valores: 2, 1, 2, 3, 0, 0, 1, 1, 4, 1, 2, 1, 0, 0, 0, 2, 3, 1, 1, 1, 6, 3, 1, 3, 2, 0, 1, 2, 0, 2, 3 Resuma os dados numa tabela de frequncias e construa o diagrama de barras associado. Introduzimos os dados nas clulas A2:A31 de uma folha de Excel, a que chammos Filhos e a seguir procedemos do seguinte modo:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

47

1 parte Procedimento para a construo da tabela de frequncias: Selecionar as clulas que contm os dados e orden-los orden los utilizando o boto da barra de Excel; Considerar para classes os diferentes valores que surgem na amostra. Se faltar algum valor alor entre o mximo e o mnimo, consider-lo consider lo tambm na tabela de frequncias, se a seguir se pretende construir um diagrama de barras; neste exemplo considermos o valor 5 como classe, com frequncia nula; Utilizando a funo COUNTIF, determinar minar as frequncias absolutas das classes consideradas no ponto anterior; calcular a partir destas, as frequncias relativas.

2 parte Procedimento para a construo do diagrama de barras: barras De forma anloga ao que se sugeriu para a representao num diagrama de barras dos dados qualitativos, insira uma clula em branco entre os valores da tabela que se pretendem representar e os ttulos das colunas. Assim, a tabela a ser representada a seguinte:

Selecionar as clulas que c contm ontm as classes e as que contm as frequncias relativas, incluindo as clulas em branco, ou seja C2:C9 e E2:E9 (para selecionar as clulas que contm as frequncias relativas, como no so adjacentes s que contm as classes, depois de selecionar estas, tem que se pressionar a tecla CTRL e com ela pressionada, selecionar as clulas da coluna E);

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

48

Selecionar na barra de ferramentas a opo Insert e a Chart Column, tal como se fez para os dados de tipo qualitativo;

e a seguir a opo

Acrescentar crescentar os ttulos aos eixos:

Nota Experimente construir o diagrama de barras sem selecionar as clulas em branco. 2.3.1.2.2 Funo cumulativa A funo cumulativa uma funo definida para todo o valor real x, e que para cada x d a soma das frequncias relativas dos valores da amostra menores ou iguais a x. Quando temos uma varivel de tipo discreto, a funo cumulativa uma funo em escada, isto , uma funo que cresce por degraus, mudando de degrau nos pontos em que a frequncia diferente de 0, e em que a altura do degrau degrau igual frequncia respe respetiva. Vamos exemplificar a sua construo com o exemplo apresentado na seco anterior para a construo do diagrama de barras. barra Exemplo 2.3.2 (cont) Construa a funo cumulativa para os dados do nmero de filhos da amostra dos 30 deputados.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

49

Retomando a tabela de frequncias do exemplo 2.3.2, vamos acrescentar uma coluna com as frequncias relativas acumuladas:

Tabela de frequncias frequ Classes Freq.abs. Freq.rel. Freq.rel.acum. 0 7 0,233 0,233 1 9 0,300 0,533 2 7 0,233 0,767 3 5 0,167 0,933 4 1 0,033 0,967 5 0 0,000 0,967 6 1 0,033 1,000 30 A funo cumulativa h-de de ser tal que: que Para valores de x< o, ser nula; Para valores de o x < 1, ser igual a 0,233; Para valores de 1 x < 2, ser igual a 0,533; Para valores de 2 x < 3, ser igual a 0,767; Para valores de 3 x < 4, ser igual a 0,933; Para valores de 4 x < 6, ser igual a 0,967; Para valores de x 6, ser ser igual a 1;

O Excel no dispe de uma representao imediata para a funo anterior, pelo que temos de utilizar um pequeno artifcio. Suponhamos, para j, que por algum processo tnhamos conseguido construir o grfico da funo cumulativa, que tem o seguinte segui aspeto:

Esta funo constituda por 6 degraus, em que a altura do degrau , em cada ponto, igual frequncia relativa respetiva e a dimenso do patamar igual diferena entre os pontos consecutivos, com frequncia relativa diferente de zero:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

50

O Excel dispe de uma representao grfica, o Scatter (Diagrama de disperso), em que no ltimo subtipo apresentado para as opes, une os pontos, por ordem crescente das abcissas, simultaneamente de tantas sries (conjuntos de pontos) quantas quantas as desejadas. Vamos utilizar esta funo Scatter para construir os sucessivos degraus da funo cumulativa, em que cada degrau corresponde a uma srie - unio de dois pontos, e em que temos tantas sries a representar, quantos os degraus. degraus. Assim, o artifcio est em representar, numa tabela do Excel, os degraus pretendidos atravs das coordenadas dos pontos, como exemplificamos a seguir:

Agora basta selecionar as clulas M2: S143 e fazer o diagrama de disperso. Proceda como na construo uo do diagrama de barras, para retirar a legenda e acrescentar ttulos:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos Complementos.

51

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

52

2.3.2 Variveis quantitativas contnuas


2.3.2.1 Histograma 2.3.2.1.1 Tabela de frequncias com as classes com a mesma amplitude No caso de um conjunto de dados contnuos, j vimos anteriormente a forma de obter a tabela de frequncias. Como se viu, as classes so intervalos e a representao grfica adequada o histograma, j apresentado no mdulo de Estatstica: Histograma - um diagrama de reas, formado por uma sucesso de retngulos adjacentes, tendo cada um por base um intervalo de classe e por rea a frequncia relativa (ou frequncia absoluta). Por conseguinte, a rea total coberta pelo histograma igual a 1 (ou igual l a n, a dimenso do conjunto de dados a representar). Para construir o histograma de forma correta, isto , de modo a que as reas dos retngulos sejam iguais s frequncias, a altura do retngulo correspondente a determinada classe, dever ser igual frequncia equncia da classe a dividir pela respetiva amplitude. Contudo, se as classes tiverem todas a mesma amplitude, usual construir os retngulos com alturas iguais s frequncias relativas (absolutas) das respetivas classes, vindo as reas dos retngulos proporcionais porcionais e no iguais s frequncias. A constante de proporcionalidade a amplitude de classe. No entanto, se se pretender comparar amostras atravs de histogramas, embora o histograma no seja a representao mais adequada para a comparao de amostras amostras, devese ter o cuidado de os construir da forma indicada inicialmente, e utilizando as frequncias relativas, de modo que a rea total ocupada por cada um dos histogramas seja igual a 1. Exemplificamos, de seguida, a construo de um histograma utilizand utilizando o Excel. Exemplo 2.3.3 Considerando a tabela de frequncias construda em 2.3 para a varivel idade, construa o histograma adequado. Processo utilizado para obter o histograma:

Acrescentar, tabela considerada, uma outra coluna com a frequncia relativa relativa a dividir pela amplitude de classe (igual a 5,7). No caso presente, inserimos estas clulas adjacentes s clulas que contm as classes. No entanto, no necessrio ter esta preocupao, j que se pretender selecionar clulas no adjacentes, basta selecionar cionar as clulas da primeira coluna e se a coluna seguinte no for adjacente, comear por carregar a tecla CTRL e com ela pressionada selecionar, ento, as clulas pretendidas pretendidas;

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

53

Selecionar as clulas F15:G22 (que contm as classes e as frequncias relativas relativas a dividir pela amplitude de classe. Neste caso, como as classes so categorias e no nmeros, no precisamos de selecionar as clulas em branco;

Proceder como em 3.1 para construir um diagrama de barras, para obter a figura que se apresenta a seguir;

Para obter o histograma, j que o que se nos apresenta na figura anterior no um histograma pois no tem as barras adjacentes, ter de:
Clicar com o boto direito do rato sobre as barras, de forma a que aparea o menu Format Data Series ou

Format data Points. A selecionar 0 em Gap Whist e OK:

Finalmente pode-se se melhorar esteticamente o histograma, diminuindo o nmero de casas decimais nos valores apresentados no eixo dos YY, retirando as linhas, etc.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

54

Histograma para a idade dos deputados

Nota Tomar em ateno que as classes aparecem encostadas ao eixo das ordenadas, embora devesse aparecer entre esse eixo e a primeira classe, uma quebra de linha, como se apresenta a seguir (conseguido com o Paint...).

Nota Da forma como foi construdo, a rea total ocupada pelo histograma igual a 1.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

55

2.3.2.1.2 Funo Histogram No Excel existe uma funo, idntica funo Frequency, a funo Histogram, a que se acede selecionando DataData Analysis HistogramOk. Vamos exemplificar a s sua
3

utilizao para o conjunto de dados da varivel Idade, anteriormente considerado:

Definir a coluna de separadores ou limites de classes, que constituir o Bin Range: No o nosso caso construimos as classes subtraindo a amplitude de classe sucessivamente ao mximo, obtendo os valores

{30,1, 35,8, 41,5, 47,2, 52,9, , 58,6, 64,3} (tal como para a funo Frequency, as classes so fechadas direita e abertas esquerda), que colocmos nas clulas K3:K9; Selecionar DataData AnalysisHistogramOk:

Em Input Range, indicmos o local dos dados e selecionmos ainda a opo Chart Output e clicmos OK. Como resultado obtivemos o seguinte:

Substitumos os limites das classes pelos intervalos das classes e arranjmos convenientemente o grfico, j que a representao que ue se obtm, ao contrrio do que indicado no ttulo, no um histograma:

No caso de no estar visvel a opo Data Analysis, ter de utilizar a seguinte metodogia para a instalar:

Selecionar sucessivamente FileOptions Add-Ins Analysis ToolPak Go

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

56

Nota1 - Ao considerar a funo Histogram, tem a possibilidade de no indicar os separadores de classe, deixando vazio o espao denominado Bin Range, uma vez que sero considerados, dos, por defeito, classes. Contudo, no aconselhamos que se deixe esta escolha ao Excel, uma vez que, por exemplo, a primeira classe que considerada, constituda pelos valores menores ou iguais ao mnimo, o que no tem qualquer sentido. Nota 2 A rea a ocupada pelo histograma igual amplitude de classe nosso caso vem 5,7 x 230.

s a t u l o s b a s a i c n u q e r f
, ou seja, no

2.3.3.1.3 - Tabela de frequncias com as classes com amplitudes diferentes

Por vezes a organizao e reduo de um conjunto de dados contnuos, contnuos, atravs de uma tabela de frequncias, pressupe que os intervalos, que constituem as classes, tenham limites escolhidos pelo utilizador, sem obedecerem a um critrio estritamente resultante da aplicao de uma regra matemtica. o caso, por exemplo, exemplo, da varivel idade, em que poder ser interessante escolher determinadas classes etrias. Tendo em conta a definio de histograma, como sendo um diagrama de reas, constitudo por uma srie de retngulos adjacentes, em que a rea de cada retngulo igu igual ou proporcional frequncia de classe, no caso de a tabela de frequncias no apresentar as classes todas com a mesma amplitude, j o histograma no se pode reduzir a um diagrama de barras, em que as barras tenham a mesma largura e as alturas sejam iguais igu s frequncias. No sendo o Excel um software de Estatstica, no apresenta uma soluo imediata para a construo do histograma nestas condies, sendo necessrio recorrer a um artifcio. Exemplificaremos caremos a seguir a aplicao de uma tcnica possvel para a resoluo do problema, recorrendo representao grfica Scatter. Exemplo 2.3.4 Consideremos um conjunto de dados organizados numa tabela de frequncias, em que se consideraram as seguintes classes [28, 35[, [35, 40[, [40, 45[, [45, 50[, [50, 55[, [55, 60[, [60, 65[, [65, 74[ (Este conjunto de dados tambm um conjunto de 230 idades, mas no o conjunto do ficheiro DeputadosXII). A esta tabela de frequncias acrescentmos uma nova coluna onde, para cada classe, se considera a frequncia relativa
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

57

(ou absoluta) a dividir pela amplitude de classe. Ser esta coluna que ir fornecer as alturas dos retngulos que constituiro o histograma. Com esta precauo, garantimos que as reas destes retngulos so iguais s frequncias relativas (ou absolutas). Apresenta-se Apresenta se a seguir a tabela de frequncias obtida, segundo a descrio anterior:

O histograma correspondente a esta tabela de frequncias, com cuja construo no nos vamos preocupar r para j, ter o seguinte aspeto:

Temos um histograma corretamente construdo, em que as reas dos retngulos so iguais s frequncias relativas, ocupando o histograma uma rea total igual a 1. Na figura anterior, vamos marcar alguns pontos com letras: letras

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

58

Repare que se unir o ponto a com b, de seguida com c, at esgotar todos os pontos, obtm o histograma. Ento, para obter a representao grfica desejada, basta construir uma tabela, numa folha de Excel, com as coordenadas dos pontos que pretendemos pretendemos unir e utilizar a representao Scatter, tal como foi feito para representar a funo cumulativa em 3.1.2.2:

2.3.2.2 Funo cumulativa Para representar graficamente as frequncias acumuladas, considera considera-se a funo cumulativa, , que se obtm utilizando a seguinte metodologia:
Antes do limite inferior da 1 classe, l1, a frequncia acumulada nula, pelo que se traa um segmento sobre o eixo dos xx, at esse ponto; No limite inferior da 2 classe, , l2, a frequncia acumulada a frequncia da classe anterior, f1. Admitindo que a frequncia se distribui uniformemente no intervalo de classe, unimos os pontos de coordenadas (l1,0) e (l2, f1);

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

59

No limite inferior da 3 classe, l3, a frequncia acumulada a soma das frequncias das duas classes anteriores, (f1+f2). Ento unimos os pontos de coordenadas (l2, f1) e (l3, (f1+f2));

Quando chegarmos ltima classe, temos a garantia que a frequncia acumulada, correspondente ao seu limite superior, igual a 1, pelo que nesse ponto marcamos 1 e continuamos ao eixo dos xx.

com um segmento de reta paralelo

Exemplo 2.3.4 (continuao) Construa a funo cumulativa, a partir da tabela de frequncias apresentada no exemplo 2.3.4. Para obter a funo cumulativa, ba basta acrescentar tabela de frequncias uma nova coluna com as frequncias relativas acumuladas. De seguida utiliza utiliza-se a representao Scatter, para unir os pontos, tais como foram definidos nas indicaes dadas, anteriormente, para a construo construo da funo cumulativa:

Da maneira como foi construda, a funo cumulativa tem algumas propriedades importantes, nomeadamente: Est definida para todo o x real (na representao grfica anterior escolhemos arbitrariamente trariamente o valor da abcissa igual a 25 para comear a construir a funo cumulativa); sempre no decrescente; S assume valores no intervalo [0, 1]; Permite obter informao sobre qual o valor da abcissa a que corresponde determinada frequncia acumulada. acumul

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

60

Vamos explorar um pouco mais esta ltima propriedade. Suponhamos que se pretendia saber, a partir da representao grfica da funo cumulativa, obtida para o exemplo anterior, qual o valor aproximado para a idade a que corresponde uma frequncia relativa ativa acumulada de 50%. De acordo com a figura, este valor deve estar na classe [50, 55[.

Uma vez que se admite que a frequncia se distribui uniformemente sobre a amplitude de classe, isto a frequncia 0,196 (=0,687-0,491) (=0,687 distribui-se uniformemente sobre o intervalo de amplitude 5, atravs da resoluo de uma equao de proporcionalidade, obtm obtm-se o valor que andvamos procura:
0,196 5 = 0,009 x x= 0,009 5 = 0,22 0,196

onde 0,009=0,5-0,491. 0,491. Ento o valor pretendido 50 + 0,22 = 50,22 anos, ou seja 50 anos. Ao valor obtido anteriormente, a que corresponde uma frequncia acumulada de 50%, chamamos mediana. A mediana, que j foi objeto de estudo no mdulo de Estatstica, divide a distribuio das frequncias em duas partes iguais. Recordamos que a tcnic tcnica utilizada permitiu-nos nos obter um valor aproximado para a mediana, cujo valor exato s poderia ter sido determinado a partir dos dados originais, antes de proceder ao agrupamento. Alis, veremos mais frente a determinao desta e de outras medidas, utilizando utili o Excel. Se em vez de pretendermos determinar o valor a que corresponde a percentagem de 50%, procurssemos os valores a que correspondem as percentagens de 25% ou 75%, obteramos os chamados quartis, respetivamente 1 e 3 quartil, e a metodologia u utilizada para os determinar a partir da funo cumulativa seria idntica utilizada para determinar a mediana.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

61

2.3.3 Outras representaes grficas


Alm das representaes grficas consideradas anteriormente, em que destacamos o diagrama de barras para ra dados discretos e o histograma para dados contnuos, existem ainda outras representaes que podem ser utilizadas para dados qualitativos ou quantitativos diagrama circular, ou dados quantitativos caule-e-folhas folhas e diagrama de extremos e quartis. Todas as estas representaes j foram objeto de estudo no mdulo de Estatstica, pelo que privilegiaremos aqui a forma de os construir utilizando o Excel. 2.3.3.1 Diagrama circular Esta representao, utilizada essencialmente para dados dados qualitativos, constituda por um crculo, em que se apresentam vrios sectores circulares, tantos quantas as classes consideradas na tabela de frequncias da amostra em estudo. Os ngulos dos sectores so proporcionais s frequncias das classes. A representao representao deste diagrama, em Excel, imediata, apresentando vrias modalidades. Exemplo 2.3.5 Apresente sob a forma de um diagrama circular a distribuio dos deputados do ficheiro DeputadosXII segundo o grupo parlamentar. Esta varivel j foi objeto de estudo num exemplo anterior, de forma que recorremos tabela de frequncias j calculada, para obter a representao grfica pretendida. Selecionam Selecionam-se as clulas com as classes e as respetivas frequncias absolutas ou relativas (neste caso selecionamos s C3:C8 e E3:E8, e na barra de ferramentas a opo Insert, seguido de Chart e a seguir a primeira opo a duas dimenses do grfico Pie. A representao obtida a seguinte:

Para tornar o diagrama circular mais informativo, apagamos a legenda e com ele selecionado vamos a LayoutData LabelsMore Data Labels Options onde escolhemos colhemos a modalidade preferida, que neste caso conduziu ao grfico com o seguinte aspeto

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

62

2.3.3.2 Caule-e-folha Esta representao, como se sabe, sabe, uma representao que se pode considerar entre a tabela e o grfico, uma vez que so apresentados os verdadeiros valores da amostra, mas de forma sugestiva, que faz lembrar um histograma. Antes de abordarmos a forma de construir um caule-e-folhas folhas utilizando utilizando o Excel, vamos apresentar um exemplo, que nos poder ajudar a compreender os passos necessrios para essa construo. Exemplo 2.3.6 Consideremos a seguinte amostra constituda pela idade de 30 deputados, escolhidos aleatoriamente da tabela de de deputados do ficheiro DeputadosXII:
63 52 51 52 59 57 31 34 51 38 51 44 61 61 42 60 65 56 48 66 63 63 57 52 43 47 54 33 42 46

Uma representao possvel em caule-e-folhas caule a que se apresenta a seguir: 3 4 5 6 1 2 1 0 3 2 1 1 4 3 1 1 8 4 6 7 8 2 2 2 4 6 7 7 9 3 3 3 5 6

Nesta representao considermos 4 caules e o intervalo entre caules sucessivos de 10 unidades. No caule 3 pendurmos todas as folhas deste caule e o mesmo foi feito com todos os outros caules. como se tivssemos considerado as classe classes [30, 40[, [40, 50[, [50, 60[ e [60, 70[ para agrupar os dados. Suponhamos que em vez de considerar estas classes, de amplitude 10, estvamos interessados em considerar classes de amplitude 5, a saber [30, 35[, [35, 40[, [40, 45[, [45, 50[, [50, 55[, [55, 60[, [60, 65[ e [65, 70[. Ento a representao anterior teria o seguinte aspeto: :
3* 3. 4* 4. 5* 5. 6* 1 8 2 6 1 6 0 3 2 7 1 7 1 4 3 8 1 7 1 4 2 9 3 2 3 2 3 4

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

63

6.

Qualquer que seja a representao considerada, qualquer caule tem sempre a possibilidade de ter penduradas o mesmo nmero de folhas. No exemplo anterior, no primeiro sub caule 3 (ou 4, ou 5, ou 6) aparecem penduradas as folhas 0, 1, 2, 3 e 4, enquanto que no segundo sub caule 3 (ou 4, ou 5, ou 6) aparecem penduradas as folhas 5, 6, 7, 8 e 9). Uma outra possibilidade seria considerar classes de amplitude 2, fazendo cada caule dividido em 5 sub caules e cabendo a cada sub caule 2 folhas (repare-se (repare se com a analogia com a construo do histograma, em que considermos as classes com igual igual amplitude). A esta amplitude de classe usual chamar comprimento de linha. No existe no Excel uma representao imediata para a construo de um caule caule-e-folhas, podendo-se se desenvolver vrios processos que conduzem a uma representao em caule caule-efolhas ou idntica. Transcrevemos a seguir, sem atualizar para o Excel 2010, um processo que inserimos na verso original deste dossi. A razo que nos leva no atualizao deste mtodo para obter uma representao semelhante a um caule caule-e-folhas, folhas, prende prende-se com o facto de acharmos mais simples e eficiente o processo que descrevemos em segundo lugar, utilizando as funes REPT e COUNTIF do Excel. 1. Processo desenvolvido por Neville Hunt (Hunt, 2001), para o Excel (verso no atualizada para Excel 2010):

1 passo Insira os dados na coluna C, comeando na clula C2; se no estiverem ordenados, ordene ordene-os por ordem crescente; 2 passo Insira na clula E1 o valor que deseja para o comprimento de linha: 10, 5 ou 2 ou uma potncia de 10, destes valores; 3 passo Na clula A2 escreva a seguinte frmula = INT(C2/E$1)*E$1 e replique-a a tantas vezes quantos os dados inseridos no 1 passo, na coluna C; 4 passo Na clula B2 escreva o valor 1. Na clula B3 escreva a frmula = IF (A3=A2; B2+1; 1) e replique a frmula, tantas vezes quantos os dados inseridos no 1 passo, na coluna C; 5 passo Selecione as clulas das colunas A, B e C com os resultados obtidos nos passos anteriores e no mdulo Chart Wizard (Assistente de Grficos) escolha Bubble; 6 passo Faa um duplo lo clique numa das bolas representadas e na janela Format data Series (ou clique com o boto direito do rato e selecione Format data Series) selecione:

Scale bubble size: 10 e No Fill e em Data Labels: Show bubbles sizes e Center
OK;

7 passo Clique numa a das linhas horizontais que atravessam o grfico e apague-as apague as com a tecla Delete. Apague tambm a legenda. 8 passo Formate convenientemente os eixos.

Vamos exemplificar os passos anteriores com os 30 dados referentes s idades dos deputados.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

64

Na folha de Excel, se mudarmos o valor do comprimento de linha para 10, aparece de imediato a seguinte representao (aparte uma formatao adequada do eixo dos xx):

Repare-se se que, embora as notaes usadas para os caules e as folhas no sejam idnticos aos da representao presentao inicialmente considerada, feita sem o recurso ao Excel, o aspeto grfico o mesmo. Para uma maior semelhana, selecionmos o eixo das ordenadas e fizemos Delete. 2. Processo utilizando as funes REPT e COUNTIF do Excel

1 passo Inserir os dados ados numa coluna do Excel e determinar o mnimo e o mximo; 2 passo Selecionar os valores pretendidos para serem os caules; 3 passo Utilizar a funo REPT e COUNTIF, conforme se exemplifica a seguir.

Vamos exemplificar os passos anteriores com os dados dados referentes s idades dos 230 deputados do ficheiro DeputadosXII, que se encontram nas clulas B2:B231. Como relativamente a estes dados j conhecemos o mnimo (=25) e o mximo (=70), vamos escolher como caules os dgitos 2, 3, 4, 5, 6 e 7. Por outro lado, o, como antecipamos a

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

65

existncia de muitas folhas penduradas em cada caule, vamos considerar comprimentos de linha igual a 5 em vez de 10, pelo que consideramos cada caule dividido em dois sub sub-caules:

Exemplificamos a seguir o processo de construo do caule-e-folhas: c

cujo resultado o seguinte:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

66

Para distinguir os dois sub-caules caules utilizamos um * no primeiro sub-caule sub caule e um . . no segundo sub-caule. . Mas ateno! Antes de procedermos a esta alterao esttica foi necessrio copiar o diagrama anterior anterior para outras clulas utilizando o Paste SpecialValues.

2.3.3.3 Diagrama de extremos e quartis Esta representao, muito simples, mas bastante elucidativa ao realar a informao contida nos dados, no que diz respeito simetria e variabilidade, pressupe que se calculem algumas estatsticas necessrias para a sua construo. Mais uma vez estamos perante uma representao grfica cuja construo, por meio do Excel, necessita de alguns truques. Assim, o primeiro primeiro passo para uma dessas construes, consiste em representar, adequadamente, numa folha de Excel, as estatsticas Mnimo, Mximo. 1 e 3 quartis e mediana. Exemplo 2.3.7 Construa um diagrama de extremos e quartis para a varivel idade dos deputados do ficheiro DeputadosXII. DeputadosXII

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

67

Construo do diagrama de extremos e quartis, em Excel:


1. Utilizando o Excel, comeam por se calcular as estatsticas necessrias4, que se apresentam da seguinte forma:

2. A partir destas estatsticas, vo-se se calcular alguns valores auxiliares que sero os utilizados para a construo do diagrama de extremos e quartis

3. Com as clulas I2:J6 selecionadas como mostra a figura Selecionar Insert Bar Stacked Bar Switch Row/Column, obtendo obtendo-se

4. Apagar a legenda. Clicar com o boto direito do rato no retngulo do lado esquerdo. Selecionar Selecionar:

Format Data SeriesFill No Fill

5. Repetir o procedimento anterior or para o retngulo seguinte e para o ltimo retngulo (azul claro). Neste momento temos:

No captulo 3 abordaremos a determinao das estatsticas descritivas, utilizando o Excel.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

68

5. Selecionar no grfico conforme mostra a figura e de seguida Selecionar Layout Error Bars

More Error Bars Options Minus Percentage 100%

6. Selecionar no grfico conforme mostra a figura e de seguida Selecione Layout Error Bars

More Error Bars Options PlusCustom Specify value Positive Error value Inserir rir o valor da clula
J6

Os procedimentos anteriores riores conduziram seguinte figura:

7. Com o boto direito do rato clicar no grfico conforme mostra a figura e de seguida

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

69

Selecionar Format Data Series

FillNo Fill Border Color Solid Line (Black) Border Stylus2

Proceder roceder como anteriormente para a parte roxa para obter:

Com o boto direito do rato clicar no grfico conforme mostra a figura e de seguida

Format Error Bars Line StyleWidth 2

Proceder como anteriormente com a linha da direita Apagar as linhas verticais Reformular a escala do eixo das abcissas Apagar o eixo vertical Introduzir legendas

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

70

Nota Utilizando um processo idntico ao da seco 2.3.3.1.3 em que, utilizando a funcionalidade Scatter, se construiu um histograma com classes de amplitude diferente, pode-se se construir um diagrama de extremos e quartis. Consideremos ento um diagrama de extremos e quartis, em que marcmos alguns pontos com letras:

Repare que se unir o ponto a com b, de seguida com c, at esgotar todos os ponto pontos, obtm o diagrama de extremos e quartis. Ento, para obter a representao grfica desejada, basta construir uma tabela, numa folha de Excel, com as coordenadas dos pontos que pretendemos unir e utilizar a representao Scatter. Apresentamos a seguir uma folha de Excel preparada para obter a representao, bastando para isso colocar os dados (at 500 dados) na coluna A:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

71

Selecionando as clulas G3:H15, faa Insert Scatter 5 subtipo

Para obter a representao final, basta apagar a legenda e o eixo vertical, vertical, introduzir ttulos e mudar a escala:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

72

Sempre que pretender um diagrama de extremos e quartis para qualquer outro conjunto de dados (de dimenso menor ou igual a 500), basta inserir os dados na coluna A, a partir da clula A2.

2.3.3.3.1 Diagramas de extremos e quartis paralelos A representao de um conjunto de dados, num diagrama de extremos e quartis, especialmente indicada para comparao de vrias amostras, como se exemplifica a seguir: Exemplo 2.3.8 Vamos comparar as idades dos deputados dos diferentes grupos parlamentares. No inclumos o grupo PV por s serem dois deputados. A exemplo do que foi feito para a construo do diagrama de extremos e quartis para uma coleo de dados, tambm aqui ser necessrio calcular algumas caractersticas a amostrais e a partir delas alguns valores auxiliares. Construo dos diagramas de extremos e quartis paralelos: 1. Calcular as caractersticas amostrais relevantes e a partir dessas calcular os valores auxiliares, utilizados para a construo do grfico, de acordo com a seguinte metodologia:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

73

2. Selecionar as clulas que contm as etiquetas (M8:Q8) e os valores auxiliares das clulas M11:Q13 e de seguida
Selecionar obtendo-se

Insert

Column

Stacked

Column,

3. Apagar a legenda e selecionar no grfico conforme mostra a figura

Selecionar Layout Error Bars More Error Bars Options PlusCustom

Specify value

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

74

Positive Error value Inserir os valores valor das clulas M14:Q14 (ver figura no passo 2)

4. Selecionar no grfico fico conforme mostra a figura

Selecionar Layout Error Bars More Error Bars Options MinusCustom

Specify value Negative Error value Inserir os valores valor das clulas M10:Q10 (ver figura no passo 2)

5. Com o boto direito do rato clicar conforme mostra a figura

Selecionar Format Data Series FillNo Fill

Border Color No Border

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

75

7. Para chegar forma final dos diagramas de extremos e quartis paralelos, proceder como no passo 7 para o diagrama de extremos e quartis para um nico conjunto de dados:

O grfico anterior bastante elucidativo na comparao das idades dos deputados dos diferentes grupos parlamentares. interessante verificar que as distribuies das idades dos deputados do PSD e PS so razoavelmente semelhantes, semelhantes, embora se note que nos deputados do PSD as 50% idades do centro sejam um pouco inferiores s correspondentes do PS. As distribuies dos outros grupos parlamentares apresentam enviesamento, para a direita no caso do CDS-PP PP e PCP e para a esquerda no caso do BE. Este enviesamento no caso do BE sintoma de, neste grupo parlamentar, haver uma maior variabilidade de idades nos deputados mais jovens. Nota De forma idntica que se fez para a construo do diagrama de extremos e quartis utilizando a funcionalidade ncionalidade Scatter, tambm se podem construir os diagramas de extremos e quartis utilizando a seguinte metodologia, que vamos mostrar para 2 conjuntos de dados:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

76

Os pontos correspondentes aos dois diagramas de extremos e quartis que se pretendem construir ir so colocados nas mesmas colunas, mas deixando 2 clulas de intervalo (no nosso exemplo as clulas D24 e E24, para que as duas representaes no fiquem ligadas. Repare-se se que incrementmos as ordenadas do segundo conjunto de dados, de 3 unidades:

Selecionando as clulas D11:E37, obtm obtm-se a seguinte representao:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

77

Para comparar as idades dos deputados dos diferentes grupos parlamentares, considermos os 5 conjuntos de dados referentes s idades respetivas, , a partir dos quais se obtiveram as estatsticas cas do quadro seguinte:

Agora, para obter os 5 diagramas, em vez de 2 sries de pontos como no caso anterior, necessrio considerar 5 sries de pontos, todas separadas de clulas vazias e incrementando as ordenadas de cada srie de 3 unidades (ou outro valor se se pretender os diagramas mais afastados ou mais juntos). O resultado final o que se apresenta a seguir:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

78

As etiquetas correspondentes aos grupos parlamentares foram introduzidas como texto.

2.4 Alguns exemplos


A seguir apresentamos alguns exemplos, sobre a forma de projetos, , para os quais podemos utilizar vrios tipos de representaes grficas, algumas j referidas anteriormente, outras introduzidas pela primeira vez, mas que apresentam realizao imediata com o Excel. Projeto 1 - Neste projeto so apresentados alguns dados relativamente Modificao da Estrutura das Categorias de Penses entre 1993 e 2001 (em pontos percentuais) (Eurostat Statistiques en bref Population et conditions sociales, 8/2004):
Velhice
Eu-15 Blgica Alemanha Grcia Espanha Frana Irlanda Itlia Luxemburgo Holanda ustria Portugal Finlndia Dinamarca Sucia Reino-Unido 2,8 3,2 1,1 1,9 3,3 2,6 -7,1 4,1 2 6,2 0,2 6,6 4,1 0,3 1,4 3,3

Sobrevivncia
-0,8 -2,1 -0,5 1,5 -3 -1,1 0 -0,7 -1,1 0,2 -2,4 -0,4 -0,5 0 -0,3 0,3

Invalidez
-1,7 -0,4 -0,7 -1,5 -1 -0,8 3,1 -2,2 0 -5,9 -2,9 -5,2 -2,7 -0,8 -1,4 -3,6

Pr-reforma
-0,4 -0,7 0,1 -1,7 0,7 -0,7 4 -1,3 -0,9 -0,4 5,1 -1 -0,8 0,5 0,3 0

Uma forma adequada para representar estes dados, atravs de um diagrama de barras, nomeadamente barras horizontais, selecionando Insert Bar Stacked Bar:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

79

Vamos fazer alguma cosmtica na representao grfica anterior, nomeadamente mudando a escala para 8 8 a 8 e fazendo com que as legendas no se sobreponham ao grfico:

Projeto 2 Entre os dois ltimos recenseamentos da populao portuguesa, os Censos 91 e os Censos 2001, realizados, respetivamente, em 15 de Abril de 1991 e 12 de Maro de 2001, verificou-se se que a populao residente no territrio nacional passou de 9.867.147 9.867.147 para 10.356.117 habitantes, a que corresponde um acrscimo de 4.8%. Na generalidade das regies verificou-se se um aumento da populao, com exceo das regies do Alentejo e Madeira. Partindo dos resultados censitrios definitivos, estimou-se estimou a populao o residente em 31 de Dezembro de 2002 em 10.407.500 indivduos, dos quais 5.030.200 do sexo masculino. Apresentam-se se a seguir algumas tabelas e grficos com alguns indicadores (www.ine.pt): 1.Nados-vivos vivos segundo a filiao 2002
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

80

Uma representao adequada quada para a tabela anterior o diagrama circular. Assim, vamos selecionar InsertChart Pie 1subtipo Layout Data labels:
5,10% 20,40% Fora casamento (sem coabitao) Fora casamento (com coabitao) Dentro do casamento 74,50%

Nados-vivos vivos segundo a filiao, por regies:

Acrescentmos tabela do lado esquerdo, retirada da pgina pgina do INE, uma outra coluna com os filhos fora do casamento e optmos por uma representao em barras verticais:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

81

100% 80% 60% 40% Fora do casamento 20% 0%


Portugal
Alentejo Algarve

Dentro do casamento

Norte

Centro

Observao: Foi possvel optarmos pela representao grfica anterior, uma vez que os dados das duas caractersticas em estudo somavam 100%. Outra representao possvel obtm-se obtm selecionando InsertColumn 1subtipo: 100% 80% 60% 40% Dentro do casamento 20% Fora do casamento 0%
R.A.Aores

Portugal

Lisboa e Vale do Tejo

Algarve

Centro

Lisboa e Vale do Tejo

2. Taxa de mortalidade fetal tardia (Taxa mft) (28 ou mais semanas de gestao): 1960 1965 1970 1975 1980 1985 1990 1995 2000 26.5 23.2 21.7 15.2 11.8 9.6 6.9 5.5 3.7

R.A.Madeira

Norte

Alentejo

R.A.Madeira

R.A.Aores

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

82

3.4 2002 Introduzimos a tabela anterior numa numa folha de Excel e antes de procedermos a uma representao grfica passmos os pontos para vrgulas e retirmos a permilagem, no reconhecida no Excel.

Seguidamente depois de selecionar as clulas A20 a B30, selecionmos Insert Scatter 4subtipo:

A representao grfica anterior s ficar completa depois de acrescentar os ttulos aos eixos.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

83

30 20 10 0 1950

Taxa mft

1960

1970

1980 Ano

1990

2000

2010

Chamamos a ateno para o facto de ser possvel obter uma representao aparentemente semelhante anterior utilizando a opo Chart Line 4subtipo:

Repare-se, se, no entanto, que a representao anterior no est correta, , pois a varivel tempo do eixo dos xx est a ser interpretada como uma varivel qualitativa e no quantitativa como deveria ser. Assim, o intervalo entre 1995 e 2000 igual igual ao intervalo entre 2000 e 2002, o que obviamente no est correto. correto 3. Taxa de mortalidade infantil
1960 1965 1970 1975 1980 1985 1990 1995 2000 2002 77.5 64.9 58.0 38.9 24.3 17.8 10.9 7.5 5.5 5.0

A representao grfica dos dados desta desta tabela pode ser idntica do ponto anterior.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

84

4. Casamentos segundo a forma de celebrao


Unidade % 1960 1965 1970 1975 1980 1985 1990 1995 2000 2002 Civil 9.2 11.8 13.4 20.0 25.3 25.9 27.5 31.2 35.2 37.5 Catlico 90.8 88.2 86.6 80.0 74.7 74.1 72.5 68.8 64.8 62.5

Para esta tabela pode-se se usar uma representao grfica idntica usada no ponto 1, para mostrar a percentagem de filhos dentro e fora do casamento. 5. Populao estrangeira com estatuto legal de residente segundo a nacionalidade
Amrica Europa frica Outros 17,1% 30,2% 47,8% 4,9%
Angola frica Cabo Verde Guin Bissau Outros 10,3% 21,9% 8,0% 7,6%

Para fazer uma representao destes dados recorremos a um diagrama em Pie (circular), mas num subtipo especial que permite visualizar visualizar a forma como frica est repartida. Assim considere-se se a seguinte tabela em Excel, ocupando as clulas A44 a B50 e selecione selecione-se Chart Pie 4subtipoLayoutData labels:

Para incluir Cabo Verde na parte direita do grfico carregar carregar com o boto direito do rato em qualquer parte do grfico e selecionar Format Data Series Second plot contais the last: 4 Close. Formatar convenientemente o grfico e por ltimo substituir Other (com 47,8%) por frica:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

85

Para representar os dados da tabela seguinte


Africana(1) 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 45 48 52 58 73 79 81 82 83 90 99 107 Europeia 31 33 35 35 42 45 47 50 52 57 57 67 Outra 31 33 37 44 43 44 44 44 43 45 52 50 52

114 72 (1)Unidade 103

podemos considerar o 2 subtipo de Column (chama-se se a ateno para que neste caso no seria correto utilizar o 3 subtipo de Column, uma vez que so dadas as frequncias absolutas e no as frquncias relativas):

ou o 2 subtipo de Scatter, o chamado diagrama d ou grfico de linha:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

86

Como vimos h vrias representaes grficas para os dados de uma mesma tabela, umas mais sugestivas ou mais informativas do que outras. Por exemplo, entre as duas representaes grficas anteriores, para os mesmos dados, sugerimos sugerimos esta ltima por ser de mais fcil leitura e transmitir melhor a informao que se pretende preten e transmitir no que respeita a evoluo ao longo do tempo da varivel em estudo, assim como a comparao entre as diferentes colees de dados. Projeto 3 Construo nstruo de pirmides etrias. A partir dos seguintes dados obtidos em www.pordata.pt construa a pirmide etria para a populao residente do sexo masculino, para comparar os anos de 1960 a 2001.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

87

Da tabela anterior vamos selecionar os dados referentes a 1960 e 2001, que colocamos numa folha de Excel, como se apresenta a seguir: seguir

Na pirmide etria que se vai construir, vamos colocar do lado esquerdo os dados referentes a 1960 e do lado direito os referentes a 2001 (Nota Numa pirmide etria para comparao dos sexos masculino e feminino segundo as classes etrias, considera-se considera se o sexo masculino do lado esquerdo e o feminino do lado direito). Para a construo da pirmide etria, seguir os seguintes passos: 1. Multiplicar por -1 1 os dados referentes a 1960;

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

88

2. Seleccionar as clulas que contm os dados e os ttulos A1:C17 e fazer InserirBarStacked Bar

3. Para mover o eixo vertical para a esquerda, com o grfico seleccionado, fazer LayoutAxesPrimary Vertical AxesMore Primary rimary Vertical Axes OptionsAxis LabelsLowClose

4. Para apresentar os nmeros referentes a 1960 positivos, em vez de nagativos, com o grfico seleccionado, fazer LayoutAxesPrimary Horizontal AxesMore Primary Horizontal Axes OptionsNumberFormat code: 0;0AddClose

5. Basta agora juntar as barras e colocar a legenda em cima para obter a pirmide etria com o seguinte aspecto:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

89

Na representao anterior ntido o envelhecimento da populao residente do sexo masculino. Repare-se se que, no s o nmero de nascimentos tem diminudo, como tambm a longevidade tem aumentado. Projecto 4 Considere os seguintes dados referentes s estimativas anuais da populao residente e retirados do relatrio Estado da Educao 2011 A Qualificao dos Portugueses, Conselho ho Nacional de Educao, www.epatv.pt/.../anolectivo20112012/estado_da_educacao_2011.pdf Ano 2000 Homens Mulheres 3,19% 3,04% 3,82% 3,66% 3,84% 3,67% 4,59% 4,48% 3,95% 3,92% 3,66% 3,69% 3,66% 3,79% 3,45% 3,58% 3,22% 3,41% 2,99% 3,22% 2,60% 2,92% 2,47% 2,85% 2,36% 2,84% 1,90% 2,49% 1,38% 1,98% 0,73% 1,21% 0,46% 1% Ano 2010 Mulheres 2,84% 3,54% 3,02% 3,33% 3,31% 3,82% 3,94% 3,70% 3,74% 3,48% 3,27% 3,05% 2,73% 2,54% 2,32% 1,70% 1,29%

0a5 6 a 12 13 a 18 19 a 24 25 a 29 30 a 34 35 a 39 40 a 44 45 a 49 50 a 54 55 a 59 60 a 64 65 a 69 70 a 74 75 a 79 80 a 84 >=85

Homens 2,99% 3,73% 3,14% 3,46% 3,41% 3,88% 3,96% 3,65% 3,59% 3,30% 3,00% 2,70% 2,27% 2,01% 1,65% 1,02% 0,63%

Nota: escales entre os 0 e os 24 anos foram divididos de acordo com as idades correspondentes aos nveis de escolaridade

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

90

Para comparar a populao residente construiu-se construiu se a seguinte pirmide etria, seguindo o processo descrito anteriormente: rmente:

Uma alternativa pirmide anterior obtm-se obtm considerando Clustered Bar em vez de Stacked Bar:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

91

3. Caractersticas amostrais. Medidas de localizao e disperso


3.1- Introduo
No mdulo de Estatstica foram apresentadas as medidas ou estatsticas estatsticas que se utilizam para resumir a informao contida nos dados. Destas medidas, destacam-se destacam se as medidas de localizao, nomeadamente as que localizam o centro da amostra, e as medidas de disperso, que medem a variabilidade dos dados. Neste captulo no nos debruaremos sobre as propriedades destas medidas, j apresentadas no mdulo referido anteriormente, abordando sobretudo a forma de as calcular, utilizando o Excel. Convm desde j adiantar que este um trabalho grandemente facilitado pelo facto de existirem istirem funes no Excel que nos do diretamente estas medidas. Para facilidade de exposio vamos representar a amostra de dimenso n por x1, x2, ..., xn onde x1, x2, ..., xn representam, respetivamente, , os resultados da 1 observao, da 2 observao, da n-sima sima observao, a serem recolhidas, no pressupondo qualquer ordenao.

3.2 Medidas de localizao


Como medidas de localizao, vamos apresentar a mdia, mediana e quartis. 3.2.1 Mdia A mdia uma medida de localizao do centro da distribuio dos dados. Dada a amostra x1, x2, ..., xn, a mdia representa-se representa por x e obtm-se se adicionando todos os elementos e dividindo o resultado por n. Em Excel, determina-se determina a mdia atravs da funo AVERAGE (), que retorna a mdia aritmtica a dos seus argumentos, que podem ser nmeros ou endereos de clulas. Exemplo 3.2.1 Retomemos a amostra do exemplo 2.3.2, constituda pelo nmero de filhos de 30 deputados: 2, 1, 2, 3, 0, 0, 1, 1, 4, 1, 2, 1, 0, 0, 0, 2, 3, 1, 1, 6, 3, 1, 3, 2, 0, 1, 2, 0, 2, 3 Calcule a mdia da amostra. Considermos o ficheiro Filhos, construdo no exemplo 2.3.2, em que os elementos de que se pretende calcular a mdia ocupam as clulas A2 a A31:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

92

Para calcular a mdia pretendida, assim como para qualquer outro conjunto conjunto de dados de tipo discreto, podemos proceder de dois modos, quer considerando os dados originais, quer agrupados. 1- Clculo da mdia, a partir dos dados originais, utilizando a funo AVERAGE(): Colocar o cursor na clula onde se pretende colocar a m mdia, dia, por exemplo a clula E11, e inserir a funo AVERAGE(A2:A31) os argumentos desta funo so os endereos onde esto os elementos da amostra. Como resultado obtm-se obtm se o valor 1,6, que se apresenta na figura seguinte.

2- Clculo da mdia, a partir do dos dados agrupados: Adicionar tabela de frequncias uma nova coluna com o produto dos valores que constituem as classes, pelas respetivas frequncias relativas (Clulas H3 a H9) e somar os valores obtidos (Clula H10):

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

93

No caso de dados discretos, como o caso anterior, o valor da mdia o mesmo, quer seja calculada utilizando os dados originais, quer os dados agrupados (utilizando as frequncias relativas), em que as classes do agrupamento so os diferentes valores que surgem na amostra. O mesmo no acontece contece no caso de dados contnuos, como exemplificamos a seguir. Exemplo 3.2.2 Calcule a mdia das idades dos deputados do ficheiro DeputadosXII. Para obter a mdia das idades procede-se procede se como no primeiro caso do exemplo anterior, a partir dos dados originais. inais. Estes dados encontram-se encontram se nas clulas B2 a B231 pelo que inserindo a funo AVERAGE(B2:B231) numa clula, obtemos o valor de 46,24 anos. Admitindo que no dispnhamos dos dados originais, mas apenas de uma tabela de frequncias com os dados agrupados, agrupados, vejamos como obter um valor aproximado para a mdia. Reportando-nos nos ainda ao ficheiro Idade, , consideremos a tabela de frequncias que serviu para agrupar os dados. Para obter um valor aproximado para a mdia, procedemos da seguinte forma: i) Adicionar tabela ela de frequncias uma nova coluna com os pontos mdios dos intervalos de classe, que se obtm fazendo a semissoma dos limites dos intervalos (clulas J3 a J10); ii) Adicionar tabela uma nova coluna com os produtos dos pontos mdios dos intervalos de classe, pelas frequncias relativas respetivas (clulas K3 a K10); iii) Somar os resultados das clulas K3 a K10 (clula K11):

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

94

Repare-se se que o valor obtido de 46,16 para a mdia, muito prximo do verdadeiro valor (=46,24) obtido com os dados originais. Note-se Note que o valor aproximado obtido para a mdia depende da escolha das classes feita para agrupar os dados. Outro conjunto de classes daria outro valor diferente para o valor aproximado da mdia. 3.2.2 Mediana Outra medida de localizao do centro da distribui distribuio dos dados a mediana. . Ordenados os elementos da amostra, a mediana, m, o valor (pertencente ou no amostra) que a divide ao meio, isto , 50% dos elementos da amostra so menores ou iguais a m e os restantes 50% so maiores ou iguais a m. Em Excel, determina-se se a mediana atravs da funo MEDIAN(), que retorna a mediana dos seus argumentos, que podem ser nmeros ou endereos de clulas. Exemplo 3.2.3 Calcule a mediana das idades dos deputados. Compare com o valor obtido para a mdia e diga o que poderia deria concluir da forma como os dados se distribuem. Voltando ao ficheiro Idade, , utilizado no exemplo anterior, inserindo numa clula a funo Median(B2:B231) obtm-se, se, como retorno, o valor 46. O valor obtido para a mediana aproximadamente igual ao da mdia, pelo que podemos admitir que a distribuio aproximadamente simtrica. Se os dados se apresentarem agrupados, j vimos na seco 3.2.2 do captulo 2, um processo de obter a mediana atravs da funo cumulativa. No entanto, no necessrio construir ir esta funo para obter um valor aproximado para a mediana, pois este pode ser obtido a partir da tabela de frequncias, utilizando ainda o processo de interpolao. Exemplo 3.2.4 A partir do agrupamento considerado, no exemplo 2.3.3, para a varivel idade, dade, calcule um valor aproximado para a mediana.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

95

Adicionando tabela de frequncias uma nova coluna com as frequncias relativas acumuladas, verificamos que a mediana se encontra na classe [42,1; 47,8[, pois a frequncia acumulada de 50% atingida nesta classe:

Admitindo que a frequncia se distribui uniformemente sobre a amplitude de classe, isto , a frequncia 0,161 se distribui uniformemente sobre o intervalo de amplitude 5,7, resolvendo a equao de proporcionalidade

0,161 5,7 = 0,113 x

x=

0,113 5,7 = 4,35 0,161

onde 0,113=0,5-0,387, 0,387, obtemos para a mediana o valor aproximado 42,1 + 4,35 = 46,45. Chamamos a ateno para o seguinte facto: tal como j acontecia para a mdia, o valor (aproximado) que se obtm para a mediana, depende do agrupamento que se fizer para os dados, s, pelo que agrupamentos diferentes daro origem a valores diferentes, embora no difiram muito uns dos outros (Lembramos que o valor da mediana apresentado anteriormente de 46 anos foi obtido a partir dos dados no agrupados). 3.2.3 Quartis Os quartis, 1 e 3, definem-se se de forma idntica mediana, mas considerando em vez da percentagem de 50%, respetivamente 25% para o 1 quartil, Q1, e 75% para o 3 quartil, Q3. H vrios processos para a determinao dos quartis, nem sempre conduzindo aos mesmos resultados. sultados. Este facto no preocupante, pois de um modo geral nas situaes que tm interesse em estatstica, as amostras tm dimenso suficientemente elevada de forma que os diferentes processos conduzem a valores prximos. Em Excel a determinao dos quartis qua faz-se utilizando a funo QUARTILE(array;quart):

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

96

Repare que a funo Quartile(array;quart) tem dois argumentos, em que o primeiro argumento o endereo das clulas de que queremos calcular o quartil e o segundo argumento pode tomar vrios valores, c conforme onforme a medida de localizao, de entre as seguintes, que nos interesse calcular:
0 mnimo 1 1 quartil 2 mediana 3 3 quartil 4 mximo

Assim, esta funo, alm do 1 e 3 quartis, a que esto associadas as percentagens 25% e 75%, respetivamente, , ainda calcula a mediana, a que est associada a percentagem de 50% e o mnimo e mximo com percentagens associadas de 0% e 100%. Exemplo 3.2.5 Escolha os primeiros 15 elementos da varivel Idade, do ficheiro Idade. Obtenha o 1 e 3 quartis. Os primeiros iros 15 elementos so os seguintes:

48 52 54 34 46 47 67 64 66 42 34 38 36 27 49
Utilizando a funo QUARTILE(B2:B16;1) e QUARTILE(B2:B16;3), obtemos Q1=37 e Q3=53. Se utilizar o processo que aprendeu no mdulo de Estatstica, nomeadamente considerando o 1 quartil como a mediana da primeira parte da amostra, quando esta dividida pela mediana, depois de ordenar a amostra e tendo em conta que a mediana 47, temos para 1 quartil o

27 34 34 36 38 42 46 47 48 49 52 54 64 66 67
valor 36, se no considerarmos mos a mediana como pertencente a nenhuma das partes, ou 37 se considerarmos a mediana pertencente s duas partes. Para o 3 quartil obteremos, respetivamente o valor 54 ou 53, utilizando a mesma metodologia. Exemplo 3.2.5 (cont) Repita o exemplo anterior, anterior, considerando amostras de dimenso 12 e 13. Considere agora s os primeiros 12 elementos. Como a mediana 44, o 1 quartil mediana da 1 parte da amostra, ser (34+36)/2=35, enquanto que o 3 quartil ser (48+49)/2=48,5.

27 34 34 36 38 42 46 47 48 49 52 54
Utilizando o Excel, os valores que se obtm so Q1=35,5 e Q3=48,25. Considere agora os primeiros 13 elementos. Como a mediana 46, o 1 quartil mediana da 1 parte da amostra, ser (34+36)/2=35, enquanto que o 3 quartil ser (49+52)/2=51,5, no considerando onsiderando a mediana como pertencente a nenhuma das partes. Caso contrrio, teremos Q1=36 e Q3=49.

27 34 34 36 38 42 46 47 48 49 52 54 64

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

97

Utilizando o Excel, os valores que se obtm so Q1=36 e Q3=49. Obervao: Repare que os valores que se obtm para os quartis, recorrendo ao Excel no so iguais aos que se obtiveram sem utilizar o Excel. Efetivamente no existe uniformidade na forma de calcular os quartis, como j havamos referido anteriormente, embora os resultados obtidos satisfaam a definio de quartis. quartis. Exemplificando com a mediana, repare que pela definio de mediana, quando o nmero de elementos da amostra par, podemos considerar para mediana qualquer valor compreendido entre os dois elementos mdios da amostra ordenada! No costume deixar esta esta opo ao critrio de cada um e considera considera-se a semissoma desses elementos mdios. Voltando aos quartis, pode verificar que, no Excel, o 1 quartil corresponde observao de ordem (n+3)/4, procedendo-se se a uma interpolao, quando necessrio (Sugesto Tente descobrir como calculado o 3 quartil no Excel).

3.3 Medidas de disperso


Continuando na mesma linha de apresentao das medidas de localizao, tambm agora no nos vamos preocupar com as propriedades das medidas de disperso, pois admitimos que estas j foram estudadas no mdulo de Estatstica. Debruar-nos-emos Debruar emos sobre o seu clculo, utilizando o Excel. A seguir apresentaremos o clculo da varincia, desvio padro e amplitude interquartil. interquartil 3.3.1 Varincia e desvio-padro padro A varincia de um conjunto njunto de dados obtm-se obtm se fazendo a mdia dos quadrados dos desvios dos dados, relativamente mdia. O Excel, tal como as mquinas de calcular, dispe de duas funes para calcular a varincia, conforme estejamos a calcular a varincia populacional (parmetro) (parmetro) ou a varincia amostral (estatstica).

Resumimos no quadro seguinte a situao de estarmos a calcular parmetros ou estatsticas.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

98

Populao de N elementos x1, x2, ..., xN Valor mdio = x1 + x 2 + ... + xN


N

Amostra de n elementos x1, x2, ..., xn Mdia


x + x 2 + ... + xn x = 1 n

Varincia populacional 2 = (x1 )


2

Varincia amostral s2 =
(x1 x)2 + (x 2 x)2 + ... + (xn x)2 n 1

+ (x 2 )2 + ... + (xN )2 N

Desvio padro populacional

Desvio padro amostral s

Em Excel as funes utilizadas para calcular a varincia varincia populacional e amostral, so respetivamente VAR.P() e VAR.S(). Como argumento utiliza-se se a sequncia de nmeros de que se quer calcular a varincia, ou o endereo das clulas que os contm. Por exemplo, no caso da populao dos deputados, que temo temos s vindo a estudar, temos informao completa sobre a varivel Idade, pelo que a frmula que deve ser utilizada para obter a varincia a VAR.P, isto , esta frmula d-nos d nos a varincia populacional. Se s dispusssemos da idade de alguns deputados, isto , uma amostra da populao em estudo, ento a frmula a utilizar seria a VAR.S, que d a varincia amostral. A maneira de calcular as duas varincias idntica, diferindo unicamente no seguinte ponto: enquanto que no caso da varincia populacional se divide divide a soma dos quadrados dos desvios pelo nmero de parcelas, no caso da varincia amostral divide-se divide se a soma dos quadrados dos desvios pelo nmero de parcelas menos uma. O desvio padro obtm-se se fazendo a raiz quadrada da varincia ou utilizando uma funo prpria. rpria. Como evidente, existem tambm duas frmulas para o calcular, obtendo obtendo-se o desvio padro populacional ou amostral, conforme a frmula utilizada: STDEV.P() ou STDEV.S() respetivamente. Exemplo 3.3.1 A partir do ficheiro Idade, selecione uma amostra ra aleatria simples de dimenso 40. Calcule a varincia e o desvio padro da amostra obtida. Calcule de seguida a varincia da populao constituda pelas idades dos 230 deputados e compare com a varincia da amostra obtida anteriormente. Utilizando o processo cesso descrito em 1.3.1.2, selecionmos uma amostra de 40 elementos que posteriormente colocmos nas clulas F2 a I11, de uma nova folha de Excel. Colocando agora o cursor na clula onde pretendemos colocar a varincia, por exemplo na clula K5, inserimos a funo VAR.S(F2:I11) e a funo retorna um valor aproximadamente igual a 115, para a varincia da amostra.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

99

Para calcular a varincia da populao das idades, inserimos na clula J12 a funo VAR.P(B2:B231), obtendo-se se um valor aproximadamente igual a 106: 106

Comparando as varincias, vemos que no so iguais, o que j seria de esperar, uma vez que a varincia amostral foi obtida a partir de 40 dos 230 dados e uma estimativa da varincia populacional. Se recolhermos outra amostra, tambm de 40 elementos, no esperamos obter o mesmo valor para a estimativa. Esperamos sim, obter valores aproximados. Para calcular o desvio padro, ou se calcula a raiz quadrada (positiva) do valor da varincia, ou se utilizam as funes STDEV.S() ou STDEV.P(), conforme se pretenda enda o desvio padro amostral ou populacional. No nosso caso os desvios padres amostral e populacional vm, respetivamente, , aproximadamente iguais a 10,7 e 10,3. 3.3.2 Amplitude e amplitude interquartil A amplitude da amostra (no confundir com dimenso dimenso da amostra), R, a medida mais simples para medir a variabilidade, mas tem a grande desvantagem de ser muito sensvel existncia na amostra, de uma observao muito pequena ou muito grande. No existe, no Excel, uma funo especfica para a calcular, recorrendo-se s funes MAX() e MIN(). J tivemos, , alis, oportunidade de utilizar estas funes quando necessitmos de calcular a amplitude de um conjunto de dados, para obter a tabela de frequncias, com o objetivo de construir um histograma, com classes classe de igual amplitude. Uma medida mais resistente do que a anterior, a amplitude interquartil que, como o nome indica, se define como a diferena entre os 1 e 3 quartis. Exemplo 3.3.2 Calcule a amplitude e a amplitude interquartil da amostra obtida no exemplo anterior. Como os elementos da amostra se encontram nas clulas F2 a I11, temos: R = MAX(F2:I11) MIN(F2:I11) = 44

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

100

Recorrendo terminologia usada quando definimos os quartis, temos: Amplitude interquartil= QUARTILE(F2:I11;3) QUARTILE(F2:I11;1) = 12,25.

3.4 Funo Descriptive Statistics


O Excel dispe de uma funo a que se acede selecionando Data Data

AnalysisDescriptive Statistics OK cujo resultado o que se apresenta a seguir para o ficheiro Idade:

Algumas das funes j so conhecidas das seces anteriores. Chamamos a ateno para o facto de a varincia das 230 idades no coincidir com com o valor obtido na seco 3.3.1, uma vez que quando se considera um conjunto de dados e se pedem as Estatsticas descritivas, subentende-se se que se est perante uma amostra e no da populao toda! Por esta razo, a frmula utilizada para o clculo da varincia vari a da varincia amostral. As funes Standard Error, Kurtosis e Skewness saem fora do mbito estas folhas, pelo que no entraremos em detalhe.

4. Dados bivariados 4.1- Introduo


No mdulo de Estatstica foi feita referncia a dados bidimensionais, bidimensionais, de tipo quantitativo. Quando dispomos de uma amostra de dados bivariados, a qual pode ser representada na

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

101

forma (x1, y1), (x2, y2),..., (xn, yn), apresentamos esta informao atravs de uma representao grfica a que se d o nome de Diagrama de disperso: dispers Diagrama de disperso uma representao grfica para os dados bivariados, em que cada par de dados (xi, yi), representado por um ponto de coordenadas (xi, yi), num sistema de eixos coordenados. J vimos no captulo 2, a forma de representar, em Excel, Excel, dados bivariados, utilizando a opo XY(Scatter). No apresenta qualquer dificuldade a construo desta representao grfica, uma vez que basta proceder da seguinte forma:
Selecionar as clulas que contm os dados, organizados em 2 colunas; Selecionar Insert Scatter e o sub-tipo sub pretendido; Formatar convenientemente a representao obtida (retirar a legenda, retirar as linhas de grelha, etc).

Quando se trata de dados qualitativos, no tem sentido proceder representao grfica dos dados atravs de um diagrama de disperso. No entanto, possvel organizar essa informao na forma de tabelas de contingncia (que alis tambm podem ser usadas para dados quantitativos, quer discretos, quer contnuos, depois de proceder sua discretizao, ou seja, organizao ganizao em classes). Vamos, neste captulo, introduzir uma metodologia que utiliza uma ferramenta do Excel, a PivotTable, que alm de permitir construir tabelas de contingncia, tambm pode ser utilizada para proceder a agrupamentos de dados qualitativos ou quantitativos.

4.2 Tabelas de contingncia A funcionalidade PivotTable


Suponhamos que estamos interessados em estudar a associao entre variveis de tipo qualitativo como, por exemplo, sexo e religio. Uma forma de apresentar os dados utilizando tabelas de contingncia. Exemplo 4.2.1 Uma empresa decidiu estudar o seu pessoal quanto ao estado civil e sexo. Representando por M e F as categorias da varivel Sexo, e por C (casado(a)), S

(solteiro(a)), D (divorciado(a)) e V (vivo(a)), obteve a seguinte seguinte lista: (M,C), (M,S), (F,C), (F,C), (F,S), (M,D), (F,S), (F,V), (F,C), (F,S), (M,C), (F,S), (F,C), (F,V), (M,S), (M,C), (F,S) (Este exemplo fictcio e serve unicamente para introduzir o estudo das tabelas de contingncia, pois os casos interessantes em Estatstica envolvem amostras de maior dimenso). Comemos por introduzir estes dados numa folha de Excel, colocando nas clulas A1 e B1 os ttulos, respetivamente Sexo e Estado Civil, e nas clulas A2 a A18 a informao sobre o sexo dos 17 elementos e nas clulas B2 a B18, o respetivo estado civil:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

102

Para criar uma tabela, utilizando a funcionalidade PivotTabbe, proceder do seguinte modo:
Colocar o cursor em qualquer clula do interior da tabela e selecionar InsertPivotTable e inserir a informao de acordo com a figura seguinte

obtendo-se como resultado:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

103

Arrastar o boto Sexo da barra PivotTable, e coloc-lo no campo Row Labels; Arrastar o boto Estado civil da barra PivotTable, e coloc-lo coloc no campo Column Labels; Arrastar qualquer dos botes a anteriores e coloc-lo no campo Values:

Finalmente temos a tabela de contingncia desejada, que nos d a distribuio conjunta (em valores absolutos) do par (Sexo, Estado civil), permitindo obter o nmero de indivduos que satisfazem simultaneamente cada uma das modalidades (feminino(a),casado(a)),

(feminino(a),divorciado(a)), ...(masculino(a),vivo(a)):

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

104

O facto da clula correspondente s categorias F e D estar vazia, significa que no havia indivduos do sexo feminino e divorciados. Esta tabela apresenta apresenta ainda as distribuies marginais (em valores absolutos) da varivel Sexo e Estado civil, respetivamente nas clulas K4 a K5 e G6 a J6. Efetivamente, Efetivamente atravs da tabela, pode-se se concluir que o nmero de indivduos do sexo feminino 11, enquanto que do sexo sexo masculino 6. Analogamente, tambm podemos tirar concluses sobre o nmero de indivduos em cada modalidade da varivel Estado civil. Exemplo 4.2.1 (cont) - Suponhamos que ao recolher a informao, junto de cada indivduo, sobre o seu estado civil, tam tambm bm se tinha investigado sobre o nmero de filhos (esta informao relevante para o servio de processamento de salrios proceder reteno do IRS). Construa uma tabela de contingncia para o par (Sexo, Estado civil). Inserimos a informao sobre a vari varivel vel N de filhos, e procedemos construo da tabela de contingncia:

Esta tabela, que resulta das operaes anteriores, no a que nos interessa, uma vez que apresenta Sum of N filhos, em vez de Count of N filhos. agora necessrio clicar no campo Sum of N filhos e selecionar Value Field SettingsCount. Nesta 2 tabela temos a distribuio conjunta do par (Sexo, N de filhos):

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

105

Exemplo 4.2.1 (cont) Proceda como no exemplo anterior, excepto no passo em que o boto da varivel que arrasta para o campo Data, o boto da varivel Estado civil. Com este procedimento obteramos uma tabela igual anterior, com as contagens, em vez das somas, j que Count a opo que est selecionada, , por defeito, quando colocamos no campo Data uma varivel no numrica. num

4.3 Utilizao das PivotTables para agrupar dados


Quando temos um conjunto de dados, j vimos no Captulo 2 a forma de proceder ao seu agrupamento. Vamos agora ver, como essa tarefa pode ser feita atravs da funcionalidade PivotTable.

4.3.1 Dados s de tipo qualitativo


Vamos voltar ao ficheiro DeputadosXII (de que apresentamos a seguir uma pequena parte)

para exemplificar a construo de uma tabela de frequncias de uma varivel qualitativa, utilizando a PivotTable. Exemplo 4.3.1 Utilizando a PivotTable, proceda ao agrupamento de dados da varivel Grupo parlamentar, do ficheiro DeputadosXII.
Colocar olocar o cursor num ponto qualquer da tabela; Selecionar o local onde se pretende inserir a tabela;

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

106

Selecionar InsertPivotTable PivotTable Arrastar o boto to Grupo parlamentar da barra PivotTable, e coloc-lo no campo Row; Arrastar o boto Grupo parlamentar e coloc-lo lo no campo Values:

O procedimento anterior conduziu-nos conduziu nos tabela do lado esquerdo da figura anterior, q que com algumas transformaes estticas apresenta o aspeto da tabela do lado direito. Se estivermos interessados em saber como se distribuem os deputados de cada grupo parlamentar, pelos diferentes crculos eleitorais, basta arrastar o boto Crculo eleito eleitoral para o campo Row:

Apresentamos s parte da tabela devido sua extenso. Aqui possvel ver como se distribuem os deputados do BE. Se carregar com o cursor no stio indicado pela seta, volta tabela inicial unicamente com os totais por grupo parlamentar. lamentar.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

107

4.3.2 Dados de tipo discreto


A organizao de dados discretos numa tabela de frequncias, utilizando a PivotTable, fazse do mesmo modo que para os dados de tipo qualitativo. Vamos exemplificar procedendo ao agrupamento da varivel N de filhos fi dos dados do ficheiro Filhos. Exemplo 4.3.2 - Utilizando a PivotTable, proceda ao agrupamento de dados da varivel N de filhos, do ficheiro Filhos.
Colocar o cursor em alguma clula da tabela (colocmos na clula c lula A5), e selecionar

InserirPivotTablePivotTable e proceder de acordo com a figura seguinte:

Arrastar o boto N filhos da barra PivotTable, e coloc-lo no campo Row; Arrastar o mesmo boto e coloc-lo no campo Values;

Clicar no campo Sum of N filhos e selecionar Value Field SettingsCount

O resultado destas operaes apresentado na figura seguinte:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

108

A tabela anterior pode ser modificada de modo a ficar com um aspeto mais usual:

Para construir o diagrama de barras associado tabela anterior basta, com a tabela selecionada, selecionar na a barra menu OptionsPivotChartColumn, obtendo-se se a seguinte representao:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

109

Ateno! O grfico anterior, em que se procura representar num diagrama de barras a distribuio dos dados referente varivel N de filhos, no est correto! ! Num diagrama ou grfico de barras referente a dados discretos, devem ser consideradas como classes todos os valores entre o mnimo e o mximo, mesmo que tenham frequncia nula. Neste caso falta a classe referente ao nmero 5, pelo que uma soluo copiar os valores dados pela tabela para outras clulas do Excel, inserir a classe 5 com frequncia nula e construir o diagrama de barras como se viu na seco 2.3.1.2.

4.3.3 Dados de tipo contnuo


Vamos exemplificar o agrupamento de uma varivel de tipo contnuo, utilizando a PivotTable, mas avisamos desde j que, se os dados no forem inteiros, o processo tem de ser utilizado com as devidas precaues. Comearemos por abordar a situao de termos uma varivel contnua, mas em que os dados so inteiros. 1 parte Dados em formato rmato de inteiro Exemplo 4.3.3 Considere o ficheiro Idade, , que contm a idade de 230 deputados. Proceda ao agrupamento em classes, utilizando a funcionalidade PivotTable. Considere o ficheiro Idade, , em que os dados da varivel se encontram nas clulas A2 a A231 e seguindo o processo utilizado para agrupar os dados referentes varivel N de filhos, hos, obtivemos uma tabela, de que mostramos parte, na figura seguinte:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

110

A tabela mostra a frequncia de cada valor individual (como estamos com dados contnuos, embora mbora inteiros, corremos o risco de termos uma tabela com tantas classes, quantos os dados, todos com frequncia igual a 1!). Assim, necessrio proceder a mais algumas operaes, para agrupar os dados:
Clique em algum dos dados da varivel Idade na tabela tabel (clicmos no 25) e selecione Data

GroupGroup, que faz surgir o seguinte dilogo:

Por defeito, no dilogo anterior considerado como Starting at e Ending at respetivamente, respetivamente o mnimo e o mximo do conjunto de dados a agrupar. Para By considerado, tambm por defeito, um valor que qu depender do nmero de dados e da grandeza desses dados. Clicando em OK, produzida a seguinte tabela de frequncias:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

111

Observao: Repare-se se que na construo desta tabela, ao dizer que pretendemos que o agrupamento seja feito By:10, no significa que se adicione 10 ao mnimo para formar a 1 classe e assim por diante. No entanto os intervalos de classe tm, efetivamente, , amplitude 10, pois so os seguintes intervalos: intervalos [25-35[, [35-45[, [45-55[, [55-65[ e [65-75[. Para construir o histograma associado a esta tabela, basta carregar em alguma parte da tabela e na barra menu OptionsPivotChartColumn:

Por defeito aparece a construo de um grfico de barras, com intervalos entre as barras, que podem ser removidas por um processo idntico ao j utilizado, utilizado, aquando da construo do histograma no captulo 2. Assim, temos:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

112

Finalmente podemos esconder os botes clicando com o lado direito do rato num deles e selecionando

Hide All Field Buttonson Chart e acrescentando de seguida ttulos aos eixos:

2 parte Dados em formato decimal Como vimos na construo das classes da tabela anterior, estas so construdas sem ambiguidade, na medida em que qualquer elemento do conjunto de dados s pode pertencer a uma nica classe. O mesmo no acontece se estivermos a trabalhar trabalhar com dados com casas decimais, como veremos no exemplo seguinte. Exemplo 4.3.4 Considere os seguintes dados referentes s alturas de 100 alunos escolhidos aleatoriamente numa escola:
1,09 1,4 1,44 1,52 1,36 1,38 1,31 1,25 1,06 1,38 1,38 1,4 1,27 1,36 1,33 1,23 1,02 0,95 1,23 1,17

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

113

1,33 1,3 1,31 1,25 1,34 1,26 1,44 1,32

1,4 1,33 1,33 1,34 1,3 1,33 1,45 1,36

1,4 1,4 1,42 1,32 1,26 1,32 1,37 1,36

1,42 1,35 1,3 1,4 1,42 1,3 1,45 1,41

1,2 1,22 1,22 1,26 1,13 1,28 1,22 1,29

1,4 1,29 1,3 1,52 1,3 1,42 1,46 1,3

1,32 1,31 1,3 1,3 1,51 1,27 1,2 1,21

1,17 1,18 1,25 1,3 1,2 1,16 1,02 1,05

0,91 1,08 1,08 1,1 0,95 1,15 1,15 1,05

1,34 1,27 1,26 1,42 1,4 1,35 1,23 1,29

Inserimos os numa folha de Excel, ocupando as clulas A2 a A101, reservando a A1 para o ttulo Altura. Construmos uma tabela de frequncias, utilizando o processo seguido anteriormente. O resultado obtido foi a seguinte tabela:

Como se verifica, ao contrrio do que acontecia com a varivel Idade, o limite superior de um intervalo igual ao limite inferior do intervalo seguinte, ficando a dvida de saber em que classe inserir um elemento igual a um desses limites. Na verdade estes intervalos funcionam como se fossem fechados esquerda e abertos direita (exceto (exceto a ltima classe que tambm fechada direita), pelo que um valor igual, por exemplo, a 1,01, ser contabilizado na classe 1,01-1,11. 1,01 1,11. Este problema pode ser resolvido, a maior parte das vezes, considerando para amplitude de classe um valor decimal, com uma casa decimal a mais do que ue os dados. No exemplo anterior, vamos escolher para amplitude de classe o valor 0,088, sugerido pela aplicao da regra de Sturges:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

114

O problema no ficou totalmente resolvido, pois ainda existe a ambiguidade (aparente) relativamente ao valor 1,35. Resol Resolveramos veramos o problema da ambiguidade considerando como amplitude de classe 0,0879! Nesta altura convm refletir tir sobre o que diz Neville Hunt no artigo intitutado Handling Continuous data in Excel,na na revista Teaching Statistics (Volume 25, Number 2, Summer 2003), pgina 45, e passamos a citar : ...After reading this article, some teachers will (not unreasonably) decide that Excel is not fit to be used for this type of analysis. However, the universal popularity and availability of Excel are such that students students will inevitably try to use it for this purpose at some stage, so it is important that they should be made aware of its limitations and need for vigilance. Esta citao vem ao encontro daquilo que pensamos e j referimos neste texto, de que o Excel no um software de Estatstica, mas ao nvel elementar resolve muitas situaes, desde que ao utiliz-lo lo se saiba o que se pretende. Por exemplo, quando se pretende um histograma, e se obtm um diagrama de barras, necessrio ter presente que, embora o histograma rama seja construdo custa de barras, estas tm que estar unidas.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

115

5. Introduo simulao
5.1- Introduo
Pretende-se se com este Captulo, dar a conhecer um instrumento poderoso a simulao, que sobretudo nas duas ltimas dcadas, com o desenvolvimento desenvolvimento e aperfeioamento dos meios computacionais, contribuiu de forma decisiva para o estudo das leis de probabilidade e a obteno da probabilidade associada a determinados acontecimentos. Veremos assim uma forma de imitar o comportamento aleatrio, caracte caracterstico rstico dos fenmenos que tm interesse estudar em Probabilidade, isto , os fenmenos chamados de aleatrios, por oposio aos determinsticos. Na verdade, essa possibilidade de imitao (simulao), baseia-se baseia se no facto de ao realizar uma experincia aleatria, aleatria, repetidamente e em condies semelhantes, os resultados obtidos mostrarem uma regularidade estatstica, que utilizada para obter estimativas das probabilidades dos acontecimentos associados experincia em causa. Esta regularidade a longo termo a base da interpretao frequencista de Probabilidade. Simulando vrias realizaes de uma experincia aleatria, ento possvel obter as estimativas consideradas anteriormente. Por exemplo, ao lanar um dado equilibrado repetidas vezes, registando numa tabela de frequncias, a frequncia relativa da sada de cada face, verifica-se verifica se que medida que o nmero de lanamentos aumenta, a frequncia relativa da sada de cada face tende a estabilizar volta do valor 0,167 (aproximadamente 1/6). Embora no tenhamos amos chamado explicitamente a ateno para o facto, na verdade j utilizmos o conceito de simulao, quando no captulo 1, utilizmos a funo Randbetween do Excel, para imitar o comportamento aleatrio da extrao de uma amostra, de uma certa populao. Vamos ver de seguida, como por simulao se podem obter boas aproximaes das probabilidades de acontecimentos, que teoricamente seriam difceis, ou mesmo impossveis de obter.

5.2- Obteno de probabilidades por simulao


Vamos apresentar exemplos simpl simples, es, que nos serviro para dar uma ideia da utilizao e da potencialidade do mtodo da simulao. Vamos utilizar as funes RAND ou

RANDBETWEEN, j utilizadas no captulo 1, que tm por base o conceito de nmero aleatrio, ou mais propriamente pseudoaleatrio.

Os algoritmos de gerao de nmeros pseudoaleatrios esto concebidos de modo a que ao considerar uma qualquer sequncia de nmeros gerados se obtenha aproximadamente a
ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

116

mesma proporo de observaes em subintervalos de igual amplitude do intervalo [ [0,1]. Assim, por exemplo, se se fizer correr o algoritmo 100 vezes, de esperar que caiam 25 dos nmeros gerados em cada quarto do intervalo [0,1]. Na tabela seguinte est listada uma sequncia de 100 NPAs obtida atravs do gerador RAND do software Excel (Graa Martins, M. E e Loura, L., 2001):
0,842050 0,965131 0,761648 0,359825 0,054705 0,466613 0,814300 0,449515 0,901502 0,862762 0,395195 0,420519 0,124664 0,537707 0,033277 0,024371 0,558313 0,087859 0,069915 0,774156 0,406320 0,676239 0,552387 0,208420 0,102768 0,493374 0,638416 0,090759 0,552418 0,507097 0,415666 0,469764 0,765629 0,451921 0,523063 0,213326 0,283191 0,429387 0,221549 0,039495 0,848744 0,722927 0,079614 0,098150 0,147229 0,150888 0,086141 0,197460 0,466389 0,613583 0,210044 0,053714 0,737348 0,702749 0,908485 0,442821 0,153907 0,735276 0,358037 0,490216 0,810469 0,825587 0,298300 0,818893 0,557920 0,540352 0,007840 0,209145 0,221584 0,389183 0,379011 0,478208 0,696311 0,683382 0,708764 0,983754 0,655705 0,890680 0,578713 0,755072 0,789583 0,702971 0,087455 0,103532 0,996667 0,480287 0,109918 0,713230 0,623757 0,129629 0,302539 0,444822 0,806147 0,377823 0,196290 0,970551 0,995760 0,569285 0,161851 0,753139

Como se pode verificar por contagem, esta lista inclui 30 30 nmeros no intervalo [0,0.25], 24 nmeros nos intervalos ]0.25,0.5] e ]0.5,0.75] e 22 nmeros no intervalo ]0.75,1]. Embora haja mtodos estatsticos para avaliar se so ou no significativas as diferenas entre estas frequncias observadas e as frequncias frequnc esperadas (25 25 25 25), facilmente a nossa sensibilidade aceita que estes resultados no contradizem o que se esperaria de uma escolha ao acaso de 100 nmeros do intervalo [0,1] De um modo geral quando falamos em nmeros aleatrios, estamos a referir-nos re nos obteno de qualquer real do intervalo [0, 1], de tal forma que a probabilidade de obter um valor de um subintervalo [a, b] de [0, 1], igual amplitude desse subintervalo, ou seja (b-a). (b Exemplo 5.1.1 (Adaptado do exemplo 6.2.1 de Graa Martins et al, 1999) Suponha um casal que pretende ter um casal de filhos, no desejando mais do que 3 filhos e s tentando o 3 filho se anteriormente tiver tido ou dois rapazes ou duas raparigas. Qual a probabilidade de ter efetivamente o casalinho? Admitindo tindo que a probabilidade de nascer rapaz igual de nascer rapariga, vamos utilizar a funo RAND, para simular um qualquer destes nascimentos, da seguinte forma: Se o resultado da funo RAND for inferior a 0,5, simulamos o nascimento de um rapaz M. Caso contrrio simulamos o nascimento de uma rapariga. Numa folha de Excel vamos simular

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

117

vrias repeties da experincia nascimento de 3 filhos. Poderamos ter optado por comear por simular o nascimento de dois filhos e s simular o 3 filho se no houvesse hou os dois sexos nos dois primeiros filhos. No entanto, este condicionamento da simulao do 3 filho faz com que cada repetio da experincia dependa do que se obtm anteriormente, o que torna mais demorado o processo da simulao. Assim, simulmos sempre sempre 3 filhos e basta nos dois primeiros haver os dois sexos, para termos como resultado da experincia um sucesso. Assinalamos o sucesso (dois sexos diferentes logo nos dois primeiros filhos ou sexos diferentes nos trs filhos) com um 1 esta notao facilita-nos nos o clculo da frequncia relativa do n de sucessos, medida que repetimos a experincia. Um procedimento possvel para a simulao em causa, pode ser o seguinte:
Inserir a funo RAND() nas clulas A2, B2 e C2 e nas clulas D2, E2 e F2 a funo IF(), como se exemplifica na figura seguinte:

Replicar (Fill down) as clulas A2:F2, tantas vezes quantas as vezes que se pretende simular a realizao da experincia. Ns replicmos 400 vezes, colocando os resultados nas clulas A2:F401; A2:F40 Copiar (Paste special) os valores das clulas D2:F401, para as clulas H2:J401 (Este passo tem como objetivo guardar os valores gerados anteriormente, pois a funo RAND() voltil, como j referimos nos captulos anteriores);

Em cada uma das clulas da a coluna K inserir 1 se o resultado da experincia tiver sido sucesso; Na coluna L contabilizar o n de sucessos acumulados; Na coluna M contabilizar o n da experincia; Na coluna N calcular a frequncia relativa de sucesso, medida que se vo realizando experincias.

O processo anterior apresentado na figura seguinte. Por uma questo de espao s apresentamos a parte inicial e a parte final da tabela:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

118

Como se verifica, a frequncia relativa estabiliza volta do valor 0,75, pelo que dizemos que 0,75 uma estimativa para a probabilidade pretendida (O valor calculado, teoricamente, para esta probabilidade de 0,75). A ttulo de curiosidade acrescentamos que o resultado da simulao ao fim de 100, 200 e 300 repeties, foi respetivamente 0,790, 0,775 e 0,753. Apresentamos a evoluo da frequncia relativa na seguinte representao grfica:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

119

Exemplo 5.1.2 (Ageel, M. I. - Teaching Statistics, Volume 24, Number 2, Summer 2002, pag. 51-54) Um segmento de linha de comprimento comprimento 1 partido, aleatoriamente, em trs pedaos. Qual a probabilidade de as peas resultantes poderem formar um tringulo? A resoluo deste problema prende-se prende se com uma regra que estabelece que a soma dos comprimentos de dois lados de um tringulo superior superior ao comprimento do outro lado. Vamos resolver este problema fazendo uma srie de simulaes e calculando a frequncia relativa das situaes que do origem a tringulos. Considera-se Considera se ento uma folha de clculo e procede-se se da seguinte forma:
Nas clulas as A2 e B2 introduz-se introduz a funo RAND(), que devolve um nmero pseudoaleatrio entre 0 e 1 (equivalente funo RANDBETWEEN(0;1)). Estes nmeros iro representar os pontos P e Q em que uma linha MN de comprimento 1 fica dividida:

Considera-se se para P o menor dos valores obtidos anteriormente, que ser o comprimento de MP clula C2; Calculam-se se o comprimentos dos segmentos PQ e QN clulas D2 e E2, respetivamente:

Testa-se se se dos 2 quaisquer dos comprimentos obtidos anteriormente anteriormente so superior ao terceiro comprimento clula F2; Replica-se se as clulas de A2 a F2 at linha 1001 (1000 rplicas);

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

120

Calcula-se se o nmero de vezes que o teste anterior deu verdadeiro, ou seja TRUE clula G2, e divide divide-se por 1000:

O resultado da simulao anterior deu uma frequncia relativa de 0,249, que se pode considerar um valor aproximado para a probabilidade pretendida:

Do mesmo modo que a funo RANDBETWEEN, tambm a funo RAND voltil, pelo que qualquer operao na folha de clculo modifica os nmeros pseudoaleatrios considerados para coordenadas dos pontos e consequentemente a estimativa da probabilidade pretendida. Assim, quantas operaes forar na folha anterior, nomeadamente digitar um valor valor numa das clulas em branco consiste numa operao, quantas estimativas obter para a probabilidade pretendida, ou seja, para a probabilidade de conseguir construir um tringulo com as partes de um segmento de reta de comprimento unitrio, dividido aleatoriamente aleatoriamente em 3 partes. Exemplo 5.1.3 - Suponha que em cada minuto a probabilidade de algum chegar fila de uma caixa de supermercado de 75%, enquanto que a probabilidade de abandonar a fila, depois de ser servido de 30%. Ao fim de 20 minutos qual o tamanho tamanho que espera para a fila? Vamos simular a experincia anterior, simulando a chegada de um cliente fila sempre que o resultado da funo RAND for 0,75 e a sada de um cliente da fila sempre que a funo RAND devolver um resultado 0,30:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

121

Para no corrermos os riscos de termos uma fila com um nmero negativo de pessoas, considermos a funo mximo: mximo

Ao fim de 20 0 minutos a fila j tem 13 clientes e com tendncia para crescer! Exemplo 5.1.4 Suponha uma espcie animal em que as fmeas tm o seguinte

comportamento reprodutor: 40% morrem antes de deixar descendncia 40% tm uma fmea descendente 20% tm duas fmeas s descendentes

Estude o comportamento desta populao, nomeadamente se se prev um crescimento rpido de indivduos da espcie, a extino ou uma situao de equilbrio.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

122

Vamos estudar a evoluo da populao simulando a descendncia de 10 fmeas, ao longo de algumas geraes. Para cada fmea, geramos um nmero pseudoaleatrio pseudoaleatrio, cujo resultado ser interpretado da seguinte forma: Se o nmero for inferior a 0,20, a fmea deixa 2 descendentes fmeas; Se o nmero estiver compreendido entre 0,2 e 0,6, a fmea deixa dei 1 descendente fmea; Se o nmero estiver compreendido entre 0,6 e 1, a fmea morre sem descendncia. A presentamos a seguir uma simulao da experincia com as 10 fmeas:

Na tabela anterior considermos:


Nas clulas O2:X2, 10 nmeros pseudoaleatrios para simular a descendncia das 10 fmeas com que inicimos a nossa experincia; Na clula Y3, o nmero de fmeas obtidas ao fim da primeira gerao neste caso 7; Nas clulas O4:U4, 7 nmeros pseudoaleatrios para simular a descendncia das 7 fmeas obtidas na gerao anterior; Na clula Y5, o nmero de fmeas obtidas ao fim da segunda gerao neste caso 8; Repetimos o processo anterior, at no haver descendncia de fmeas.

Como se verifica, a populao tem tendncia a extinguir extinguir-se, pois ao fim da 11 gerao j no h descendentes das 10 fmeas com que inicimos o estudo. Repita a experincia admitindo que: 20% morrem antes de deixar descendncia

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

123

40% Tm uma fmea descendente 40% tm duas fmeas descendentes

Um outro exemplo interessante ssante e que tem levantado bastante polmica o seguinte exemplo de deciso estratgica estratgica. Exemplo 5.1.5 (Graa Martins, M. E. e Loura, L., 2001) - Num concurso dada a escolher ao concorrente uma de 3 portas. Atrs de uma delas est um carro e atrs de cada cada uma das outras duas est uma ovelha. O concorrente escolhe uma das portas (sem a abrir) e o apresentador, que sabe exatamente qual a porta que esconde o carro, abre, de entre as duas portas que restam, uma onde est uma ovelha. Nesse momento pergunta ao concorrente se deseja ou no trocar a porta que escolheu pela outra porta que ainda est fechada. O primeiro pensamento que ocorre que no h qualquer vantagem em trocar, pois temos agora apenas duas portas e o carro tanto pode estar atrs de uma com como da outra. No entanto, se se calcular teoricamente a probabilidade do concorrente ganhar o carro, trocando de porta, verifica-se verifica se que esta igual a 2/3. Para os mais reticentes uma simulao talvez os faa reconsiderar a sua posio inicial. No h qualquer qualquer dvida de que ao escolher uma porta ao acaso a probabilidade de ela esconder o carro igual a 1/3. Para simular o decorrer de 100 destes concursos vamos ento considerar que o concorrente escolheu a boa porta sempre que o valor do nmero pseudoaleatrio (NPA) estiver entre 0 e 1/3. Nestes casos, quando ele trocar de porta, ficar com a ovelha mas, em compensao, ficar com o carro em todos os outros casos (se ele tiver escolhido inicialmente a ovelha, a porta que resta ter obrigatoriamente o carro carr pois o apresentador encarregou-se se de eliminar a outra porta que tambm tinha ovelha!...) Eis o resultado da simulao obtida a partir de 100 nmeros pseudoaleatrios gerados numa folha de Excel:

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

124

NPA 0,842 0,965 0,762 0,360 0,055 0,467 0,814 0,450 0,902 0,863 0,395 0,421 0,125 0,538 0,033 0,024 0,558 0,088 0,070 0,774 0,810 0,826 0,298 0,819 0,558 0,540 0,008 0,209 0,222 0,389 0,379 0,478 0,696 0,683

O que ganha no trocando

O que ganha trocando Carro Carro Carro Carro Ovelha Carro Carro Carro Carro Carro Carro Carro Ovelha Carro Ovelha Ovelha Carro Ovelha Ovelha Carro Carro Carro Ovelha Carro Carro Carro Ovelha Ovelha Ovelha Carro Carro Carro Carro Carro

NPA 0,406 0,676 0,552 0,208 0,103 0,493 0,638 0,091 0,552 0,507 0,416 0,470 0,766 0,452 0,523 0,213 0,283 0,429 0,222 0,039 0,709 0,984 0,656 0,891 0,579 0,755 0,790 0,703 0,087 0,104 0,997 0,480 0,110

O que ganha no trocando Ovelha Ovelha Ovelha Carro Carro Ovelha Ovelha Carro Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Carro Carro Ovelha Carro Carro Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Carro Carro Ovelha Ovelha Carro

O que ganha trocando


Carro

NPA 0,849 0,723 0,080 0,098 0,147 0,151 0,086 0,197 0,466 0,614 0,210 0,054 0,737 0,703 0,908 0,443 0,154 0,735 0,358 0,490 0,713 0,624 0,130 0,303 0,445 0,806 0,378 0,196 0,971 0,996 0,569 0,162 0,753

O que ganha no trocando Ovelha Ovelha Carro Carro Carro Carro Carro Carro Ovelha Ovelha Carro Carro Ovelha Ovelha Ovelha Ovelha Carro Ovelha Ovelha Ovelha Ovelha Ovelha Carro Carro Ovelha Ovelha Ovelha Carro Ovelha Ovelha Ovelha Carro Ovelha

O que ganha trocando Carro Carro Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Carro Carro Ovelha Ovelha Carro Carro Carro Carro Ovelha Carro Carro Carro Carro Carro Ovelha Ovelha Carro Carro Carro Ovelha Carro Carro Carro Ovelha Carro

Ovelha Ovelha Ovelha Ovelha Carro Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Ovelha Carro Ovelha Carro Carro Ovelha Carro Carro Ovelha Ovelha Ovelha Carro Ovelha Ovelha Ovelha Carro Carro Carro Ovelha Ovelha Ovelha Ovelha Ovelha

Carro Carro Ovelha Ovelha Carro Carro Ovelha Carro Carro Carro Carro Carro Carro Carro Ovelha Ovelha Carro Ovelha Ovelha Carro Carro Carro Carro Carro Carro Carro Carro Ovelha Ovelha Carro Carro Ovelha

Como se verifica, nas 100 realizaes simuladas deste concurso o concorrente ganharia o carro em 67 dessas realizaes, se se decidisse por trocar de porta!...

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

125

Lista de algumas funes usadas no Excel:


Ingls And() Portugus E() Devolve verdadeiro se todos os argumentos forem verdadeiros e devolve falso se algum dos argumentos for falso Calcula a mdia dos valores existentes num conjunto de clulas Conta as clulas com valores numricos, incluindo datas e frmulas cujos resultados so numeros Conta todas as clulas no vazias Conta as clulas vazias Conta as ocorrncias verificadas num conjunto de clula, que obedecem a um critrio

Average() Count()

Media() Contar()

Counta() Countblank() Countif()

Contar.val() Contar.vazio() Contar.se()

Frequency() If() Int() Max() Min() Mod() Or()

Frequncia Se() Int() Maximo() Minimo() Resto() Ou() Executa uma de duas aces possveis, em funo do resultado da condio Devolve a parte inteira de um nmero Devolve o maior valor de um conjunto de clulas Devolve o menor valor de um conjunto conju de clulas Devolve o resto de uma diviso Devolve verdadeiro se um dos argumentos for verdadeiros e devolve falso se todos os argumentos forem falsos

Pie Product() Produto() Multiplica os valores de um conjunto de clulas, ignorando as clulas vazias e/ou com texto Devolve um nmero pseudoaleatrio (no intervalo (0,1)) Devolve um nmero pseudoaleatrio no intervalo especificado Devolve um nmero arredondado, arredondad na posio indicada Devolve um nmero arredondado, por defeito, na posio indicada Devolve um nmero arredondado, por excesso, na posio indicada

Rand() Randbetween() Round() Rounddown() Roundup() Scatter Sum() Sumif()

Aleatrio() Aleatrioentre() Arred() Arred.para.baixo() Arred.para.cima()

Soma() Soma.se()

Soma os valores de um conjunto de clulas Soma as ocorrncias verificadas num conjunto de clulas que obedecem a um critrio Multiplica dois conjuntos de clulas e devolve a soma total dos produtos

Sumproduct()

Somarproduto()

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

126

Vlookup()

Procv()

Procura um valor na coluna mais esquerda de uma tabela e devolve um valor na mesma linha na coluna indicada

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

127

Bibliografia / Outros Recursos

BARNETT, V. (1997) Sample Survey: Principles & Methods, Arnold, London. GRAA MARTINS, M.E. et al (1999) 1999) Introduo s Probabilidades e Estatstica, Edio da Universidade Aberta. GRAA MARTINS, M.E. (2005) Introduo Probabilidade e Estatstica Com complementos de Excel. Edio da Sociedade Portuguesa de Estatstica. www.arquivoescolar.org GRAA MARTINS, M.E. et al (2001) 2001) Estatstica 10 ano de escolaridade, Edio do Ministrio da Educao Departamento do Ensino Secundrio. GRAA MARTINS, M.E. e Loura, L. (2001) Matemtica para as Cincias Sociais Anexo para apoio interpretao do programa. GRAA MARTINS, M. E., LOURA, L., MENDES, F. (2007) Anlise de dados, Texto de apoio para os professores do 1 ciclo, Ministrio da Educao, DGIDC. ISBN-978-972-742-261-6. ISBN 6. Depsito legal 262674/07 GRAA MARTINS, M. E., PONTE, J. P. (2010) Organizao e tratamento de dados, http://area.dgidc.min-edu.pt/materiais_NPMEB/matematicaOTD_Final.pdf edu.pt/materiais_NPMEB/matematicaOTD_Final.pdf MOORE, D. (1992) What is Statistics in Perspectives on Contemporary Statistics, Edio de David Hoaglin e David Moore, The Mathematical Association of America. MOORE, D. ET AL (1996) Introduction to the Practice of Statistics, Freeman, New York. MOORE, D. (1996) The Basic Practice of Statistics, Freeman, New York. MOORE, D. (1997) Statistics Concepts and Controversies, Freeman, New York. MURTEIRA, B. (1993) Anlise Exploratria de Dados. Estatistica Descritiva, McGraw-Hill. McGraw COMAP, (2000) For all Practical Purposes: Mathematical Literacy in Todays World, Freeman and Company, New York. ROSSMAN, A. et al (2001) Workshop Statistics Discovery with data, Key College Publishing. TANNENBAUM. P. et al (1998) Excursions in modern Mathematics, Prentice Hall. VICENTE, P., REIS, E., FERRO, F. (1996) 1996) Sondagens, Edies Slabo.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

128

Artigos da revista TEACHING STATISTICS AGEEL, M.I. Spreadsheets as a Simulation Tool for Solving Probability Problems, Vol 24, 2, 51-54. Hodgson, T., and Borkowski, J. - Why Stratify? Vol 20, 1, 68-71. NEVILLE, H. Handling Continuous Data in Excel, Vol 25, 2, 42-45. 42 NEVILLE, H. Charts in Excel, Vol 26, 2, 49-53. 49

Pginas na Internet

ESCOLA SECUNDRIA TOMAZ PELAYO E INSTITUTO NACIONAL DE ESTATSTICA PROJETO ALEA http://www.alea.pt ea.pt INSTITUTO NACIONAL DE ESTATSTICA www.ine.pt/ Tem informao sobre Portugal, ao nvel da freguesia. EUROSTAT europa.eu.int/comm/eurostat/ europa.eu.int/comm/ Tem informao relativa aos diversos pases da Europa. WORLD HEALTH ORGANIZATION http://www.who.int/research/en/ Tem informao sobre temas ligados sade, para todos os pases do mundo. WORLD IN FIGURES http://www.stat.fi/tup/maanum/index_en.html
Tem informao das mais diversas reas, tais como populao e estatsticas vitais, cultura, religies, emprego, consumo, etc., relativa a todos os pases do mundo.

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

129

Anexo Ficheiro de Deputados da X XII Legislatura

Nome 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 Abel Batista Accio Pinto Ado Silva Adolfo Mesquita Nunes Adriano Rafael Moreira Afonso Oliveira Agostinho Lopes Alberto Costa Alberto Martins Altino Bessa Amadeu Soares Albergaria Ana Catarina Mendona Mendes Ana Drago Ana Oliveira Ana Paula Vitorino Ana Sofia Bettencourt Andreia Neto ngela Guerra Antnio Braga Antnio Filipe Antnio Jos Seguro Antnio Leito Amaro Antnio Pra Antnio Rodrigues Antnio Serrano Armnio Santos Artur Rgo Assuno Esteves Baslio Horta Bernardino Soares Bruno Coimbra Bruno Dias Bruno Vitorino Carina Oliveira Carla Rodrigues Carlos Abreu Amorim Carlos Alberto Gonalves

Crculo eleitoral Viana do Castelo Viseu Bragana Lisboa Porto Porto Braga Lisboa Porto Braga Aveiro Setbal Lisboa Coimbra Porto Lisboa Porto Guarda Braga Santarm Braga Lisboa Lisboa Lisboa Santarm Viseu Faro Lisboa Leiria Lisboa Aveiro Setbal Setbal Santarm Aveiro Viana Castelo Europa Castelo Branco Aores Fora da Europa Guarda Lisboa Castelo

Grupo Data parlamentar nascimento CDS-PP PS PSD CDS-PP PSD PSD PCP PS PS CDS-PP PSD PS BE PSD PS PSD PSD PSD PS PCP PS PSD PSD PSD PS PSD CDS-PP PSD PS PCP PSD PCP PSD PSD PSD PSD PSD PSD PS PSD PSD PSD PSD 13-10-1963 14-05-1959 01-10-1957 29-11-1977 17-08-1965 27-03-1964 16-11-1944 16-08-1947 25-04-1945 02-08-1969 16-01-1977 14-01-1973 28-08-1975 10-04-1984 25-04-1962 24-03-1972 04-08-1980 20-06-1973 21-04-1953 28-01-1963 11-03-1962 02-04-1980 26-10-1969 30-05-1958 16-01-1965 22-11-1945 24-04-1958 15-10-1956 16-11-1943 15-09-1971 21-04-1981 19-10-1976 15-05-1971 22-07-1977 18-01-1973 01-10-1963 20-10-1961 16-06-1954 10-03-1951 09-02-1952 13-02-1968 07-10-1964 18-07-1956
ALEA Dossis Didticos

38 Carlos Costa Neves 39 Carlos Enes 40 41 42 43 Carlos Pscoa Gonalves Carlos Peixoto Carlos Santos Silva Carlos So Martinho

Estatstica Descritiva com Excel Complementos. Complementos

130

44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89

Carlos Zorrinho Catarina Martins Ceclia Honrio Clara Marques Mendes Cludia Monteiro de Aguiar Conceio Bessa Ruo Correia de Jesus Couto dos Santos Cristvo Crespo Cristvo Norte Cristvo Simo Ribeiro Duarte Cordeiro Duarte Marques Duarte Pacheco Eduardo Cabrita Eduardo Teixeira Elsa Cordeiro Elza Pais Emdio Guerreiro Emlia Santos Eurdice Pereira Fernando Jesus Fernando Marques Fernando Medina Fernando Negro Fernando Serrasqueiro Fernando Virglio Macedo Ferro Rodrigues Filipe Neto Brando Francisca Almeida Francisco de Assis Francisco Lopes Francisco Lou Glria Arajo Graa Mota Guilherme Silva Helder Amaral Hlder Sousa Silva Helosa Apolnia Honrio Novo Hortense Martins Hugo Lopes Soares Hugo Velosa Idlia Salvador Serro Ins de Medeiros Ins Teotnio Pereira

Branco vora Porto Faro Braga Madeira Porto Madeira Aveiro Portalegre Faro Porto Setbal Santarm Lisboa Setbal Viana Castelo Faro Viseu Braga Porto Setbal Porto Leiria Viana Castelo Braga Castelo Branco Porto Lisboa Aveiro Braga Porto Setbal Lisboa Porto Braga Madeira Viseu Lisboa Setbal Porto Castelo Branco Braga Madeira Santarm Lisboa Lisboa

PS BE BE PSD PSD PSD PSD PSD PSD PSD PSD PS PSD PSD PS PSD PSD PS PSD PSD PS PS PSD PS PSD PS PSD PS PS PSD PS PCP BE PS PSD PSD CDS-PP PSD PEV PCP PS PSD PSD PS PS CDS-PP

28-05-1959 07-09-1973 01-07-1962 30-04-1970 08-04-1982 28-08-1954 16-12-1941 18-05-1949 01-09-1958 06-08-1976 13-05-1986 23-02-1979 09-05-1981 25-11-1965 26-09-1961 25-06-1972 16-06-1968 22-11-1958 23-05-1965 16-05-1972 20-10-1962 04-06-1950 01-06-1958 10-03-1973 29-11-1955 20-06-1951 28-12-1965 03-11-1949 09-09-1968 06-11-1983 08-01-1965 29-08-1955 12-11-1956 04-01-1976 24-08-1955 16-07-1943 08-06-1967 21-07-1965 26-06-1969 24-10-1950 21-09-1966 02-03-1983 18-04-1948 16-05-1964 15-04-1968 14-12-1971

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

131

90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138

Isabel Alves Moreira Isabel Galria Neto Isabel Oneto Isabel Santos Isilda Aguincha Jacinto Serro Jernimo de Sousa Joana Barata Lopes Joo Figueiredo Joo Galamba Joo Gonalves Pereira Joo Lobo Joo Oliveira Joo Paulo Pedrosa Joo Paulo Viegas Joo Pinho de Almeida Joo Portugal Joo Prata Joo Ramos Joo Rebelo Joo Semedo Joo Serpa Oliva Joo Soares Joaquim Ponte Jorge Fo Jorge Laco Jorge Machado Jorge Paulo Oliveira Jos de Matos Correia Jos de Matos Rosa Jos Junqueiro Jos Lello Jos Lino Ramos Jos Lus Ferreira Jos Manuel Canavarro Jos Manuel Rodrigues Jos Ribeiro e Castro Laura Esperana Laurentino Dias Ldia Bulco Lus Campos Ferreira Lus Fazenda Lus Leite Ramos Lus Menezes Lus Montenegro Lus Pedro Pimentel Lus Pita Ameixa Lus Vales Lusa Salgueiro

Lisboa Lisboa Porto Porto Santarm Madeira Lisboa Lisboa Viseu Santarm Lisboa Braga vora Leiria Setbal Porto Coimbra Guarda Beja Lisboa Porto Coimbra Faro Aores Viana Castelo Lisboa Porto Braga Lisboa Lisboa Viseu Porto Lisboa Lisboa Coimbra Madeira Porto Leiria Braga Aores Porto Lisboa Vila Real Porto Aveiro Vila Real Beja Porto Porto

PS CDS-PP PS PS PSD PS PCP PSD PSD PS CDS-PP PSD PCP PS CDS-PP CDS-PP PS PSD PCP CDS-PP BE CDS-PP PS PSD PS PS PCP PSD PSD PSD PS PS CDS-PP PEV PSD CDS-PP CDS-PP PSD PS PSD PSD BE PSD PSD PSD PSD PS PSD PS

02-04-1976 10-07-1961 14-09-1959 12-02-1968 03-04-1966 16-02-1969 13-04-1947 16-03-1985 18-05-1967 04-08-1976 07-05-1977 01-01-1952 09-07-1979 29-09-1965 30-06-1970 11-09-1976 01-10-1977 04-06-1963 13-10-1972 02-02-1970 20-06-1951 26-06-1948 29-08-1949 06-06-1956 04-11-1957 04-09-1954 20-05-1976 28-12-1965 08-05-1963 04-09-1959 28-06-1953 18-05-1944 21-03-1969 27-08-1962 17-04-1965 13-07-1960 24-12-1953 19-02-1958 04-02-1954 19-04-1974 26-11-1961 08-10-1957 29-10-1961 20-12-1980 16-02-1973 16-04-1970 13-10-1960 23-08-1979 02-01-1968

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

132

139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185

Manuel Isaac Manuel Pizarro Manuel Seabra Marcos Perestrello Margarida Almeida Margarida Neto Maria Antnia Almeida Santos Maria Conceio Pereira Maria da Conceio Caldeira Maria das Mercs Borges Maria de Belm Roseira Maria Ester Vargas Maria Gabriela Canavilhas Maria Helena Andr Maria Joo vila Maria Jos Castelo Branco Maria Jos Moreno Maria Manuela Tender Maria Paula Cardoso Mariana Aiveca Mrio Magalhes Mrio Ruivo Mrio Simes Maurcio Marques Mendes Bota Michael Seufert Miguel Coelho Miguel Frasquilho Miguel Freitas Miguel Laranjeiro Miguel Santos Miguel Tiago Miranda Calha Mnica Ferro Mota Amaral Mota Andrade Nilza de Sena Nuno Andr Figueiredo Nuno Encarnao Nuno Filipe Matias Nuno Magalhes Nuno Reis Nuno S Nuno Serra Odete Joo Odete Silva Paula Santos

Leiria Porto Porto Lisboa Porto Santarm Lisboa Leiria Lisboa Setbal Lisboa Viseu Braga Aveiro Fora da Europa Porto Bragana Vila Real Aveiro Setbal Porto Coimbra Beja Coimbra Faro Porto Lisboa Porto Faro Braga Porto Lisboa Porto Lisboa Aores Bragana Coimbra Porto Coimbra Setbal Setbal Braga Braga Santarm Leiria Lisboa Setbal

CDS-PP PS PS PS PSD CDS-PP PS PSD PSD PSD PS PSD PS PS PSD PSD PSD PSD PSD BE PSD PS PSD PSD PSD CDS-PP PS PSD PS PS PSD PCP PS PSD PSD PS PSD PS PSD PSD CDS-PP PSD PS PSD PS PSD PCP

26-01-1960 02-02-1964 28-07-1962 23-08-1971 17-01-1955 24-10-1964 14-02-1963 08-12-1950 13-07-1952 15-07-1957 28-07-1949 28-03-1955 29-03-1961 29-10-1960 26-07-1956 28-07-1958 22-06-1963 09-02-1971 24-08-1972 03-02-1954 07-02-1965 23-03-1960 08-08-1970 28-12-1958 04-08-1955 15-04-1983 04-07-1952 12-11-1965 25-12-1960 13-08-1965 24-03-1971 27-08-1979 17-11-1947 07-11-1972 15-04-1943 25-11-1955 21-11-1976 12-02-1976 24-12-1972 26-01-1977 04-03-1972 23-09-1978 02-04-1976 28-07-1973 03-01-1958 18-09-1971 29-09-1980

ALEA Dossis Didticos

Estatstica Descritiva com Excel Complementos. Complementos

133

186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230

Paulo Batista Santos Paulo Cavaleiro Paulo Mota Pinto Paulo Pisco Paulo Ribeiro de Campos Paulo Rios de Oliveira Paulo S Paulo Simes Ribeiro Pedro Alves Pedro Delgado Alves Pedro do Ramos Pedro Farmhouse Pedro Filipe Soares Pedro Jesus Marques Pedro Lynce Pedro Nuno Santos Pedro Pimpo Pedro Pinto Pedro Roque Pedro Silva Pereira Ramos Preto Ral de Almeida Renato Sampaio Ricardo Baptista Leite Ricardo Rodrigues Rita Rato Rosa Arezes Rosa Maria Bastos Albernaz Rui Jorge Santos Rui Paulo Figueiredo Rui Pedro Duarte Srgio Azevedo Srgio Sousa Pinto Snia Fertuzinhos Telmo Correia Teresa Anjinho Teresa Caeiro Teresa Costa Santos Teresa Leal Coelho Ulisses Pereira Valter Ribeiro Vasco Cunha Vera Rodrigues Vieira da Silva Vitalino Canas

Leiria Aveiro Lisboa Europa Guarda Porto Faro Setbal Viseu Lisboa Setbal Lisboa Aveiro Portalegre vora Aveiro Leiria Lisboa Faro Vila Real Lisboa Aveiro Porto Lisboa Aores Lisboa Viana Castelo Aveiro Vila Real Lisboa Coimbra Lisboa Aveiro Braga Braga Aveiro Lisboa Viseu Porto Aveiro Leiria Santarm Porto Setbal Lisboa

PSD PSD PSD PS PS PSD PCP PSD PSD PS PSD PS BE PS PSD PS PSD PSD PSD PS PS CDS-PP PS PSD PS PCP PSD PS PS PS PS PSD PS PS CDS-PP CDS-PP CDS-PP PSD PSD PSD PSD PSD CDS-PP PS PS

03-12-1968 08-12-1973 18-11-1966 22-08-1961 07-04-1965 19-02-1965 12-07-1965 28-03-1969 30-12-1972 12-12-1980 04-10-1974 27-06-1961 15-02-1979 01-08-1976 06-02-1943 13-04-1977 21-07-1980 24-10-1956 10-01-1963 15-08-1962 19-01-1956 08-05-1968 03-05-1952 31-05-1980 01-06-1958 05-01-1983 22-05-1967 04-09-1947 24-01-1969 09-10-1972 31-08-1984 30-10-1981 29-07-1972 12-01-1973 04-02-1960 03-10-1974 14-02-1969 10-03-1966 29-03-1961 04-02-1954 19-06-1974 23-03-1965 08-02-1981 14-02-1953 14-07-1959

ALEA Dossis Didticos

Você também pode gostar