Você está na página 1de 35

Inferência estatística

Usando software STATA

Profª : Ana Clara Campos


Turma 02
Apresentando o software
• STATA é um software estatístico pago com amplo
potencial de utilização;
• Trabalha com bases de dados que ficam
armazenadas inteiramente na memória RAM do
computador.
• Diferencia letras maiúsculas das minúsculas.
• Letras minúsculas sempre para comandos
• Aceita abreviações para comandos e nomes de
variáveis, desde que estas abreviações não sejam
ambíguas.
• Podemos abrir vários tipos de bancos de dados :
excel, dat, txt, csv, etc
Iniciando o STATA
JANELAS DO STATA
• Quatro janelas são apresentadas quando o STATA é
iniciado. São elas:
• Review: janela onde são armazenados os comandos
• Variables: janela que apresenta a lista das variáveis
do banco de dados ativo
• Stata Results: janela que mostra os resultados
• Stata Command: janela onde os comandos do
STATA devem ser digitados
Menu

Lista de
Variáveis do
comandos
banco

Output

Digitação dos
comandos
• O menu : algumas funções
"HELP  SEARCH" é utilizado para procurar ajuda sobre
comandos do STATA.
Open (use): Carrega ou abre um banco de dados no formato
do STATA (dta).
Save: Salva um arquivo no formato do STATA (dta).
Print Results: Imprime a janela de resultados.
Begin Log: Carrega, abre ou cria um arquivo do tipo ".log" ou
".smcl". Podemos salvar tudo neste arquivo.log
Start Viewer: Exibe a tela de ajuda (Help) em primeiro plano.
Do-file Editor: Edita um arquivo de comandos (arquivo tipo
".do").
Data Editor: Edita o arquivo de dados que está sendo
utilizado.
Praticando
• Passo 1: abrindo o banco

• Passo 2: criando arquivo .log – neste arquivo


ficarão salvos seus comandos e resultados
Podemos também criar um “do” file contendo
os comandos utilizados nas análises

• Passo 3: análises
• Passo 4: salvar o banco
Estimação intervalar para média de 1
população com variância conhecida e
grandes amostras
Vamos usar uma base de dados existente no STATA
(Example datsets)

 Podemos baixar a base se estiver na internet :


use http://www.stata-press.com/data/r13/auto

 Podemos buscar em um diretório particular


use:\ana\Pos_Unijorge\PraticaSTATA\Automobil
e Data_IC_Ex1.dta", clear
• Vamos descrever o conteúdo da base de dados
describe
• Medidas sumárias
summarize (ou simplesmente sum)

Mais detalhes:
detail

• IC para μ : ci price
Mais de uma forma de construir IC
para μ
O comando direto usado para construir IC para μ é
cii n me sd
n = tamanho da amostra; Mudando a confiança:
me = média amostral cii n me sd, levlel(99)
sd = desvio padrão

Mãos à obra:
Exemplo 1 – slide 40 --- n= 121; média amostral
=500 e desvio padrão = 250, 1- α = 99%

Sintaxe: cii 121 500 250, level(99)


Estimação intervalar para
média de 1 população e
pequenas amostras
• Os comandos não mudam.
• Praticando: exemplo didático—slide 49
Em uma dada semana foi tomada uma amostra
aleatória de 28 empregados horistas selecionados de
um grande número de funcionários de uma fábrica, a
qual apresentou um salário médio de R$ 180,00 com
um desvio-padrão de R$ 14,00.

cii n me sd

Variable | Obs Mean Std. Err. [95% Conf. Interval]


-------------+-------------------------------------------------------
| 28 180 2.645751 174.5714 185.4286
Estimação intervalar para
1 proporção populacional
Estimação intervalar para 1 proporção
populacional
(grandes amostras)
(grandes amostras)
• Opção 1: com base de dados (auto.dta)

Vamos construir um IC para a verdadeira proporção


de carros estrangeiros (no banco a variável é foreign:
0 se o carro é nacional e 1 se é estrangeiro)

Comando: ci variável, binomial

-- Binomial Exact --
Variable | Obs Mean Std. Err. [95% Conf. Interval]
-------------+--------------------------------------------------------
foreign | 74 .2972973 .0531331 .196584 .4148353
Comando direto
Exemplo slide 55 : Uma Fábrica produziu 500000
chips Pentium IV em certo período. São selecionados
aleatoriamente 400 chips para testes. Suponha que
20 chips não tenham a velocidade de processamento
adequada. Construir IC de 90% para a proporção
populacional de chips adequados.
n= tamanho da amostra
f= frequência do evento

No STATA: cii n f, level(90)


-- Binomial Exact --
Variable | Obs Mean Std. Err. [90% Conf.Interval]
-------------+-------------------------------------------------
|400 .05 .0108972 .033379 .0718286
Intervalo de confiança para
diferença entre duas
médias populacionais
--Variâncias desconhecidas--
• Banco: auto2
• Objetivo: verificar a efetividade de um novo
aditivo.

• Vamos construir um IC para saber se a


quilometragem média por galão (mpg) difere nos 2
grupos analisados: o que recebeu o novo aditivo
(tratado) e o que não recebeu (controle).

• Devemos verificar as variâncias: são iguais ou


diferentes?
Passo 1: verificando as variâncias IC de 95%,

sdtest variável continua, by(variável binária)

Conclusão?
Exemplo didático -- slide73
X: resistência
do material

IC de 95%,

Passo 1: verificando as variâncias


Comando: sdtesti n1 . sd1 n2 . sd2

Conclusão?
• Passo 2: IC para diferença de médias

Comando: ttest variável continua,by (variável


binária)
Output de
ttest mpg, by(treated) interesse

Conclusão?
Testes de
hipóteses
paramétricos
Teste para 1 média populacional
Exemplo slide 109
Sintaxe básica: ttesti n ybar s mu0

n= amostra
ybar= média
amostral
S= desvio
padrão
amostral
mu0 = valor
hipotetizado
para a média
em H0
Teste para 1 variância
Exemplo slide 114
Com o banco de dados:
sdtest variável de
interesse == valor
Sintaxe: sdtesti n . s SigmaH0 hipotetizado na H0
Ex: sdtest volume ==0.01
Teste para diferença de 2 médias
Exemplo: Deseja-se testar o efeito de um novo
medicamento na taxa de pulso. Para tea, 60
indivíduos foram alocados aleatoriamente em dois
grupos de 30. Um grupo foi dado o novo
medicamento e o outro um placebo .

Grupo n média sd Pergunta-se:


O medicamento reduz
a taxa de pulso ?
medic 30 65.2 7.8 Quais as hipóteses
testadas?
placebo 30 70.3 8.4
Sintaxe: ttesti n1 ybar1 s1 n2 ybar2 s2
ou
ttesti n1 ybar1 s1 n2 ybar2 s2, unequal

Lembrar que: precisamos saber se as variâncias são


desconhecidas e iguais ou diferentes
sdtesti n1 . sd1 n2 . sd2 -> sdtesti 30 . 7.8 30 . 8.4
Teste para 1 proporção populacional

Exemplo slide 135


phat = prop.
Sintaxe: prtesti n phat p0 Amostral
p0 = prop.
hipotetizada
em H0

Conclusão?

Comando alternativo: prtesti n x p0, count


Teste para 2 proporções
populacionais
Exemplo slide 1340
Sintaxe: prtesti n1 phat1 n2 phat2 Conclusão?
Ou prtesti n1 x1 n2 x, count
Testes de
hipóteses
não paramétricos
Wilcoxon-Mann Whitney
• Usar base de dados auto2.dta.
• Objetivo foi testar a eficácia de um novo aditivo de
combustível em 2 grupos: 12 carros com o
tratamento de combustível e 12 carros sem .
• Pergunta: existe diferença nas medianas dos grupos?
•Sintaxe: ranksum var continua/ordinal, by(group)
Qual a sua
conclusão?

Statistics -> nonparametric analysis-> tests of hypotheses->wilcoxon-rank-


sum test
Kruskal Wallis

• Usar base de dados UsaRegion_aula17_18.dta.


• Sintaxe: kwallis var continua/ordinal,
by(group)

Qual a sua
conclusão?

Statistics -> nonparametric analysis-> tests of hypotheses->kruskall-wallis


Wilcoxon signed ranks test
• Usar base de dados Base_Auto3_WilcRank.dta.
• Exemplo usado em Wilcox-Man Whitney
• Criadas duas variáveis ​chamadas mpg1 e mpg2 ,
representando quilometragem sem e com o
tratamento, respectivamente.

• O que estamos testando?


•Você diria que o tratamento não teve efeito?
• Sintaxe: signrank grupo1=grupo2

• Opção 2: signtest grupo1=grupo2


Mcnemar
• Exemplo slide 191
• Sintaxe: mcci a b c d

34
Atenção!!!

• O comando signtest testa que a mediana das


diferenças é zero, tomando mais nenhuma
suposição, enquanto o comando signrank
assume que as distribuições são também iguais .

Você também pode gostar