Date post: | 07-Apr-2016 |
Category: |
Documents |
Upload: | ester-macario |
View: | 212 times |
Download: | 0 times |
AnExAnEx :: Analytical Expertise & Cenários por :: Analytical Expertise & Cenários por Pergentino Pergentino Mendes de AlmeidaMendes de Almeida
FESPSPFESPSP
Amostra e universoAmostra e universo
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O problema do clienteO problema do cliente A cidade XYZ fica no interior de São Paulo,
região de Mairinque, e possui um universo de 10 farmácias / drogarias.
O Cliente distribui algumas marcas de medicamentos, cosméticos e chás.
Nosso cliente vai abrir um centro de distribuição na cidade e quer saber se vale a pena prever recursos de atendimento local, além da meso-região.
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Objetivos da pesquisaObjetivos da pesquisa Deseja-se saber a média de vendas mensais de produtos
farmacêuticos, drogas e outros. qual a proporção de vendas na região entre:
• produtos éticos, • categorias específicas de interesse do cliente• OTC em geral• cosméticos • drogas, homeopatia, e outros produtos em geral, como grampos, pentes,
perfumes, etc. ? Quantas farmácias aviam receitas? Convencionamos que os gerentes, encarregados e donos das
farmácias dispõem da informação e não objetam a fornecê-la a entrevistadores.
Deseja-se também ter uma idéia da cobertura de necessidades farmacêuticas de pequenas cidades vizinhas e vilas rurais
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Universo e amostraUniverso e amostra Universo = N = 10
total de indivíduos na população Amostra = n ≤ 10
uma parte representativa da população Se N = n, então é Censo. Se n < N, então é Amostra. Questão: quantas amostras diferentes são
possíveis de uma população de 10 farmácias? quando você adiciona ou subtrai apenas um item da amostra,
você tem uma amostra diferente se você substitui um único indivíduo na amostra, você tem outra
amostra diferente eu vou usar só uma de todas as amostras teoricamente
possíveis
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em quantas ordens posso entrevistar N farmácias? permutações de N = N!
• 10! = 10 x 9 x 8 x7 x 6 x 5 x 4 x 3 x 2 x 1 = 3.628.800
Quantas amostras de n farmácias podem existir num universo de 10 farmácias? combinações de N objetos tomados n a n:
Amostras possíveis de um Amostras possíveis de um total de 10 lojas na cidade XYZtotal de 10 lojas na cidade XYZ
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em quantas ordens posso entrevistar N farmácias? permutações de N = N!
• 10! = 10 x 9 x 8 x7 x 6 x 5 x 4 x 3 x 2 x 1 = 3.628.800
Quantas amostras de n farmácias podem existir num universo de 10 farmácias? combinações de N objetos tomados n a n:
Amostras possíveis de um Amostras possíveis de um total de 10 lojas na cidade XYZtotal de 10 lojas na cidade XYZ
)!(!!nNn
NnN
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Amostras possíveis de um Amostras possíveis de um total de 10 lojas na cidade XYZtotal de 10 lojas na cidade XYZ
Para amostras de 5 lojas (n = 5, N = 10):
252120
302401.2.3.4.56.7.8.9.10
)1.2.3.4.5(1.2.3.4.51.2.3.4.5.6.7.8.9.10
)!510(!5!10
510
)!(!!
nNn
NnN
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Amostras possíveis de um Amostras possíveis de um total de 10 lojas na cidade XYZtotal de 10 lojas na cidade XYZ
Para amostras de 5 lojas (n = 5, N = 10):
Uma dessas 252 amostras possíveis será das 10 maiores lojas probabilidade: 1/252 = 0,004
Uma dessas 252 amostras possíveis será das 10 menores lojas probabilidade: 1/252 = 0,004
252120
302401.2.3.4.56.7.8.9.10
)1.2.3.4.5(1.2.3.4.51.2.3.4.5.6.7.8.9.10
)!510(!5!10
510
)!(!!
nNn
NnN
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Amostras possíveis de um Amostras possíveis de um total de 10 lojas na cidade XYZtotal de 10 lojas na cidade XYZ
tamanho das amostras amostras possíveis de um universo de 10 lojas:
2 lojas 45 amostras
3 lojas 120 amostras
4 lojas 210 amostras
5 lojas 252 amostras
6 lojas 210 amostras
7 lojas 120 amostras
8 lojas 45 amostras
9 lojas 10 amostras
10 lojas 1 (censo)
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Com tantas amostras possíveis, qual o Com tantas amostras possíveis, qual o risco de eu superestimar (ou risco de eu superestimar (ou
subestimar) as vendas da cidade?subestimar) as vendas da cidade? Qual a probabilidade de eu pegar as 5
maiores, sem saber? neste caso, o resultado vai ser bastante
superestimado
... ou as 5 menores? neste caso, o resultado vai ser bastante subestimado
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Qual a probabilidade de eu tomar, ao Qual a probabilidade de eu tomar, ao acaso, as n lojas de maiores vendas?acaso, as n lojas de maiores vendas?
tamanho das amostras amostras possíveis de um universo de 10 lojas:
2 lojas ⇒ 1/45 = 0,0222 45 amostras
3 lojas ⇒ 1/120= 0,00833 120 amostras
4 lojas ⇒ 1/210 = 0,00476 210 amostras
5 lojas ⇒ 1/252= 0,00397 252 amostras
6 lojas ⇒ 1/210 = 0,00476 210 amostras
7 lojas ⇒ 1/120 = 0,00833 120 amostras
8 lojas ⇒ 1/45 = 0,0222 45 amostras
9 lojas ⇒ 1/10 = 0,10 10 amostras
10 lojas ⇒ 1/1 = 100% (sem sentido) 1 (censo)
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
tamanho das amostras amostras possíveis de um universo de 10 lojas:
2 lojas ⇒ 1/45 = 0,0222 45 amostras
3 lojas⇒ 1/120= 0,0,00833 120 amostras
4 lojas⇒ 1/210 = 0,00476 210 amostras
5 lojas⇒ 1/252= 0,00397 252 amostras
6 lojas⇒ 1/210 = 0,00476 210 amostras
7 lojas⇒ 1/120 = 0,0,00833 120 amostras
8 lojas ⇒ 1/45 = 0,0222 45 amostras
9 lojas⇒ 1/10 = 0,10 10 amostras
10 lojas⇒ 1/1 = 100% (sem sentido) 1 (censo)...e, quanto maior a amostra, mais a média da amostra ...e, quanto maior a amostra, mais a média da amostra
se aproximará da média do universose aproximará da média do universo
Qual a probabilidade de eu tomar, ao Qual a probabilidade de eu tomar, ao acaso, as n lojas de maiores vendas?acaso, as n lojas de maiores vendas?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Invertendo a pergunta: Invertendo a pergunta: Quantas amostras de 10 observações (n = 10) podem ser
extraídas de um universo de N entidades? Exemplos para várias hipóteses de N (universo):
N = amostras de 10 observações
10 1 (censo)12 6615 3.00320 184.75650 10.272.000.00060 75.394.000.000100 ... (não cabe na máquina)
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O universo das amostrasO universo das amostras O total de amostras possíveis de um universo de N entidades é
maior (ou muito maior) do que N. De todas as amostras possíveis, você vai sortear apenas uma
e os cálculos de probabilidades pressupõem que todas as amostras possíveis tenham chance igual de serem sorteadas (amostra probabilística simples ou APS)
As médias das amostras possíveis serão mais ou menos próximas da média do universo a maior parte das amostras fica em torno da média
A média de todas as médias das amostras será exatamente igual à média do universo ...mas com um desvio-padrão muito menor
• esse desvio-padrão é o chamado erro amostral ou erro estatístico
AnExAnEx :: Analytical Expertise & Cenários por :: Analytical Expertise & Cenários por Pergentino Pergentino Mendes de AlmeidaMendes de Almeida
FESPSPFESPSP
Testes de hipóteses Testes de hipóteses e certeza dos resultadose certeza dos resultados
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O universo das amostrasO universo das amostras
DP da média das médias das amostras = erro-padrão:
2 = (2 / n) A distribuição das médias das amostras
tende à normalidade ...e pode ser representada em graus-padrão
Isso torna possíveis os testes estatísticos de significância
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
DP da média das médias das amostras = erro-padrão:
2 = (2 / n) A distribuição das médias das amostras
tende à normalidade ...e pode ser representada em graus-padrão
Isso torna possíveis os testes estatísticos de significância
...mas o tamanho do universo ...mas o tamanho do universo não influi no erro amostral?não influi no erro amostral?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Sim, influi... 2 = (2 / n) * [(N – n) / (N – 1)]
...mas o tamanho do universo ...mas o tamanho do universo não influi no erro amostral?não influi no erro amostral?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Sim, influi...
2 = (2 / n) * [(N – n) / (N – 1)] ... mas o
multiplicador (N-n) / (N-1) é: universo n = 100 n = 2.000
100 censo -500 0,80 -
2.000 0,95 censo10.000 0,99 0,80
100.000 0,999 0,981.000.000 0,9999 0,998
20.000.000 0,999995 0,9999
...mas o tamanho do universo ...mas o tamanho do universo não influi no erro amostral?não influi no erro amostral?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Sim, influi...
2 = (2 / n) * [(N – n) / (N – 1)] ... mas o
multiplicador (N-n) / (N-1) é: universo n = 100 n = 2.000
100 censo -500 0,80 -
2.000 0,95 censo10.000 0,99 0,80
100.000 0,999 0,981.000.000 0,9999 0,998
20.000.000 0,999995 0,9999
...mas o tamanho do universo ...mas o tamanho do universo não influi no erro amostral?não influi no erro amostral?
O número de algarismos O número de algarismos significativos com que significativos com que
você vai trabalhar você vai trabalhar determina o tamanho do determina o tamanho do
universouniversoque “tende a infinito”que “tende a infinito”
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Moral da história:Moral da história: Matematicamente, o tamanho do universo sempre
afeta o erro amostral Para universos na casa dos milhares, o efeito do
tamanho do universo sobre o cálculo do erro de uma amostra de n observações se perde no arredondamento
Para universos de tamanho um torno de 1.000 ou menos, a proporção da amostra observada sobre o tamanho da população determina uma relação inversa com o erro amostral no extremo (n = N) o erro amostral é aritmeticamente igual a
zero (Censo).
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
A distribuição das médias A distribuição das médias das amostrasdas amostras
• A probabilidade de eu obter um resultado num ponto da escala é proporcional à densidade de frequência naquele ponto
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
A distribuição das médias A distribuição das médias das amostrasdas amostras
• Se a média do universo for 0,00 e o erro-padrão (desvio-padrão das amostras) for 1,00, então…
• …você pode calcular quais os valores acima e/ou abaixo da média que vão incluir 68% ou 90% ou 95%, etc., de todas as amostras teoricamente possíveis
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Pressupostos dos testes de Pressupostos dos testes de hipóteseshipóteses
A amostra da pesquisa foi colhida ao acaso entre todas as amostras possíveis APS = Amostra Probabilística Simples
A média das médias de todas as amostras possíveis é igual à média no universo
...e o desvio-padrão da média das médias é o erro-padrão ε
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Todos os valores correspondentes a Todos os valores correspondentes a
z > 0,0 estão acima de 50% de todas z > 0,0 estão acima de 50% de todas as médias teoricamente possíveisas médias teoricamente possíveis
0,0Z
50%50% 50%50%
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
-1,0 +1,0
O intervalo entre {média + 1O intervalo entre {média + 1σσ}} e e {média - 1{média - 1σσ}} inclui 68,3% das médias de inclui 68,3% das médias de
todas as amostras teoricamente possíveistodas as amostras teoricamente possíveis
0,0Z
68,3%68,3%
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O intervalo entre [média + 2O intervalo entre [média + 2σσ]] e [média - 2 e [média - 2σσ]] inclui 95,5% de todas inclui 95,5% de todas
amostras possíveisamostras possíveis
0,0Z +2,0-2,0
95,5%95,5%
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Para 95% exatos de certeza empírica: Para 95% exatos de certeza empírica: z = z = ++1,961,96
0,0Z+1,96-1,96
95,0%95,0%
2,5% 2,5%
• A probabilidade é de 2,5% de que a média de todas as amostras possíveis seja maior do que o meu limite superior...• ...e 2,5% de que seja menor do que o meu limite mais baixo
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O que nos diz um teste de O que nos diz um teste de hipótese?hipótese?
0,0Z+1,96-1,96
95%95%
Tenho 95% de certeza empírica de que a média real do universo deve estar entre os limites computados
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
0,0Z+1,96-1,96
95%95%
Tenho 95% de certeza empírica de que a média real do universo deve estar entre os limites computados
Ao fazer essa afirmação, aceito a probabilidade de estar errado em 5% das pesquisas possíveis (erro de Tipo I)
Critério: 5% é uma probabilidade tão pequena que não acredito que tenha acontecido comigo neste caso
O que nos diz um teste de O que nos diz um teste de hipótese?hipótese?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Este é um teste bi-caudalEste é um teste bi-caudal
0,0Z+1,96-1,96
95,0%95,0%
2,5% 2,5%
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 50% de certeza empírica:nível de 50% de certeza empírica:
0,0Z
50%50% 50%50%
... mas 50% de certeza não me satisfaz!
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 50% de certeza empírica:nível de 50% de certeza empírica:
0,0Z
50%50% 50%50%
... mas 50% de certeza não me satisfaz!
Eu quero “jogar” contra 1 chance em 20 no máximo ao apostar que a média do universo não deve superar um valor L (95% de certeza empírica)
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 50% de certeza empírica:nível de 50% de certeza empírica:
0,0Z
50%50% 50%50%
... mas 50% de certeza não me satisfaz!
Eu quero “jogar” contra 1 chance em 20 no máximo ao apostar que a média do universo não deve superar um valor L (95% de certeza empírica)
Qual o valor de L?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Este é um teste Este é um teste monocaudalmonocaudal a um a um nível de 95% de certeza empírica:nível de 95% de certeza empírica:
0,0Z
95%95%
5%5%
resposta:L = 1,645σ
z =1,645
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
0,0Z
95%95%
5%5%
resposta:L = 1,645σ
z =1,645
Note que:Note que:1)1) no intervalo bicaudal, L = 1,96no intervalo bicaudal, L = 1,96σσ2)2) no teste monocaudal, L = 1,645 no teste monocaudal, L = 1,645 σσ3)3) os livros às vezes dizem que L= 2,00os livros às vezes dizem que L= 2,00
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 95% de certeza empírica:nível de 95% de certeza empírica:
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Interpretações: 5% das possíveis amostras de tamanho igual à minha terão valores superiores à
média da minha amostra + 1,645σ
0,0Z
95%95%
5%5%
z =1,645
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 95% de certeza empírica:nível de 95% de certeza empírica:
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Interpretações: 5% das possíveis amostras de tamanho igual à minha terão valores superiores à
média da minha amostra + 1,645σ tenho 1 chance em 20 (5%) de errar se admitir que a média do universo é igual ou
menor do que L
0,0Z
95%95%
5%5%
z =1,645
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 95% de certeza empírica:nível de 95% de certeza empírica:
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Interpretações: 5% das possíveis amostras de tamanho igual à minha terão valores superiores à
média da minha amostra + 1,645σ tenho 1 chance em 20 (5%) de errar se admitir que a média do universo é igual ou
menor do que L mas não acredito que isso tenha acontecido comigo, por que essa é uma probabilidade
que reputo “baixa”
0,0Z
95%95%
5%5%
z =1,645
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 95% de certeza empírica:nível de 95% de certeza empírica:
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Interpretações: 5% das possíveis amostras de tamanho igual à minha terão valores superiores à
média da minha amostra + 1,645σ tenho 1 chance em 20 (5%) de errar se admitir que a média do universo é igual ou
menor do que L mas não acredito que isso tenha acontecido comigo, por que essa é uma probabilidade
que reputo “baixa” portanto, afirmo que tenho 95% de certeza empírica de que qualquer valor igual ou
acima da média + 1,645 σ é significativamente maior do que a média da minha amostra
0,0Z
95%95%
5%5%
z =1,645
Este é um teste monocaudal a um Este é um teste monocaudal a um nível de 95% de certeza empírica:nível de 95% de certeza empírica:
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Duas amostras independentes:Duas amostras independentes:a média da Classe B é maior do que a a média da Classe B é maior do que a
média da Classe A?média da Classe A?
0,0Z 2,5x2,3x zA =+1,645 zB =-1,645
0,0Z
2,5Bx2,3Ax
95%95% 95%95%
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
zA =+1,645 zB =-1,645
0,0Z
2,5Bx2,3Ax
95%95% 95%95%
Resposta: Sim, a 95% de certeza.
Duas amostras independentes:Duas amostras independentes:a média da Classe B é maior do que a a média da Classe B é maior do que a
média da Classe A?média da Classe A?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Resposta: Não, a 95% de certeza.
Se você usar z = 1,96, o teste será a 97,5% de certezaSe você usar z = 1,96, o teste será a 97,5% de certeza
Duas amostras independentes:Duas amostras independentes:a média da Classe B é maior do que a média a média da Classe B é maior do que a média
da Classe A?da Classe A?
0,0Z
2,5Bx
zA =+1,645
2,3Ax
95%95%
zB =-1,645
95%95%
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O problema central dos testes O problema central dos testes de hipóteses: um exemplode hipóteses: um exemplo
Num STM, tivemos 2 células de Conceito e Produto: nossa nova Lx da marca A o concorrente, marca B
Ao final do teste, A ganhou de B significativamente em Intenção de Compra eu rejeito H0: provavelmente ambos não são equivalentes para
os consumidores Fiquei então com H1... mas o que é H1?
H1: A > B ... mas por quê?• pelo Conceito? pelo Produto? por algum atributo especial de uma
das alternativas? pela marca? pelo preço? H1 é apenas (e tudo) “o que sobra” depois de desprezada H0
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Prática?Prática? Então vamos lá:
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Exercício práticoExercício prático Em três povoados pesquisou-se o consumo de bananas e
depois fizemos uma pesquisa de hábitos alimentares. Povoado A: alta média de consumo de bananas
povoado isolado, recebe poucas frutas de fora, consome principalmente bananas e exporta-as ao Povoado B
Povoado B: consome menos bananas, mas consome muitas outras frutas nativas e importadas
Povoado C: consome tanto quanto o povoado A, mas também consome muitas outras frutas importadas
Perguntas – qual a sua expectativa quanto ao consumo de bananas, se todos os povoados forem de igual tamanho: 1. qual é o maior consumidor de bananas? E os demais? 2 qual deve ter a maior variância da média de bananas consumidas? 3. qual deles consome mais frutas em geral, inclusive bananas? E os
demais? 4. se você for investir no plantio de bananas, em qual povoado prefere
estabelecer-se?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Amostras relacionadas: Amostras relacionadas: Intenções de compra Antes e DepoisIntenções de compra Antes e Depois
entrevistado A = antes D = depois
1 5 5
2 10 8
3 8 10
4 7 8
5 5 8
6 6 9
7 9 9
8 10 10
9 3 9
10 5 6
ΣΣ 6868 8282
médiamédia 6,86,8 8,28,2
Pergunta: a média 8,2 (depois da propaganda) é significativamente maior do que 6,8 (antes da propaganda)?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
entrevistado A = antes D = depois D - A
1 5 5 0
2 10 8 -2
3 8 10 +2
4 7 8 +1
5 5 8 +3
6 6 9 +3
7 9 9 0
8 10 10 0
9 3 9 +6
10 5 6 +1
ΣΣ 6868 8282 +14+14
médiamédia 6,86,8 8,28,2 +1,4+1,4
σσ 2,222,22
εε 0,700,70
1,6451,645εε +1,15+1,15
Amostras relacionadas: Amostras relacionadas: Intenções de compra Antes e DepoisIntenções de compra Antes e Depois
Pergunta: a média 8,2 (depois da propaganda) é significativamente maior do que 6,8 (antes da propaganda)?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
entrevistado A = antes D = depois D - A
1 5 5 0
2 10 8 -2
3 8 10 +2
4 7 8 +1
5 5 8 +3
6 6 9 +3
7 9 9 0
8 10 10 0
9 3 9 +6
10 5 6 +1
ΣΣ 6868 8282 +14+14
médiamédia 6,86,8 8,28,2 +1,4+1,4
σσ 2,222,22
εε 0,700,70
1,6451,645εε +1,15+1,15
simsim
Amostras relacionadas: Amostras relacionadas: Intenções de compra Antes e DepoisIntenções de compra Antes e Depois
Pergunta: a média 8,2 (depois da propaganda) é significativamente maior do que 6,8 (antes da propaganda)?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Amostras relacionadasAmostras relacionadas Cada caso observado na amostra A corresponde a um
caso observado na amostra B Como relacionar amostras:
a mesma pessoa responde sobre A e B• ex.: Antes e Depois
seleciono intencionalmente pares de respondentes equivalentes• seleciono pares de alunos com a mesma idade, sexo e média em
provas de matemática das classes A e B• submeto os A a um método de ensino tradicional e B a um novo
método• no fim do ano testo A vs B para saber se o novo método é mais
eficiente na ensino de matemática, aplicando uma mesma prova final a ambas as turmas
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O critério é prerrogativa do analista, assim como o risco: no caso de testes bicaudais:
• para 95%, z = 1,96 (probabilidade de erro = 0,05)• para 90%, z = 1,65 (probabilidade de erro = 0,10)• para 99%, z = 2,58 (probabilidade de erro = 0,01)
no caso de duas amostras independentes e testes monocaudais:• para 95%, z = 1,645 (probabilidade de erro = 0,05)• para 90%, z = 1,28 (probabilidade de erro = 0,10)• para 99%, z = 2,33 (probabilidade de erro = 0,01)
Teste de hipóteses: Teste de hipóteses: o que está por trás deleso que está por trás deles
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Teste de hipóteses: Teste de hipóteses: a vida é um jogo, a Estatística o seu cassinoa vida é um jogo, a Estatística o seu cassino
Erros de Tipo I: α = probabilidade de eu errar se rejeitar H0 (e aceitar H1) = erro de
Tipo I• Erro de tipo I = erro de aceitar H1 (H0 está certa)• Só rejeito H0 se a sua probabilidade α for realmente muito baixa
Erros de Tipo II: β = 1 – α = erro de aceitar H0 ( aceito H0, quando, na verdade, H1
está certa) O erro de tipo I é um complemento do erro de tipo II
ao reduzir α = erro de tipo I, eu aumento β = erro de tipo II Pergunta: contra qual erro você quer precaver-se?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Afinal, contra qual erro você Afinal, contra qual erro você quer precaver-se?quer precaver-se?
Em geral, considera-se o objetivo de diminuir o erro de tipo I
Cuidado com a facilidade de cálculo testes “por atacado” podem falsear
conclusões com números precisos• selecione poucas variáveis-chave e concentre-
se nelas testes de várias escalas redundantes devem
ser evitados
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Efeito de repetir uma observação Efeito de repetir uma observação e testá-la com z = 1,96e testá-la com z = 1,96
α certeza1 teste 0,050 95%
2 testes 0,097 90%3 testes 0,143 86%
... ... ...10 testes 0,401 60%
•Em vez de repetir a pesquisa, estenda-a (aumente a amostra, se possível)•O problema das grandes pesquisas científicas sobre fenômenos paranormais
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
...então, vamos lembrar alguns ...então, vamos lembrar alguns pontos-chave:pontos-chave:
A média obtida numa amostra é uma representação aproximada da média real do universo a média do universo tem um desvio-padrão que reflete a variação
entre os indivíduos do universo o desvio-padrão obtido na amostra é uma aproximação do desvio-
padrão do universo A média das médias das amostras extraídas do mesmo
universo é exatamente igual à média do universo ...e essa média das médias tem um desvio-padrão próprio
(erro-padrão) menor do que desvio-padrão do universo desvio-padrão amostral = desvio-padrão das médias das amostras =
erro-padrão
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
O desvio-padrão da média das médias de todas as amostras é o erro-padrão:
2 = 2 / n
Essa fórmula pressupõe que você conheça os seguintes valores reais do universo: σ2 ...e portanto μ
(em geral, letras gregas são usadas para indicar parâmetros)
Calculando ZCalculando Z
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em vez de μ e σ (desconhecidos), use a média e a variância da própria amostra: X em vez de μ s2 em vez de σ2
Calculando tCalculando t
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em vez de μ e σ (desconhecidos), use a média e a variância da própria amostra: X em vez de μ s2 em vez de σ2
Variância calculada a partir de uma amostra:• s2 = (Σ[xi-X]2) / n-1
– em vez de σ2 = (Σ[xi-μ]2)/ N Calcule e2 exatamente como calcularia ε2:
e2 = s2 / n Aplique t como se fosse Z:
valor crítico = t.e ...mas consulte a tabela de t em vez da de Z
Calculando tCalculando t
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em quantos dias de uma semana você Em quantos dias de uma semana você costuma acessar a Internet pelo computador costuma acessar a Internet pelo computador
de sua casa?de sua casa?A:
respostas(dias por semana)
B:pontos médios
(dias por semana)
C:# respondentes
D = B x C:respostas
E = B2 x C:quadrados
7 dias 7 20 140 980,0
5 a 6 dias 5,5 50 275 1512,5
3 a 4 dias 3,5 20 70 245,0
1 a 2 dias 1,5 10 15 22,5
TOTAIS 100 500 2760
16,010062,1
62,1626,2
626,21100
260
2601005002760
0,5100500
2
2
e
s
s
ss
x
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em quantos dias de uma semana você Em quantos dias de uma semana você costuma acessar a Internet pelo computador costuma acessar a Internet pelo computador
de sua casa?de sua casa?A:
respostas(dias por semana)
B:pontos médios
(dias por semana)
C:# respondentes
D = B x C:respostas
E = B2 x C:quadrados
7 dias 7 20 140 980,0
5 a 6 dias 5,5 50 275 1512,5
3 a 4 dias 3,5 20 70 245,0
1 a 2 dias 1,5 10 15 22,5
TOTAIS 100 500 2760
16,010062,1
62,1626,2
626,21100
260
2601005002760
0,5100500
2
2
e
s
s
ss
x
Quais os intervalos de confiança a 95% de certeza?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em quantos dias de uma semana você Em quantos dias de uma semana você costuma acessar a Internet pelo computador costuma acessar a Internet pelo computador
de sua casa?de sua casa?A:
respostas(dias por semana)
B:pontos médios
(dias por semana)
C:# respondentes
D = B x C:respostas
E = B2 x C:quadrados
7 dias 7 20 140 980,0
5 a 6 dias 5,5 50 275 1512,5
3 a 4 dias 3,5 20 70 245,0
1 a 2 dias 1,5 10 15 22,5
TOTAIS 100 500 2760
16,010062,1
62,1626,2
626,21100
260
2601005002760
0,5100500
2
2
s
s
ss
xIntervalo de confiança a 95% de certeza:• pelo Z: ± 1,96ε → entre 4,7 e 5,3• pelo t: ± 1,99ε → entre 4,4 e 5,6
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Exemplo de curvas de t para Exemplo de curvas de t para amostras pequenas de um universo amostras pequenas de um universo
pequenopequeno
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
As curvas de t As curvas de t em comparação com a de Zem comparação com a de Z
De modo geral, quanto menor a amostra: ...mais achatada a curva de t (menor concentração em torno da média) ...maior a distância entre a média (zero) e um limite qualquer de confiança
Use Z para amostras grandes
Use t para amostras pequenas
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Amostras grandes? Amostras grandes? Amostras pequenas?Amostras pequenas?
“Grande” é quando (N-1 / N) ≈ 1 depende de quantas casas decimais você pode reter
Consulte a tabela de t: “grande” ≥ 120 “pequena” < 120
• em algumas tabelas, “grande” é o que supera 60 casos, em outras 30
Dica: não se confunda, prefira t que acaba sendo Z no caso de amostras maiores nos trabalhos científicos os profissionais de outras áreas
querem apenas que se mencionem o t e o p
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Em suma – pontos a serem Em suma – pontos a serem lembrados:lembrados:
conceitos de Universo e de Amostra universo das amostras ►erro-padrão = desvio-
padrão amostral diferença entre t e Z no cálculo da variância a partir de amostras, use
sempre n – 1 no denominador testes de hipóteses: H1 e H0
amostras independentes e amostras relacionadas
AnExAnEx :: Analytical Expertise & Cenários por :: Analytical Expertise & Cenários por Pergentino Pergentino Mendes de AlmeidaMendes de Almeida
FESPSPFESPSP
Prova práticaProva prática
Vale 2 pontos
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Exercícios práticos – Q 1Exercícios práticos – Q 1 Numa amostra de 200 entrevistas, a média de
concordância com a frase “A mulher casada deve ser independente do marido” foi de 3,5 s = 1,02
a) Quais o limites de confiança a 90% de certeza para a média real do universo da população?
b) E para 95%? c) Como você entende esses números? d) Como você publicaria ao cliente ou à mídia essa
conclusão?
AnAnalytical ExExpertise by Pergentino Mendes de AlmeidaAnExAnEx FESPSPFESPSP
Exercícios práticos – Q 2Exercícios práticos – Q 2 Na pergunta de frequência de compra, amédia da amostra
representativa da população foi de 3,2 vezes por ano. A média das classes AB foi de 2,5 A média das classes C/D/E foi de 3,6. Hipótses:
a) as classes mais baixas têm frequências maiores do que as mais altas
b) a média das classes mais baixas é superior à média da população geral.
c) as classes mais altas compram menos do que a população geral entre quais limites deve estar a média ddos compradores em geral a
95% de certeza? e a 90%?.
Perguntas: para cada pergunta acima, qual a H1 e qual a H0? em cada caso, o teste é monocaudal ou bicaudal?