Tip:
Highlight text to annotate it
X
Eu quero usar este vídeo para tipo, ter certeza de que nós
intuitivamente ou em qualquer outra circunstância
entendemos a diferença entre uma estatística Z...
isso eu tenho algum problema em dizer...
e uma estatística T.
Então em muito do que estaremos fazendo em estatística
inferencial, nós estaremos tentando descobrir qual é a
probabilidade de obter uma determinada média amostral.
Então o que nós estamos fazendo, especialmente quando nós temos
um grande tamanho amostral...
então deixe-me apenas desenhar uma distribuição amostral aqui.
Então digamos que nós temos uma distribuição amostral da
média amostral bem aqui.
Isso tem um valor assumido de média
e algum desvio padrão.
O que nós queremos fazer é para qualquer resultado de nós tivermos, digamos
que nós pegamos alguma média amostral aqui.
Nós queremos descobrir a probabilidade de obter um
resultado ao menos tão extremo como isso...
Então você pode ou descobrir a probabilidade de obter um
resultado menor do que este e subtrair isso de 1, ou
apenas calcular esta área bem aqui.
E para fazer isso, nós estaremos apenas calculando quantos desvios
padrões abaixo da média nós temos.
A maneira que nós calculamos isso é, nós temos nossa média amostral, nós
subtraimos disso a própria média, nós subtraímos disso
o que nós assumimos que deve ser a média, ou talve nós não saibamos
o valor disso.
E então nós dividimos isso pelo desvio padrão da
distribuição amostral.
Nós dividimos pelo desvio padrão
da distribuição amostral.
Isso são quantos desvios padrões nós
estamos acima da média.
Isso é esta distância bem aqui.
Agora, nós normalmente também não sabemos o valor disso.
Nós normalmente não sabemos também o que é isso.
E o Teorema do Limite Central nos diz que assumindo que nós
temos um tamanho amostral suficiente, essa coisa aqui, isso
aqui irá ser a mesma coisa que... a amostra irá ser
a mesma coisa que o desvio padrão da nossa
população dividida pela raiz quadrada do tamanho da amostra.
Então essa coisa bem aqui pode ser reescrita como a nossa
média amostral menos a média da nossa distribuição amostral da
média amostral dividida por essa coisa bem aqui...
dividida pela nossa média populacional, dividida pela raiz
quadrada do nosso tamanho amostral.
E isso é essencialmente nosso melhor senso de quantos
desvios padrão nós estamos afastados da nossa média real.
E essa coisa bem aqui, nós aprendemos anteriormente, é um
valor Z.
Ou quando nós estamos lidando com uma determinada estatística na qual
ela veio de uma estatística de média amostral, nós chamamos isso uma
estatística Z.
E então nós podemos olhar para uma tabela Z ou em uma tabela
de distribuição normal para dizer qual é a probabilidade de
obter um valor deste Z, ou maior.
Então isso irá nos trazer esta probabilidade.
Então qual é a probabilidade de obter este
extremos como resultado?
Agora normalmente quando nós fizemos isso nos últimos vídeos,
nós também não sabemos qual era o desvido padrão
da população.
Então uma maneira de aproximar o que nós dissemos que o valor Z
era aproximadamente, ou a estatística Z
irá ser aproximadamente...
então deixe-me apenas escrever este numerador em cima
novamente... sobre... nós estimamos isso usando nosso desvio padrão
amostral... deixe-me fazer isso em uma nova cor...
isso usando nosso desvio padrão amostral.
E isso está OK se nosso tamanho amostral for maior que 30.
Ou oUtra maneira de pensar sobre isso será a distribuição
normal se nosso tamanho amostral for maior do que 30.
Mesmo esta aproximação irá ser
aproximadamente normalmente distribuída.
Agora, se nosso tamanho amostral for menor do que 30, especialmente se
ele for bem menor do que 30, de repente toda essa
expressão não será normalmente distribuída.
Então deixe-me reescrever esta expressão bem aqui.
Média amostral menos a média da nossa distribuição amostral da
média amostral dividida pelo nosso desvio padrão amostral
sobre a raiz quadrada do nosso tamanho amostral.
Nós apenas dissemos que essa coisa aqui é bem maior que 30, ou ao menos 30,
então este valor bem aqui, esta estatística, irá ser
normalmente distribuída.
Se ela não for, se isso for pequeno, então isso irá ter uma
distribuição T.
E quando nós formos fazer a mesma coisa que nós fizemos
aqui, mas agora você poderia assumir que este sino não é mais uma
distribuição normal, então neste exemplo isso foi normal.
Todos os Zs são normalmente distribuídos.
Bem aqui em uma distribuição T, e isso irá ser de fato
uma distribuição T normalizada bem aqui, porquê nós
subtraímos a média.
Então em uma distribuição T normalizada, nós iremos
ter uma média de zero.
E o que nós iremos fazer é se você quiser calcular a
probabilidade de obter um valor T ao menos neste extremo.
Então isso é nosso valor T que você poderia ter, e então você
essencialmente calcula a área sóbre a curva bem
aqui.
Então uma regra de outro bem fácil é calcular este valor
Calcular este valor pelos dois modos.
Se você for ter mais de 30 amostras, se seu tamanho amostral
for maior do que 30, seu desvio padrão amostral irá ser
uma bom aproximador para nosso
desvio padrão da população.
E então toda essa coisa irá ser aproximadamente
normalmente distribuída, e então você pode usar uma tabela Z para
calcular a probabilidade de obter um resultado
ao menos neste extremo.
Se o seu tamanho amostral for pequeno, então esta estatística, este
valor, irá ter uma distribuição T, e então você irá
ter que usar uma tabela T para descobrir a
probabilidade de obter um valor T
ao menos neste extremo.
E nós iremos ver isso em exemplos em vários
vídeos a partir de agora. De qualquer modo,
espero que isso tenha ajudado a esclarecer algumas coisas em
quando usar uma estatística Z e quando usar uma estatística T.