Z - Statistics vs. t - Statistics

Eu quero usar este vídeo para tipo, ter certeza de que nós intuitivamente ou em qualquer outra circunstância entendemos a diferença entre uma estatística Z... isso eu tenho algum problema em dizer... e uma estatística T. Então em muito do que estaremos fazendo em estatística inferencial, nós estaremos tentando descobrir qual é a probabilidade de obter uma determinada média amostral. Então o que nós estamos fazendo, especialmente quando nós temos um grande tamanho amostral... então deixe-me apenas desenhar uma distribuição amostral aqui. Então digamos que nós temos uma distribuição amostral da média amostral bem aqui. Isso tem um valor assumido de média e algum desvio padrão. O que nós queremos fazer é para qualquer resultado de nós tivermos, digamos que nós pegamos alguma média amostral aqui. Nós queremos descobrir a probabilidade de obter um resultado ao menos tão extremo como isso... Então você pode ou descobrir a probabilidade de obter um resultado menor do que este e subtrair isso de 1, ou apenas calcular esta área bem aqui. E para fazer isso, nós estaremos apenas calculando quantos desvios padrões abaixo da média nós temos. A maneira que nós calculamos isso é, nós temos nossa média amostral, nós subtraimos disso a própria média, nós subtraímos disso o que nós assumimos que deve ser a média, ou talve nós não saibamos o valor disso. E então nós dividimos isso pelo desvio padrão da distribuição amostral. Nós dividimos pelo desvio padrão da distribuição amostral. Isso são quantos desvios padrões nós estamos acima da média. Isso é esta distância bem aqui. Agora, nós normalmente também não sabemos o valor disso. Nós normalmente não sabemos também o que é isso. E o Teorema do Limite Central nos diz que assumindo que nós temos um tamanho amostral suficiente, essa coisa aqui, isso aqui irá ser a mesma coisa que... a amostra irá ser a mesma coisa que o desvio padrão da nossa população dividida pela raiz quadrada do tamanho da amostra. Então essa coisa bem aqui pode ser reescrita como a nossa média amostral menos a média da nossa distribuição amostral da média amostral dividida por essa coisa bem aqui... dividida pela nossa média populacional, dividida pela raiz quadrada do nosso tamanho amostral. E isso é essencialmente nosso melhor senso de quantos desvios padrão nós estamos afastados da nossa média real. E essa coisa bem aqui, nós aprendemos anteriormente, é um valor Z. Ou quando nós estamos lidando com uma determinada estatística na qual ela veio de uma estatística de média amostral, nós chamamos isso uma estatística Z. E então nós podemos olhar para uma tabela Z ou em uma tabela de distribuição normal para dizer qual é a probabilidade de obter um valor deste Z, ou maior. Então isso irá nos trazer esta probabilidade. Então qual é a probabilidade de obter este extremos como resultado? Agora normalmente quando nós fizemos isso nos últimos vídeos, nós também não sabemos qual era o desvido padrão da população. Então uma maneira de aproximar o que nós dissemos que o valor Z era aproximadamente, ou a estatística Z irá ser aproximadamente... então deixe-me apenas escrever este numerador em cima novamente... sobre... nós estimamos isso usando nosso desvio padrão amostral... deixe-me fazer isso em uma nova cor... isso usando nosso desvio padrão amostral. E isso está OK se nosso tamanho amostral for maior que 30. Ou oUtra maneira de pensar sobre isso será a distribuição normal se nosso tamanho amostral for maior do que 30. Mesmo esta aproximação irá ser aproximadamente normalmente distribuída. Agora, se nosso tamanho amostral for menor do que 30, especialmente se ele for bem menor do que 30, de repente toda essa expressão não será normalmente distribuída. Então deixe-me reescrever esta expressão bem aqui. Média amostral menos a média da nossa distribuição amostral da média amostral dividida pelo nosso desvio padrão amostral sobre a raiz quadrada do nosso tamanho amostral. Nós apenas dissemos que essa coisa aqui é bem maior que 30, ou ao menos 30, então este valor bem aqui, esta estatística, irá ser normalmente distribuída. Se ela não for, se isso for pequeno, então isso irá ter uma distribuição T. E quando nós formos fazer a mesma coisa que nós fizemos aqui, mas agora você poderia assumir que este sino não é mais uma distribuição normal, então neste exemplo isso foi normal. Todos os Zs são normalmente distribuídos. Bem aqui em uma distribuição T, e isso irá ser de fato uma distribuição T normalizada bem aqui, porquê nós subtraímos a média. Então em uma distribuição T normalizada, nós iremos ter uma média de zero. E o que nós iremos fazer é se você quiser calcular a probabilidade de obter um valor T ao menos neste extremo. Então isso é nosso valor T que você poderia ter, e então você essencialmente calcula a área sóbre a curva bem aqui. Então uma regra de outro bem fácil é calcular este valor Calcular este valor pelos dois modos. Se você for ter mais de 30 amostras, se seu tamanho amostral for maior do que 30, seu desvio padrão amostral irá ser uma bom aproximador para nosso desvio padrão da população. E então toda essa coisa irá ser aproximadamente normalmente distribuída, e então você pode usar uma tabela Z para calcular a probabilidade de obter um resultado ao menos neste extremo. Se o seu tamanho amostral for pequeno, então esta estatística, este valor, irá ter uma distribuição T, e então você irá ter que usar uma tabela T para descobrir a probabilidade de obter um valor T ao menos neste extremo. E nós iremos ver isso em exemplos em vários vídeos a partir de agora. De qualquer modo, espero que isso tenha ajudado a esclarecer algumas coisas em quando usar uma estatística Z e quando usar uma estatística T.