× Estatística 1 Estatística 2 Matemática Financeira Logística 1 Administração Financeira Logística 2

open

Estatística 2 - Aula 11

Aula 11 - Procedimento Geral do Teste de Hipóteses

Procedimento Geral do Teste de Hipóteses

Introdução

A construção de um teste de hipóteses, para um parâmetro populacional, pode ser colocada do seguinte modo. Existe uma variável X associada a dada população e tem-se uma hipótese sobre determinado parâmetro θ dessa população. Por exemplo, afirmamos que o verdadeiro valor de θ é 20 . Colhe-se uma amostra aleatória de elementos dessa população, e com ela deseja-se comprovar ou não tal hipótese.

Como já vimos anteriormente, iniciamos nossa análise explicitando claramente qual a hipótese que estamos colocando à prova e a chamamos de hipótese nula, e escrevemos:

\begin{equation} H_0: θ = 20\end{equation}

Em seguida, convém explicitar também a hipótese que será considerada aceitável, caso H 0 seja rejeitada. A essa hipótese chamamos de hipótese alternativa, e a sua caracterização estatística irá depender do grau de conhecimento que se tem do problema estudado. A alternativa mais geral seria:

\begin{equation} H_1: θ \neq 20\end{equation}

Poderíamos, ainda, ter alternativas da forma:

\begin{equation} H_1: θ < 20 \text{ ou } H_1: θ > 20\end{equation}

dependendo das informações que o problema traz.

Qualquer que seja a decisão tomada, vimos que estamos sujeitos a cometer erros. Para facilitar a linguagem, introduzimos as definições:

  • Erro de tipo I: rejeitar a hipótese nula quando essa é verdadeira.
\begin{equation} P(\text{erro do tipo I}) = P (\text{rejeitar } H_0 | H_0\text{ é verdadeira})\end{equation}

Erro de tipo II: não rejeitar H 0 quando H 0 é falsa.

\begin{equation} P(\text{erro do tipo II}) = P (\text{não rejeitar } H_0 | H_0\text{ é falsa})\end{equation}

O objetivo do teste de hipóteses é dizer se a hipótese H0 é ou não aceitável. Operacionalmente, essa decisão é tomada através da consideração de uma região crítica. Caso o valor observado da estatística pertença a essa região, rejeitamos H0; caso contrário, não rejeitamos H0. Esta região é construída de modo que a probabilidade de rejeitar H0 e ele ser verdadeira (o erro tipo 1) seja igual a uma probabilidade definida a priori. RC recebe o nome de região crítica ou região de rejeição do teste. Um fato importante a ressaltar é que a região crítica é sempre construída sob a hipótese de H0 ser verdadeira. A determinação do erro de tipo II já é mais difícil, pois usualmente não especificamos valores fixos para o parâmetro sob a hipótese alternativa.

A probabilidade de se cometer um erro de tipo I (ou de primeira espécie) é um valor arbitrário e recebe o nome de nível de significância do teste. O resultado da amostra é tanto mais significante para rejeitar H 0 quanto menor for esse nível. Ou seja, quanto menor for a significância, menor é a probabilidade de se obter uma amostra com estatística pertencente à região crítica, sendo pouco verossímil a obtenção de uma amostra da população para a qual H0 seja verdadeira e o teste rejeitá-la. Usualmente, o valor de α é fixado em 5%, 1% ou 0,1%.

Passos para a Construção de um Teste de Hipóteses

Daremos abaixo uma seqüência que pode ser usada sistematicamente para qualquer teste de hipóteses.

  • Passo 1. Fixe qual a hipótese H 0 a ser testada e qual a hipótese alternativa H 1 .
  • Passo 2. Use a teoria estatística e as informações disponíveis para decidir qual estatística (estimador) será usada para testar a hipótese H 0 . Obter as propriedades dessa estatística (distribuição, média, desvio padrão).
  • Passo 3. Fixe a probabilidade α de cometer o erro de tipo I e use este valor para construir a região crítica (regra de decisão). Lembre que essa região é construída para a estatística definida no passo 2, usando os valores do parâmetro hipotetizados por H0.
  • Passo 4. Use as observações da amostra para calcular o valor da estatística do teste.
  • Passo 5. Se o valor da estatística calculado com os dados da amostra não pertencer à região crítica, não rejeite H 0 ; caso contrário, rejeite H0.

Procuraremos, sempre que fizermos teste de hipóteses, distinguir bem esses cinco passos. Finalmente um comentário sobre H 0 e o erro de tipo I. Devemos tomar como H 0 aquela hipótese, que, rejeitada, conduza a um erro de tipo I mais importante de evitar.

Vejamos um exemplo devido a Neyman (1978). Suponha um experimento para se determinar se um produto A é ou não cancerígeno. Após realizado o teste, podemos concluir: (i) A é cancerígeno ou (ii) A não é cancerígeno. Cada uma dessas conclusões pode estar errada e temos os dois tipos de erro já mencionados, dependendo de qual hipótese seja H 0 . Do ponto de vista do usuário do produto, a hipótese a ser testada deve ser

\begin{equation} H_0: \text{ A é cancerígeno}\end{equation}

pois a probabilidade de erro na rejeição dessa hipótese, se ela for verdadeira, deve ser um valor muito pequeno.

Quantidade de caudas

Há 3 tipos de testes:

Unilateral (unicaudal à esquerda)

\begin{equation} H_0: \mu = \mu_0 \end{equation}\begin{equation}H_1: \mu < \mu_0 \end{equation}

Rejeita–se \begin{equation} Z{calc} < -Z\alpha \end{equation}

Unilateral (unicaudal à direita)

\begin{equation} H_0: \mu = \mu_0 \end{equation}\begin{equation} H_1: \mu > \mu_0 \end{equation}

Rejeita–se \begin{equation}Z{calc} > Z\alpha \end{equation}

Bilateral

\begin{equation} H_0: \mu = \mu_0 \end{equation}\begin{equation} H_1: \mu \ne \mu_0 \end{equation}

Rejeita–se \begin{equation} Z{calc}>Z{\frac {\alpha }{2}} \end{equation}

Testes sobre a Média de uma População com Variância Conhecida

Vejamos, agora, uma aplicação dos cinco passos definidos na seção anterior, para testar a hipótese de que a média de uma população μ seja igual a um número fixado μ 0 , supondo-se a variância σ 2 dessa população conhecida.

Exemplos

Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média μ e variância sempre igual a 400 g 2 . A máquina foi regulada para μ = 500 g. Desejamos, periodicamente, colher uma amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se μ = 500 g ou não. Se uma dessas amostras apresentasse uma média de 492 g, você pararia ou não a produção para regular a máquina com 1% de significância?

  • Passo 1. As hipóteses que nos interessam são:
\begin{equation} H_0: μ = 500 g\end{equation}\begin{equation} H_1: μ \neq 500 g\end{equation}

pois a máquina pode desregular para mais ou para menos.

  • Passo 2. Média da população é de 500 g e seu desvio padrão será de 20/4 que é igual a 5.

  • Passo 3. pela hipótese alternativa, vemos que H0 deve ser rejeitada quando x for muito pequena ou muito grande (dizemos que temos um teste bilateral). Teremos assim 0,5% de probabilidade para cada lado:

O primeiro ponto da RC será:

\begin{equation} z_1 => -2,58 = \frac{x_1 - 500}{5} => x_1 = 487,1\end{equation}

O segundo:

\begin{equation} z_2 => 2,58 = \frac{x_2 - 500}{5} => x_2 = 512,9\end{equation}

Sabe-se logo que a região crítica será: {x pertence RC | x < 487,1 ou x > 512,9 }

  • Passo 4. A informação pertinente da amostra é sua média, que nesse caso particular é x = 492.

  • Passo 5. Como x não pertence à região crítica, nossa conclusão será de não rejeitar H0. Ou seja, o desvio da média da amostra para a média proposta por H0 pode ser considerado como devido apenas ao sorteio aleatório dos pacotes.

Na indústria cerâmica, avalia-se sistematicamente a resistência de amostras de massas cerâmicas, após o processo de queima. Dessas avaliações, sabe-se que certo tipo de massa tem resistência mecânica aproximadamente normal, com média 53 MPa e variância 16 MPa². Após a troca de alguns fornecedores de matérias- primas, deseja-se verificar se houve alteração na qualidade. Uma amostra de 15 corpos de prova de massa cerâmica acusou média igual a 50 MPa. Qual é a conclusão ao nível de significância de 5 %?

  • Passo 1. Realizaremos um teste bilateral, porque antes de a amostra ser observada, não sabíamos se a resistência deveria ser maior ou menor que 53. Assim,
\begin{equation} H_0: μ = 53 \end{equation}\begin{equation} H_1: μ \neq 53 \end{equation}
  • Passo 2. Média da população é de 53 e seu desvio padrão será de 4 dividido pela raiz de 15.

  • Passo 3. pela hipótese alternativa, vemos que H0 deve ser rejeitada quando x for muito pequena ou muito grande (dizemos que temos um teste bilateral). Teremos assim 2,5% de probabilidade para cada lado:

Qual a probabilidade de a média da amostra ser 50?

\begin{equation} z = \frac{50 - 53}{\frac{4}{\sqrt{15}}} = -2,9 \end{equation}

Com z de -2,9 seu p-valor é de 0,79%, o que é uma probabilidade menor de ocorrer que 2,5%.

Logo, devido a probabilidade de uma amostra com essa média ocorrer ser muito pequena, podemos rejeitar H0 que a resistência do conjunto amostral é similar ao da população.

Exercícios

1) Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica apresenta-se no nível recomendado de 23 mg por cigarro. Um laboratório realiza seis análises desse índice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se distribui normalmente, com variância igual a 4 mg2. Pode-se aceitar, no nível de 10%, a afirmação do fabricante?

2) O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusação, ele usou uma amostra de tamanho 50, onde 27% das pe¸cas eram defeituosas. Moste como o fabricante poderia refutar a acusação. Utilize um nível de significância de 10%. (desvio padrão = raiz de (p * (1 - p))

3) Um fabricante garante que 90% dos equipamentos que fornece a uma fábrica estão de acordo com as especificações exigidas. O exame de uma amostra de 200 peças desse equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, nos níveis de 5% e 1%. (desvio padrão = raiz de (p * (1 - p))

4) A resistência à tração do aço inoxidável produzido numa certa usina permanecia estável, com uma resistência média de 72 kg/mm2 e um desvio-padrão de 2,0 kg/mm2 com distribuição normal. Recentemente a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas. Os testes apresentaram resistência média de 75 kg/mm2 . Considere que o desvio-padrão não mudou. Com base nesses dados responda: com um nível de significância de 5% é possível afirmar que o valor médio não mudou?

5) A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. Teste a afirmação da empresa, contra a alternativa que a duração é inferior a 400 horas, ao nível de significância de 1%, se o desvio-padrão da população é de 60 horas (considere distribuição normal).

6) Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu inspecionar 200 delas. Decidiu, também, que o lote será rejeitado se ficar convencido, ao nível de 5% de significância, de que a proporção de peças defeituosas no lote é superior a 4%. Qual será sua decisão (aceitar ou rejeitar o lote) se na amostra foram encontradas onze peças defeituosas? (desvio padrão = raiz de (p * (1 - p))

7) Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu inspecionar 200 delas. Decidiu, também, que o lote será rejeitado se ficar convencido, ao nível de 5% de significância, de que a proporção de peças defeituosas no lote é superior a 4%. Qual será sua decisão (aceitar ou rejeitar o lote) se na amostra foram encontradas 14 peças defeituosas? (desvio padrão = raiz de (p * (1 - p))

Gabarito

1) Podemos rejeitar a hipótese nula.

2) Para não rejeitar a hipótese do cliente, ele deveria ter observado uma quantidade de ao menos 27,24% de itens defeituosos.

3) Em nenhuma situação a hipótese nula pode ser rejeitada.

4) Rejeita-se Ho, ou seja, não é possível afirmar.

5) Não é possível rejeitar a hipótese nula.

6) Não é possível rejeitar a hipótese nula.

7) Pode-se rejeitar a hipótese nula.

In [ ]: