× Estatística 1 Estatística 2 Matemática Financeira Logística 1 Administração Financeira Logística 2

open

Estatística 2 - Aula 10

Aula 10 - Teste de hipótese e seus erros

Teste de hipótese e seus erros

Introdução

Um dos problemas a serem resolvidos pela inferência estatística é o de testar uma hipótese. Isto é, feita determinada afirmação sobre uma população, usualmente sobre um parâmetro dessa, desejamos saber se os resultados experimentais provenientes de uma amostra contrariam ou não tal afirmação.

O objetivo do teste estatístico de hipóteses é, então, fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apóiem ou não uma hipótese (estatística) formulada.

A idéia central do teste de hipótese é a de supor verdadeira a hipótese em questão e verificar se a amostra observada é “verossímil” nessas condições.

Um Exemplo

Uma indústria usa, como um dos componentes das máquinas que produz, um parafuso importado, que deve satisfazer a algumas exigências. Uma dessas é a resistência à tração. Esses parafusos são fabricados por alguns países, e as especificações técnicas variam de país para país. Por exemplo, o catálogo do país A afirma que a resistência média à tração de seus parafusos é de 145 kg, com desvio padrão de 12 kg. Já para o país B, a média é de 155 kg e desvio padrão 20 kg. Teria como descobrirmos de onde é o parufoso a partir da sua resistência?

Um lote desses parafusos, de origem desconhecida, será leiloado a um preço muitoconvidativo. Para que a indústria saiba se faz ou não uma oferta, ela necessita saber qual país produziu tais parafusos. O edital do leiloeiro afirma que, pouco antes do leilão, será divulgada a resistência média ⎯ x de uma amostra de 25 parafusos do lote. Qual regra de decisão deve ser usada pela indústria para dizer se os parafusos são do país A ou B?

A maneira mais simples de resolver esse problema seria dizer como país produtor aquele para o qual o item mais se aproxima da média da população.

Assim pegaríamos o ponto médio entre os dois países:

\begin{equation} \text{ponto médio: } \frac{145 + 155}{2} = 150\end{equation}

Suponhamos que a resistência média do lote fosse de 148; de acordo com nossa regra de decisão, diríamos que os parafusos são de origem A. Podemos estar enganados nessa conclusão? Ou, em outras palavras, é possível que na origem B tenha um parafuso de resistência 148? Sim, é possível. Então, para melhor entendermos a regra de decisão adotada, é interessante estudarmos os tipos de erros que podemos cometer e as respectivas probabilidades.

Os tipos de erro

Erro tipo 1: Dizer que os parafusos são de A quando na realidade são de B. Ser B mesmo a média da amostra sendo menor que 150 kg.

Erro tipo 2: dizer que os parafusos são de B, quando na realidade eles são de A. Ser A mesmo a média da amostra ser maior que 150 kg.

Para facilitar ainda mais, vamos definir duas hipóteses também numeradas:

H0 (também chamado de hipótese nula): os parafusos são de origem B. Com média 155 e desvio padrão 20.

H1: os parafusos são de origem A. Com média 145 e desvio padrão 12.

Quando H0 for verdadeira, isto é, os parafusos forem de B, sabemos do X terá distribuição aproximadamente normal, com média 155 e desvio padrão igual a 20/√25 = 4. Logo, para parafusos com resistência menor que 150 kg:

\begin{equation} P(\text{erro 1}) = P(H_0\text{ ser verdadeira}) \end{equation}\begin{equation} P(\text{erro 1}) = P(X < 150) \end{equation}\begin{equation} P(\text{erro 1}) = P(Z < \frac{150 - 155}{4}) \end{equation}\begin{equation} P(\text{erro 1}) = P(Z < - 1,25) = 0,1056 = 10,56\% \end{equation}

De modo análogo, quando H 1 for a alternativa verdadeira, teremos que:

\begin{equation} P(\text{erro 2}) = P(H_1\text{ ser verdadeira}) \end{equation}\begin{equation} P(\text{erro 2}) = P(X > 150) \end{equation}\begin{equation} P(\text{erro 2}) = P(Z > \frac{150 - 145}{2,4}) \end{equation}\begin{equation} P(\text{erro 2}) = P(Z > 2,08) = 0,01876 = 1,88\% \end{equation}

Essas probabilidades são melhores apresentadas no quadro:

Origem real do parafuso Resistência < 150 Resistência > 150
A Sem erro Erro tipo II
1,88%
B Erro tipo I
10,56%
Sem erro

podemos notar que, se os parafusos forem realmente de B (segunda linha) e a amostra tiver média superior a 150 (segunda coluna), diremos que são de B, e não cometeremos erro algum. Por outro lado, se a média ⎯ x for inferior a 150 (primeira coluna), devemos dizer que são de A, e estaremos cometendo um erro cuja probabilidade nesse caso é de 10,56%. De modo análogo, teremos uma interpretação para o caso de os parafusos serem realmente de A (primeira linha).

Para cada regra de decisão adotada, isto é, se escolhermos um valor qualquer em vez de 150, apenas as probabilidades dos erros tipos I e tipo II mudarão.

Logo, deve existir um ponto em que o erro do tipo I seja igual ao erro do tipo II , ou seja, uma regra de decisão em que a probabilidade de errar contra A seja a mesma que errar contra B. Mostre que esse ponto é 148,75 kg, e nesse caso α = β = 5,94%.

Do exposto acima constatamos que, escolhido um valor de x, podemos achar as probabilidades de cometer cada tipo de erro. Mas também podemos proceder de modo inverso: fixar um dos erros, digamos α, e encontrar a regra de decisão que irá corresponder à probabilidade de erro de tipo I igual a α.

Por exemplo, fixemos α em 5%, e vejamos qual a regra de decisão correspondente. Temos:

\begin{equation} P(\text{erro 1}) = 5\% \end{equation}\begin{equation} P(\text{erro 1}) = P(Z < -1,645) \end{equation}\begin{equation} -1,645 = \frac{x - 155}{4} \end{equation}\begin{equation} x = 148,42 \end{equation}

Então, a regra de decisão será:

Se a média do lote estudado for inferior a 148,42, dizemos que o lote é de A; caso contrário, dizemos que é de B.

Com essa regra, a probabilidade do erro de tipo II será:

\begin{equation} Z = \frac{148,42 > 145}{2,4} \end{equation}\begin{equation} Z = 1,425 = 7,93\% \end{equation}

Esse segundo tipo de procedimento é bastante utilizado, porque usualmente a decisão que devemos tomar não é apenas entre duas possíveis populações. Os parafusos poderiam ser produzidos por outros países além daqueles citados e, portanto, com outras características quanto à resistência média. Suponha, ainda, que interessa à indústria fazer uma proposta apenas no caso de o parafuso ser de origem B. Qual a regra de decisão que deve adotar?

A hipótese que nos interessa agora é:

\begin{equation} H_0 = \text{os parafusos são de origem B (μ = 155 e σ = 20)} \end{equation}\begin{equation} H_1 = \text{os parafusos não são de origem B (μ e σ desconhecidos)} \end{equation}

Aqui não podemos especificar os parâmetros sob a hipótese alternativa H 1 , pois se não forem de origem B, os parafusos podem ser de vários outros países, cada um com suas próprias especificações. Alguns países podem ter técnicas mais sofisticadas de produção e, portanto, produzir com resistência média superior a 155. Outros, como no exemplo dado, com resistência menor. A especificação da hipótese alternativa depende muito do grau de informação que se tem do problema. Por exemplo, vamos admitir que a indústria do país B para esse caso seja a mais desenvolvida, e nenhum outro país possa produzir uma resistên- cia média superior à dela. Então, nossa hipótese alternativa seria mais explícita:

\begin{equation} H_1 = \text{os parafusos não são de origem B ( μ < 155 e σ qualquer)} \end{equation}
Origem real do parafuso Resistência < 148,42 Resistência > 148,42
B Erro tipo I
5%
Sem erro
não B Sem erro Erro tipo II
?%

Como a indústria poderia dizer que os parafusos não são de B, isto é, não tem média 155, com erro de 5%?

\begin{equation} H_0 = \text{os parafusos são de origem B (μ = 155 e σ = 20)} \end{equation}\begin{equation} H_1 = \text{os parafusos não são de origem B (μ e σ desconhecidos)} \end{equation}\begin{equation} P(\text{erro 1}) = 5\% \end{equation}\begin{equation} P(\text{erro 1}) = P(X < 2,5\%) ou P(X > 97,25\%) \end{equation}\begin{equation} P(\text{erro 1}) = P(Z < -1,96) ou P(Z > 1,96) \end{equation}\begin{equation} -1,96 = \frac{X_1 -155}{4} => X_1 = 147,16 \end{equation}\begin{equation} 1,96 = \frac{X_2 -155}{4} => X_2 = 162,84 \end{equation}

Logo, para qualquer valor abaixo de 147,16 e acima de 162,84 poderemos rejeitar a hipótese nula que os parafusos são de origem B.

Exercícios

1) Para decidirmos se os habitantes de uma ilha são descendentes da civilização A ou B, iremos proceder do seguinte modo:

(i) selecionamos uma amostra de 100 moradores adultos da ilha, e determinamos a altura média deles;
(ii) se essa altura média for superior a 176, diremos que são descendentes de B; caso contrário, são descendentes de A.

Os parâmetros das alturas das duas civilizações são: A : μ = 175 e σ = 10; B : μ = 177 e σ = 10. Definamos: Erro de tipo I — dizer que os habitantes da ilha são descendentes de B quando, na realidade, são de A. Definamos: Erro de tipo II — dizer que são de A quando, na realidade, são de B.

(a) Qual a probabilidade do erro de tipo I? E do erro de tipo II?
(b) Qual deve ser a regra de decisão se quisermos fixar a probabilidade do erro de tipo I em 5%? Qual a probabilidade do erro de tipo II, nesse caso?


2) Nas situações abaixo, escolha como hipótese nula, H0 , aquela que para você leva a um erro de tipo I mais importante. Descreva quais os dois erros em cada caso.

(a) O trabalho de um operador de radar é detectar aeronaves inimigas. Quando surge
alguma coisa estranha na tela, ele deve decidir entre as hipóteses:
1. está começando um ataque;
2. tudo bem, apenas uma leve interferência.

(b) Num júri, um indivíduo está sendo julgado por um crime. As hipóteses sujeitas ao júri são:
1. o acusado é inocente;
2. o acusado é culpado.

(c) Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele irá conduzir  uma pesquisa de laboratório para verificar a veracidade da afirmação. De acordo com o resultado, ele lançará ou não a vacina no mercado. As hipóteses que pode testar são:
1. a vacina é eficaz;
2. a vacina não é eficaz.


3) A variável X, custo de manutenção de um tear, pode ser considerada como tendo distribuição normal de média μ e desvio padrão 20 unidades. Os valores possíveis de μ podem ser 200 ou 210. Para verificar qual dos dois valores é o mais provável, usar-se-á uma amostra de 25 teares. Defina:

(a) Uma hipótese a ser testada.
(b) Uma regra de decisão e encontre as probabilidades dos erros de tipo I e II.

4) A associação dos proprietários de indústrias metalúrgicas está muito preocupada com o tempo perdido com acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio padrão de 20 horas/homem. Tentou-se um programa de prevenção de acidentes, após o qual foi tomada uma amostra de nove indústrias e medido o número de horas/homens perdidos por acidentes, que foi de 50 horas. Você diria, no nível de 5%, que há evidência de melhoria?

Gabarito

1) a) % erro tipo 1 = % erro tipo 2 = 15,9%; b) Regra de decisão de 176.64. Erro tipo 2 de 35,9%;

4) Não é possível rejeitar a hipótese nula.

In [ ]: