× Estatística 1 Estatística 2 Matemática Financeira Logística 1 Administração Financeira Logística 2

open

Estatística 2 - Aula 9

Aula 11 - Tamanho amostral

Tamanho amostral

Introdução

O processo de escolha dos indivíduos que pertencerão a uma AMOSTRA, é denominado AMOSTRAGEM. O pesquisador busca generalizar conclusões referentes à AMOSTRA, estendendo-as para toda a POPULAÇÃO da qual essa amostra foi extraída.

Não há dúvida de que uma amostra não representa perfeitamente uma população. Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro que denominaremos ERRO AMOSTRAL. Este é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias.

Ocorrem erros não-amostrais quando:

  • Os dados amostrais são coletados, registrados ou analisados incorretamente.
  • Há uma utilização de um instrumento defeituoso durante a realização de mensurações.
  • Um questionário ou formulário possui questões formuladas de modo tendencioso [Triola, 1999].

Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários, quanto maior o tamanho da amostra, menor o erro cometido e vice-versa.

Determinação do tamanho da amostra

A determinação do tamanho de uma amostra é problema de grande importância, porque:

  • amostras desnecessariamente grandes acarretam desperdício de tempo e de dinheiro;
  • e amostras excessivamente pequenas podem levar a resultados não confiáveis.

Em muitos casos é possível determinar o tamanho mínimo de uma amostra para estimar um parâmetro estatístico, como por exemplo, a MÉDIA POPULACIONAL (µ) .

Mas como calcular o tamanho amostral (n) a partir de parâmetros já conhecidos?

Dados um Intervalo de confiança [a, b], temos que:

\begin{equation} a = \bar{x} - z * \frac{\sigma}{\sqrt{n}} \end{equation}\begin{equation} b = \bar{x} + z * \frac{\sigma}{\sqrt{n}} \end{equation}

Nota-se que a distância da média da amostra até o extremo do intervalo, que também podemos chamar de margem de erro do intervalo, é dado por:

\begin{equation} \text{margem de erro} = z * \frac{\sigma}{\sqrt{n}} \end{equation}

Que também pode ser escrito:

\begin{equation} \text{margem de erro} * \sqrt{n} = z * \sigma \end{equation}\begin{equation} \sqrt{n} = z * \frac{\sigma}{\text{margem de erro}} \end{equation}\begin{equation} n = [z * \frac{\sigma}{\text{margem de erro}}]^{2} \end{equation}\begin{equation} n = [z * \frac{\sigma}{E}]^{2} \end{equation}

Logo, caso queira saber o tamanho da amostra, irá precisar das seguintes variáveis:

  • Escolher uma determinada margem de erro;
  • Escolher uma determinada significância;
  • Saber o desvio padrão da população.

Exemplos

Um economista deseja estimar a renda média para o primeiro ano de trabalho de um bacharel em direito. Quantos valores de renda devem ser tomados, se o economista deseja ter 95% de confiança em que a média amostral esteja a menos de R\$500,00 da verdadeira média populacional? Suponha que saibamos, por um estudo prévio, que para tais rendas, σ = R\$6250,00.

  • σ = 6250
  • E = 500
  • Significância de 95% ou z de 1,96.
\begin{equation} n = [z * \frac{\sigma}{E}]^{2} = 600,25 = 601 \end{equation}

Devemos, portanto, obter uma amostra de ao menos 601 rendas de primeiro ano, selecionadas aleatoriamente, de bacharéis de faculdades que tenham feito um curso de direito. Com tal amostra teremos 95% de confiança em que a média amostral x difira em menos de R\$500,00 da verdadeira média populacional µ

Baseado nos dados do exemplo anterior, utilize uma margem de erro maior, como R\$1.000,00 e determine qual seria o tamanho da amostra necessário nesta situação.

Como a margem de erro dobrou e ela divide o tamanho amostral ao quadrado, logo, deve-se dividir o tamanho amostral anterior por 2 ao quadrado que é 4. Tendo assim 151 de tamanho amostral.

E se σ não for conhecido?

A equação sobre tamanho amostral exige que se substitua por algum valor o desvio-padrão populacional σ, mas se este for desconhecido, devemos poder utilizar um valor preliminar obtido por processos como os que se seguem:

  • Utilizar a aproximação σ ≈ amplitude/4.
  • Realizar um estudo piloto, iniciando o processo de amostragem. Com base na primeira coleção de pelo menos 31 valores amostrais selecionados aleatoriamente, calcular o desvio padrão amostral S e utilizá-lo em lugar de σ. Este valor pode ser refinado com a obtenção de mais dados amostrais.
  • Utilizar uma estimativa da proporção do tamanho populacional do item que gostaria de ser estudado. Para este caso utiliza-se o desvio padrão da binomial: raiz de p * (1 – p).
  • Caso não de valores de estimativa para proporção, mas é discutida a proporção, numa amostra com amplitude de 0 a 100%, utiliza-se 50% no caso para p. p de 50% é o que maximiza a função p * (1 – p).

Exemplos

Um assistente social deseja saber o tamanho da amostra (n) necessário para determinar a proporção da população atendida por uma Unidade de Saúde, que pertence ao município de Cariacica. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de estimativa (E) seja de ±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?

  • Significância de 90% é igual z de 1,645;
  • σ de 0,25 por não ser conhecido;
  • Erro de 0,05.
\begin{equation} n = [z * \frac{\sigma}{E}]^{2} = 270,6 = 271 \end{equation}

Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporção da população atendida na Unidade de Saúde, que se origina do município de Cariacica.

Exercícios

1) Um pesquisador deseja estimar a proporção de ratos nos quais se desenvolve um certo tipo de tumor quando submetidos a radiação. Ele deseja que sua estimativa não se desvie da proporção verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%. Quantos animais ele precisa examinar para satisfazer essa exigência?

2) Com os dados do exercícios anterior. Como seria possível diminuir o tamanho da amostra utilizando a informação adicional de que em geral esse tipo de radiação não afeta mais que 20% dos ratos?

3) Antes de uma eleição, um determinado partido está interessado em estimar a proporção de eleitores favoráveis a seu candidato. Determine o tamanho de amostra necessário para que o erro cometido na estimação seja de, no máximo 0,01, com probabilidade de 80%.

4) Se, pelo exercício anterior, observou-se que 55% dos eleitores eram favoráveis ao candidato, construa um intervalo de confiança para a proporção de eleitores do candidato com coeficiente de confiança de 0,95.

5) Um cientista resolve estimar a proporção p de indivíduos com certa moléstia numa região. Ele deseja que a probabilidade de que a sua estimativa não se desvie do verdadeiro valor de p por mais que 0,02 seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que essas condições sejam satisfeitas? Um outro cientista descobre que a doença em questão está relacionada com a concentração da substância A no sangue e que é considerado doente todo indivíduo para o qual a concentração A é menor que 1,488 mg/cm 3 . Sabe-se que a concentração da substância A no sangue tem distribuição normal com desvio padrão 0,4 mg/cm 3 e média maior que 2,0 mg/cm 3 . Você acha que essas novas informações podem ser utilizadas pelo primeiro cientista para diminuir o tamanho amostral? Qual o tamanho amostral ideal?

6) Um centro de estudos de pesquisa de opinião realizou uma pesquisa para avaliar a opinião dos telespectadores de uma região, sobre um certo comentarista esportivo. Para isso entrevistou 380 telespectadores, selecionados ao acaso da região, e constatou que 180 desejavam que o comentarista fosse afastado da TV. Determine um intervalo de confiança de 90% para p:proporção de telespectadores, favoráveis ao afastamento do comentarista.

Gabarito

1) 1681

2) 1.076

3) 4096

4) I.C = 53,5% a 56,5%

5) Para não: 2.401; Para sim: 865

6) IC = 43 % a 51%

In [ ]: