Processing math: 71%

Sumário


1 Introdução

A estimação intervalar é uma técnica da estatística inferencial usada para estimar um parâmetro populacional, como uma média ou proporção, com um intervalo de valores em vez de apenas um ponto específico. O intervalo é construído de forma a incluir o parâmetro verdadeiro da população com uma determinada probabilidade, chamada de nível de confiança.

Conceitos Básicos:

Exemplo Básico:

Suponha que medimos a altura média de uma amostra de pessoas e encontramos uma média de 170 cm com um desvio padrão de 10 cm. Se usarmos um nível de confiança de 95%, podemos calcular um intervalo de confiança para estimar a média populacional com a fórmula do intervalo para uma média amostral.

A estimativa intervalar nos permite considerar a incerteza presente na amostra e obter uma estimativa mais confiável e prática do parâmetro populacional, sendo uma das ferramentas mais fundamentais na análise estatística.

2 Duas Distribuições Normais, Variâncias Conhecidas.

Neste relatório, consideraremos as inferências estatísticas para a diferença de médias μ1μ2 de duas distribuições normais, em que as variâncias σ21 e σ22 são conhecidas

Suposições para Inferência com Duas Amostras.

3 Método da Quantidade Pivotal

O método da quantidade pivotal é uma técnica fundamental na inferência estatística, usada para construir intervalos de confiança. Ele explora uma estatística chamada de quantidade pivotal, que é uma função das variáveis amostrais e de um ou mais parâmetros desconhecidos e que possui uma distribuição conhecida. Isso torna o método extremamente útil para criar estimativas de intervalo, especialmente quando a distribuição exata dos estimadores é difícil de determinar.

Definição de uma Quantidade Pivotal

Uma quantidade pivotal, Q(X;θ), é uma função de uma amostra X e do parâmetro θ, e sua distribuição é independente do valor de θ. Ou seja, se conhecemos a distribuíção de Q(X;θ), podemos usá-la para fazer inferências sobre θ sem depender do valor específico de θ.

Exemplo: Intervalo de Confiança para a Média com Variância Conhecida

Considerando uma amostra X1,X2,...,Xn extraída de uma distribuição normal N(μ;σ2) com variância σ2 conhecida, podemos definir a quantidade pivotal como:

Z=ˉXμσn

onde ˉX é a média amostral e ZN(0,1) pela padronização da variável normal.

A partir dessa quantidade pivotal, podemos estabelecer um intervalo de confiança para μ:

P(zα2ˉXμσnzα2)=1α

Reorganizando, obtemos:

P(ˉXzα2σnμˉX+zα2σn)=1α

Esse é um intervalo de confiança 1α, para o parêmetro μ, utilizando a quantidade pivotal Z.

Vantagens do Método da Quantidade Pivotal

Desafios e Limitações

Para aplicar o método de quantidade pivotal, precisamos de pivôs cujas distribuições sejam conhecidas e independentes dos parâmetros. Em casos complexos, como amostras pequenas ou distribuições desconhecidas, a construção de quantidades pivots pode ser impraticável.

3.1 Definição do Problema

Suponha que um fabricante de medicamentos deseja comparar a eficácia de dois novos medicamentos, A e B, para tratar uma mesma doença. A eficácia de cada medicamento é medida pela redução média na pressão arterial de pacientes após um mês de uso.

O fabricante conduziu um experimento em que aplicou o medicamento A em um grupo de 40 pacientes e o medicamento B em outro grupo independente de 35 pacientes. A eficácia de cada medicamento (ou seja, a redução média na pressão arterial) é suposta ser normalmente distribuída. A variância das reduções da pressão arterial é conhecida para cada grupo:

  • Para o medicamento A, a variância é σ2=20.

  • Para o medicamento B, a variância é σ2=25.

As médias amostrais das reduções na pressão arterial observadas foram:

  • Para o medicamento A, ˉX1=15.

  • Para o medicamento B, ˉX2=10.

O objetivo é construir um intervalo de confiança para a diferença nas médias populacionais de redução na pressão arterial dos medicamentos A e B com um nível de confiança de 95%.

SOLUÇÃO

Para determinar o intervalo de confiança para a diferença μ1μ2 entre as médias populacionais de eficácia dos medicamentos, usamos a fórmula para um intervalo de confiança com variâncias conhecidas:

(ˉX1ˉX2)±zα2σ21n1+σ22n2

onde:

  • zα2 é o valor critico da distribuição normal padrão para o nível de confiança desejado (para 95%, zα21,96).

  • n1=40 e n2=35 são os tamanhos das amostras para os medicamentos A e B, respectivamente.

  • Diferença entre as médias:

ˉX1ˉX2=1510=5

  • Vaor crítico de (Z) para 95% de confiança:

Para um nível de confiança de 95%, o valor crítico Z correspondente é aproximadamente 1,96 (que pode ser obtido de uma tabela de distribuição normal ou pela função qnorm no R).

  • Erro padrão da diferença entre as médias:

σ21n1+σ22n2=2040+2535=0,5+0,71431,102

  • Intervalo de confiança:

O intervalo de confiança para a diferença entre as médias populacionais (μ1μ2) é dado por:

(\bar X_1\,-\,\bar X_2)\,\pm\,Z\,\times Erro\;Padrão

IC\;=\;5\,\pm\,1,96\,\times\,1,102

IC\;=\;5\,\pm\,2,16

Portanto, o intervalo de confiança de 95% para a diferença entre as médias populacionais de redução na pressão arterial dos medicamentos A e B é aproximadamente:

[2,84\,;\,7,16]

Com 95% de confiança, podemos afirmar que a diferença entre as médias populacionais de redução na pressão arterial para os medicamentos A e B está entre aproximadamente 2,84 e 7,16.

4 Aplicação do I.C. a um conjunto de dados

Considere duas máquinas que produzem peças, dos quais estamos avaliando a resistência à tensão dessas máquinas (MPa). Retirou-se uma amostra de 8 peças de cada máquina, e obtendo as seguintes resistências:

Máquina 1: \{ 161, 147, 162, 161, 154, 136, 142, 147\}

Máquina 1: \{ 140, 162, 147, 133, 130, 137, 137, 136\}

Considere que a resistência à tensão apresenta distribuição normal e que as variâncias populacionais são conhecidas para os dados obtidos pelas duas máquinas, porém iguais,encontre um estimador intervalar para a diferença das médias dos dois grupos, com um nível de confiança de 99% de probabilidade.

4.1 Apresentação analítica do resulatado

  • Tamanho das amostras: n_1\,=\,n_2\,=\,8

  • Médias amostrais:

\bar X_1\;=\;\frac{161\,+\,147\,+\,162\,+\,161\,+\,154\,+\,136\,+\,142\,+\,147}{8}\;=\;151,25

\bar X_2\;=\;\frac{140\,+\,162\,+\,147\,+\,133\,+\,130\,+\,137\,+\,137\,+\,136}{8}\;=\;140,25

  • Diferença das médias:

\bar X_1\;-\;\bar X_2\;=\;151,25-140,24\;=\;11

  • Variâncias amostrais:

s_1^2\;=\;\frac{\sum_1^n\,(X_{1i}-\bar X_1)^2}{n-1}

s_2^2\;=\;\frac{\sum_2^n\,(X_{2i}-\bar X_2)^2}{n-1}

Substituindo o respectivos valores, encontramos:

s_1^2\;=\;\frac{(161-151,25)^2\;+\;(147-151,25)^2\;+\;. . .+(147-151,25)^2}{7}\;=\;79,93

s_2^2\;=\;\frac{(140-140,25)^2\;+\;(162-140,25)^2\;+\;. . .+(136-140,25)^2}{7}\;=\;117,93

  • Variância combinada:

s_p^2\;=\;\frac{(n_1-1)\,s_1^2\;+\;(n_2-1)\,s_2^2}{n_1+n_2-2}\;=\;\frac{(7\,\times79,93)\;+\;(7\,\times\,117,93)}{14}\;=\;98,93 * Erro Padrão das Diferenças das Médias:

\sqrt {s_p^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}\;=\;\sqrt {98,93 \times\left(\frac{1}{8}+\frac{1}{8}\right)}\;=\;4,974

  • Intervalo de Confiança:

IC\;=\;(\bar X_1\,-\,\bar X_2)\,\pm\,t_{\frac{\alpha}{2}}\times\;Erro\;padrão

IC\;=\;11\,\pm\,2,977\,\times4,974

IC\;=\;11\,\pm\,14,81

IC\;=(\;-3,81;25,81)

4.2 Apresentação e solução usando o RStudio.