Resolução comentada de Estatística - ICMS/RJ - 2008 - Prova Amarela


19.
Os jogadores A e B se encontram para jogar uma partida de tênis em no máximo cinco sets, na qual será vencedor aquele que primeiro ganhar três sets.
Por exemplo, partidas terminadas poderão ter como resultado: AAA, AABA, BABAB, etc. Então, o número de possíveis resultados para uma partida terminada é:
(A) 4.
(B) 10.
(C) 6.
(D) 20.
(E) 8. 

RESOLUÇÃO:
Para a partida terminar em 3 sets teremos apenas 2 possibilidades: AAA ou BBB;
Para a partida terminar em 4 sets serão 6 possibilidades: AABA, BBAB, ABAA, BABB, BAAA ou ABBB;
Para a partida terminar em 5 sets, serão 12 possibilidades: AABBA, BBAAB, ABBAA, BAABB, BBAAA, AABBB, ABABA, BABAB, BAABA, ABBAB, BABAA ou ABABB;
Número total de resultados possíveis: 2 + 6 + 12 = 20.
Gabarito oficial - letra D.  

20. Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas.Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir:
MedidasIndicador
QualidadeTempestividade
Média5025
Desvio-Padrão10,06,0
Coeficiente de Variação (%)2024
Com base na tabela, é correto afirmar que:
(A) a média aritmética não é uma boa medida para representar a performance dos funcionários em face do elevado nível de dispersão das avaliações.
(B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade.
(C) as avaliações da Qualidade foram mais homogêneas do que as avaliações da Tempestividade.
(D) os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas é melhor.
(E) nada se pode afirmar sem o conhecimento do tamanho da amostra. 

RESOLUÇÃO:
Questão muito parecida com uma das questões do concurso anterior, sendo que nesta prova já foram dados, prontinhos, os percentuais correspondentes aos Coeficientes de Variação (CV's). Assim como na prova anterior, vamos relembrar a parte teórica à página 37 do livro "Estatística Básica para Concursos" da Editora Ferreira:
"Considera-se que um CV superior a 50% indica alto grau de dispersão e conseqüentemente pequena representatividade da Média, enquanto para um CV inferior a 50% a Média será tanto mais representativa quanto menor for o valor do CV, ou seja, quanto menor for o CV mais homogênea será considerada a série e quanto maior for o CV, mais heterogênea."
Observando-se a tabela dada, vemos que o CV da Qualidade é inferior ao da Tempestividade, indicando que as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade.
Gabarito oficial - letra C.

21.
Dentre as distribuições de probabilidades a seguir, aquela em que   é:
(A) de densidade
(B) de densidade
(C)
(D)
(E)

RESOLUÇÃO:
O que o enunciado apresenta, nada mais é do que: E[X] = V[X], ou seja, a esperança é igual à variância.
Dentre as distribuições de probabilidade, a única em que isso ocorre é na Distribuição de Poisson (E[X] = V[X] = l), cuja probabilidade de "x sucessos" é dada por:  .
Gabarito oficial - letra D.   

22. Considere uma Amostra Aleatória Simples de n unidades extraídas de uma população na qual a característica, X, estudada tem distribuição Normal com média m e variância s2, ambas desconhecidas, mas finitas. Considere, ainda, as estatísticas média da amostra, , e variância da amostra  . Então, é correto afirmar que:
(A)   e S2 são, ambos, não tendenciosos para a estimação da média e da variância da população, respectivamente.
(B)   é não-tendencioso, mas S2 é tendencioso para a estimação da média e da variância da população, respectivamente.
(C)   é tendencioso, mas S2 é não-tendencioso para a estimação da média e da variância da população, respectivamente.
(D)   e S2 são, ambos, tendenciosos para a estimação da média e da variância da população, respectivamente.
(E)   e S2 são, ambos, não-tendenciosos para a estimação da média e da variância da população, mas apenas   é consistente. 

RESOLUÇÃO
:
,
  dado por
 é um estimador não tendencioso (não viciado) da média populacional
m, ou seja,  = m.
Já a variância S2, sendo dada por:   será um estimador viciado (tendencioso) da variância populacional s2. Justamente para corrigir essa tendência, é que precisamos usar o Fator de Correção de Bessel, dado por:  . Assim, o estimador não viciado de s2 é:  .
Para os estimadores dados no enunciado:
, será não tendencioso para a estimação da média populacional m;
S2 será tendencioso para a estimação da variância populacional s2.
Gabarito oficial - letra B.   

23. Sejam A, B e C três eventos quaisquer definidos em um espaço amostral S. Então,
P(A) + P(B) + P(C) - P(A Ç B) - P(A Ç C) - P(B Ç C) refere-se à probabilidade da ocorrência de:
(A) um ou dois eventos.
(B) exatamente um dos eventos.
(C) pelo menos um dos eventos.
(D) no máximo dois eventos.
(E) pelo menos dois eventos.  

RESOLUÇÃO
:
Questão ardilosa. À primeira vista dá a impressão de que sobrará apenas um dos eventos: A, B ou C.
Mas basta saber que a união de 3 conjuntos (A, B e C) é dada por:
A È B È C = A + B + C - (A Ç B) - (A Ç C) - (B Ç C) + (A Ç B Ç C).
Na presente questão, vemos que está sendo tirada, em cada conjunto, a interseção comum dois a dois sem que seja incluída a interseção dos três. Logo o enunciado refere-se à probabilidade da ocorrência de um ou dois dos eventos.
A opção da letra D é uma armadilha, pois "no máximo dois eventos" inclui o zero, ou seja, nenhum dos três, o que não é verdade.
Gabarito oficial - letra A.   

24.
O coeficiente de determinação de um modelo de regressão linear serve como uma importante ferramenta para avaliar o grau de ajustamento do modelo aos dados.
A respeito desse coeficiente, assinale a afirmativa incorreta.
(A) Seu valor varia entre 0 e 1.
(B) É invariante a uma mudança de escala das variáveis independentes.
(C) É utilizado para escolher modelos com número de variáveis independentes diferentes.
(D) É uma função não decrescente no número de variáveis independentes no modelo.
(E) Representa a participação relativa da soma dos quadrados da regressão sobre a soma dos quadrados total. 

RESOLUÇÃO:
O enunciado pede para apontar a alternativa INCORRETA.
A opção da letra A está correta, pois o coeficiente de determinação (R2) é o quadrado do coeficiente de correlação e sendo este último um número real variando de -1 até +1, o coeficiente de determinação estará compreendido entre 0 e 1;
A opção da letra B também está correta, pois uma mudança na escala de valores das variáveis não altera o coeficiente de correlação e conseqüentemente não alterará o R2;
A opção da letra D também está correta, pois ao aumentarmos o número de variáveis independentes o R2 pode aumentar ou ficar igual, mas nunca decrescerá;
A opção da letra E também está correta, pois o coeficiente de determinação indica quantos % a variação explicada pela regressão representa da variação total e é obtido por:  , onde VE é a variação explicada pelo modelo (soma dos quadrados da regressão) e VT é a variação total (soma total dos quadrados, ou seja, regressão + residuais);
A letra C está incorreta, pois diz que é utilizado para escolher modelos com número de variáveis aleatórias independentes diferentes, quando, na realidade, pode ser utilizado, mas não é essa a principal finalidade do R2.
Gabarito oficial - letra C.  

25.
Sejam X e Y duas variáveis aleatórias quaisquer. Então:
(A) VAR (X - Y) = VAR (X) - VAR (Y).
(B) VAR (X - Y) = VAR (X) + VAR (Y) - COV (X, Y).
(C) VAR (X - Y) = VAR (X) + VAR (Y) - 2 COV (X, Y).
(D) VAR (X - Y) = VAR (X) + VAR (Y) + COV (X, Y).
(E) VAR (X - Y) = VAR (X) + VAR (Y) + 2 COV (X, Y). 

RESOLUÇÃO
:
Questão fácil, bastando o conhecimento das propriedades da variância e, no entanto, a FGV errou na divulgação do gabarito preliminar, pois a variância da soma ou diferença entre 2 variáveis será a soma das variâncias, acrescida ou subtraída do dobro da covariância, ou seja:
VAR (X ± Y) = VAR (X) + VAR (Y) ± 2 COV (X, Y).
Para VAR (X + Y) teremos: VAR (X + Y) = VAR (X) + VAR (Y) + 2 COV (X, Y).
Para VAR (X - Y) teremos: VAR (X - Y) = VAR (X) + VAR (Y) - 2 COV (X, Y).
O gabarito preliminar apontou, incorretamente, para a opção da letra E, que seria a opção correta se fosse pedida a variância da soma, e não da diferença.
Gabarito preliminar - letra E.
Gabarito oficial definitivo - letra C.  

26.
Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz abaixo:
 
X
Y
Z
X
1,000
  
Y
0,800
1,000
 
Z
0,000
-0,500
1,000
 Pode-se, então, afirmar que:
(A) X e Z são independentes.
(B) a correlação parcial entre X e Y, após a correção para Z, é negativa.
(C) o coeficiente de determinação da regressão de Y em X é maior do que 60%.
(D) a correlação entre V = a + b×X e W = c + d×Z, com a ¹ 0, c ¹ 0, b > 0 e d < 0 é negativa.
(E) a covariância entre X e Y é igual a 0,64.


RESOLUÇÃO
:
Basta observar, na tabela, que a correlação entre X e Y é igual a 0,8.
O coeficiente de determinação da regressão de Y em X será o quadrado desse valor, ou seja:
R2 = (0,8)2 = 0,64 = 64%, sendo, portanto, maior do que 60%, conforme a opção C.
A opção da letra A não é válida porque o fato de X e Z terem correlação igual a zero não implica, necessariamente, que X e Z sejam independentes, podem ser ou não. Já quando sabemos que duas variáveis são independentes, aí sim, podemos afirmar que a correlação entre elas será, com certeza, igual a zero;
A letra D está errada porque, se a correlação entre X e Z é nula, a correlação entre as variáveis V e W não será negativa, também será nula;
A afirmativa da letra E não pode ser verificada sem o conhecimento do desvio padrão de X e do desvio padrão de Y, pois a correlação é dada por  . Portanto  . No enunciado da questão é fornecido, apenas, o valor do coeficiente de correlação,   = 0,8, não sendo fornecidos os valores dos desvios de X e de Y.
Gabarito oficial - letra C.  


29. Em um país, a probabilidade de um contribuinte cometer erro na declaração anual de ajuste de rendimentos aumenta na medida em que o valor do imposto final também aumenta. Estudos indicam que a probabilidade de um contribuinte cometer erro na declaração anual de ajuste (Y = 1) é expressa por meio de:
 ,
onde X é um número real que representa o valor do ajuste do imposto (diferença entre o imposto pago ao longo do ano e o que deveria pagar de acordo com os rendimentos, retenções e abatimentos), em $1.000.
Se X > 0, o contribuinte tem imposto devido a pagar; se X < 0, tem imposto a ser restituído; e, se X = 0, o imposto retido ao longo do ano foi igual ao imposto total devido.A esse respeito, é correto afirmar que:
(A) a cada acréscimo de $1.000 no imposto, a probabilidade de o contribuinte cometer erro na declaração de ajuste aumenta em 2%.
(B) a probabilidade de a declaração de ajuste apresentar erro (Y = 1) é maior do que a probabilidade de não haver erro (Y = 0), para todos os contribuintes com X > 0.
(C) essa função de probabilidade tem seu ponto de inflexão em X = 0.
(D) o logaritmo neperiano da razão entre a probabilidade de haver erro na declaração e a de não haver é uma função linear em X, expressa por -0,048 + 0,02×X.
(E) contribuintes com imposto devido têm probabilidade 0,5 de cometer erro na declaração. 

RESOLUÇÃO
:
A função, que é apresentada na questão, é a função LOGIT.
Para facilitar, vamos começar fazendo a seguinte transformação na função: Z = -0,048 + 0,02X.
Logo, a função fica:  .
A opção de resposta da letra A, pode ser rapidamente descartada, pois só seria verdadeira se tivéssemos uma função linear, o que não é o caso.
Também podemos descartar a opção da letra C, já que o ponto de inflexão da função não será zero e sim 2,4, pois: -0,048 + 0,02X ³ 0 Þ 0,02X ³ 0,048 Þ X ³ 2,4.
Idem para a opção da letra E, pois a probabilidade depende de X e a função não é uma função constante.
Para chegarmos à opção de resposta, vamos analisar que:
A probabilidade de haver erro, P(Y = 1), será dada por Pi;
Logo, a probabilidade de não haver erro, P(Y = 0), será dada por 1 - Pi, onde  ;
Mas como fizemos a transformação Z = -0,048 + 0,02X fica:
, que é a probabilidade de haver erro, P(Y = 1).
A probabilidade de não haver erro, P(Y = 0), dada por 1 - Pi, será: 

Se Z = 0, então   =   = 0,5 (probabilidade de haver erro) e (1 - Pi) também será igual a 0,5;
A probabilidade de haver erro (Y = 1) começará a ser maior do que a probabilidade de não haver erro (Y = 0) a partir de Z > 0. Mas, como já vimos, para que X seja maior do que zero, Z deverá ser maior do que 2,4 (que é o ponto de inflexão da curva). Logo, a opção da letra B também está errada, pois não é com X > 0 e sim com X > 2,4 que P(Y = 1) > P(Y = 0).
Assim, temos a seguinte razão entre a probabilidade de haver erro e a de não haver erro: 

Portanto, a razão é   e o logaritmo neperiano da razão será:  .
Pelas propriedades dos logaritmos, o logaritmo da potência fica sendo:  .
Mas   (o logaritmo de mesma base é unitário).
Logo, o logaritmo neperiano da razão é igual a Z, ou seja,
Mas Z = -0,048 + 0,02X, que é uma função linear em X, como afirma a opção de resposta da letra D.
Gabarito oficial - letra D.


GABARITOS:
19. D20. C21. D22. B23. A24. C25. C26. C29. D

Pedro Marcos Oliveira Bello é graduado em Estatística e Ciências Atuariais, tendo sido aprovado em diversos concursos públicos. Atualmente é Analista de Resseguros do IRB-Brasil Resseguros S/A, aprovado no recente concurso de 2004, e ministra aulas de Estatística, Matemática e Raciocínio Lógico  em diversos cursos preparatórios no Rio de Janeiro. Foi professor de Estatística na FAETEC - Fundação de Apoio à Escola Técnica e Técnico de Nível Superior II na Secretaria de Trabalho do Estado do RJ.

Apostilas Mais Vendidas

Concurso MPU 2018-TÉCNICO DO MPU - ESPECIALIDADE: ADMINISTRAÇÃO
Concurso MPU 2018
TÉCNICO DO MPU - ESPECIALIDADE: ADMINISTRAÇÃO

Conteúdo Em Destaque

Acha Difícil Passar em Concursos? Conheça o Curso Onde Você Aprenderá Rapidamente a Passar em Qualquer Concurso Público Estudando Apenas 2 Horas Por Dia!