Disciplina: ESTATÍSTICA e PROBABILIDADE 1. Medidas de Dispersão - TopicsExpress



          

Disciplina: ESTATÍSTICA e PROBABILIDADE 1. Medidas de Dispersão ou de Variabilidade. As medidas de dispersão medem a variabilidade dos dados em estudo. Permitem verificar se o conjunto de dados é homogêneo ou heterogêneo. Consideremos os seguintes conjuntos de dados: a) 10 11 11 11 12 12 12 12 13 14 14 b) 1 5 6 9 11 12 12 15 18 21 22 Esses dois conjuntos têm valores iguais para média, mediana e moda mas existem diferenças entre eles, como podemos verificar ao colocá-los num diagrama, como mostram as figuras abaixo. a) _____________________________________________________ 0 2 4 6 8 10 12 14 16 18 20 22 24 b) _____________________________________________________ 0 2 4 6 8 10 12 14 16 18 20 22 24 A figura é um diagrama mostrando a dispersão dos dados. Isto indica que necessitamos de um outro tipo de medida para distinguir os dois conjuntos de dados. Observando a figura, podemos notar que o primeiro conjunto apresenta valores concentrados em relação à média, enquanto que o segundo apresenta valores dispersos (espalhados) em relação à média. As medidas que tratam desta característica são chamadas de medidas de dispersão. (AKANIME e YAMAMOTO, 1998). 1.1 Amplitude. Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de dados. Amplitude = Valor máximo – Valor mínimo Nos dois conjuntos de dados acima temos: a) Amplitude = 14 – 10 = 4 b) Amplitude = 22 – 1 = 21 Podemos observar que o segundo conjunto de dados é mais disperso que o primeiro. A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. Notas de aula 06 Prof. Paulo Alessio – 1º Sem de 2009. 2 Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade. 1.2 Desvio Médio ou Desvio Médio Absoluto. É a média dos módulos ou valores absolutos dos desvios. Se considerássemos somente os desvios, a soma deles seria sempre zero, pois existem desvios positivos e negativos. dm = n x x n i i  = − 1 ou   = = × − = n i i i n i i m f f x x d 1 1 (dados da distribuição agrupados). Exemplo. 1) A tabela abaixo mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000. 1996 1997 1998 1999 2000 TIME A 7 12 20 16 10 TIME B 18 16 15 9 12 a) Qual o desvio médio de cada um desses times? Resposta:Time A desvio médio = 4 Time B desvio médio = 2,8 b) Qual o time mais regular nesse período? Resposta:Time B 2) Considere a distribuição de freqüência representada pelo quadro abaixo e determine: a) a média aritmética b) o desvio médio i Classe fi 1 0 |¾ 4 2 2 4 |¾ 8 6 3 8 |¾ 12 8 4 12 |¾ 16 3 5 16 |¾ 20 1 Tomando como base essa distribuição, vamos fazer um quadro mais completo, que nos permite calcular a média, os desvios em relação à média e o desvio médio. I Classe Ponto médio da classe (xi) i f f . i xi x x i − fi xi −x 1 O |¾ 4 2 2 4 |¾ 8 6 3 8 |¾ 12 8 4 12 |¾ 16 3 5 16 |¾ 20 1 = = = Resposta: média aritmética = 9 desvio médio = 3,2 Prof. Paulo Alessio – 1º Sem de 2009. 3  Desvio Médio com o uso do Excel. Na barra de ferramentas selecionar Colar Função . Em Categoria da função, selecionar ESTATÍSTICA, selecione uma função, selecionar DESV. MÉDIO. 1.3 Desvio Padrão. Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um juízo sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto de dados numerosos. O desvio padrão foge a falha que ocorre na amplitude, por levar em conta todos os valores em questão. Portanto, o desvio padrão é muito mais conveniente no cálculo da dispersão. O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios. Podemos definir dois Desvios Padrões: Desvio Padrão Populacional s (leia-se sigma) e Desvio Padrão Amostral (s). 1.3.1 Desvio Padrão para dados populacionais. N (xi ) 2 μ s S − = μ = média da população 1.3.2 Desvio Padrão para dados amostrais. ( ) 1 2 − S = − N s i x x Em geral, a finalidade de calcular uma estatística amostral é estimar o parâmetro populacional correspondente, conteúdo que veremos em notas de aulas mais adiante. Se efetivamente tomássemos muitas amostras de uma população que tem média μ , calculássemos as médias amostrais x , e então tomássemos as médias de todas essas estimativas de μ , deveríamos ver que essa média fica muito próxima de μ . Entretanto, Prof. Paulo Alessio – 1º Sem de 2009. 4 se calculássemos o desvio padrão de cada amostra por meio da fórmula ( ) N  x − x 2 e então tomássemos a média de todas essas possíveis estimativas de s , provavelmente veríamos que essa média é menor do que s . Teoricamente, pode ser mostrado que podemos compensar isso dividindo por N – 1, em vez de N na fórmula de s. Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a média aritmética ( x ) é um número fracionário, o que torna pouco prático o cálculo das quantidades (xi - x )2 . Em 1.3.1 tomando seu radicando temos: ( ) n  xi − μ 2 . Desenvolvendo o produto notável encontramos: ( ) n  xi − μ 2 = n n n x xi i    − + μ μ 2 2 2. . substituindo n xi  μ = no desenvolvimento anterior encontramos:            +  − n x n x xi i n i 2 2 2 2. =       − n x xi n i 2 2 . Portanto, para simplificar os cálculos, usamos a seguinte fórmula: 2 2         = −   n x n x i i s Populacional Analogamente, em 1.3.2 podemos desenvolver uma fórmula para o desvio padrão amostral. ( 1) . ( ) 2 2 − S − = S n n i n s x x i Amostral  Desvio Padrão com o uso do Excel. Na barra de ferramentas selecionar Colar Função . Em categoria, selecionar ESTATÍSTICA, em selecione uma função, selecionar DESVPAD (para amostra) e DESVPADP (para população). Prof. Paulo Alessio – 1º Sem de 2009. 5 1.3.3 Aplicações do Desvio Padrão. No argumento que levou à definição do desvio padrão, observemos que a dispersão de um conjunto de dados é pequena se os valores estão bem concentrados em torno da média, e é grande se os valores estão muito espalhados em torno da média. Essa idéia é expressa mais formalmente pelo Teorema de Tchebichev. Teorema de Tchebichev. Para qualquer conjunto de dados (população ou amostra) e qualquer constante “k” maior do que 1, a proporção dos dados que devem estar a menos de k desvios padrão de qualquer um dos dois lados da média é pelo menos k 2 1 1 − Para k = 2, ( 4 1 3 1 2 2 − = ), pelo menos 75% dos valores de qualquer conjunto de dados devem estar a menos de dois desvios padrão de qualquer um dos dois lados da média. Para k = 5, ( 25 1 24 1 5 2 − = ), pelo menos 96% dos valores de qualquer conjunto de dados devem estar a menos de cinco desvios padrão de qualquer um dos dois lados da média. Exercícios. 1-) Um estudo nutricional de um certo tipo de queijo de baixos teores de gordura mostrou que, em média, uma fatia de 30 gramas contém 3,50 gramas de gordura com desvio padrão de 0,04 gramas de gordura. a) De acordo com o Teorema de Tchebichev, pelo menos qual percentagem de uma fatia de 30 gramas desse tipo de queijo deve ter um conteúdo de gordura entre 3,38 e 3,62 gramas de gordura? Resposta. 88,9% das fatias de 30 gramas do queijo têm um conteúdo de gordura entre 3,38 e 3,62 gramas de gordura. b) De acordo com o Teorema de Tchebichev, entre quais valores deve estar o conteúdo de gordura de pelo menos 93,75% das fatias de 30 gramas desse tipo de queijo? Resposta. Entre 3,34 e 3,66 gramas de gordura. 2-) Os registros de um hospital mostram que, em média, uma certa cirurgia dura 111,6 minutos, com um desvio padrão de 2,8 minutos. Pelo menos qual percentagem dessas cirurgias leva algum tempo entre: a) 106,0 e 117,2 minutos Resposta. 75% b) 97,6 e 125,6 minutos Resposta. 96% 3-) Com referência ao exercício 2, entre quais quantidades de minutos devem estar as durações de: a) pelo menos 35/36 dessas cirurgias. Resposta. Entre 94,8 e 128,4 minutos b) pelo menos 99% dessas cirurgias. Resposta. Entre 83,6 e 139,6 minutos Prof. Paulo Alessio – 1º Sem de 2009. 6 O teorema de Tchebichev pode ser aplicado a qualquer tipo de dados, mas tem suas limitações. Como ele nos diz meramente “pelo menos qual proporção” de um conjunto de dados deve estar entre certos limites isto é, fornece apenas uma cota inferior à verdadeira proporção. Observação. Para as distribuições normais (Notas de aula 13) temos que: (a) 68,27% dos casos estão incluídos entre μ −s e μ + s , isto é, um desvio padrão de cada lado da média. (b) 95,45% dos casos estão incluídos entre μ − 2s e μ + 2s , isto é, dois desvios padrões de cada lado da média. (c) 99,73% dos casos estão incluídos entre μ − 3s e μ + 3s , isto é, três desvios padrões de cada lado da média. 1.4 Coeficiente de Variação ou de Dispersão. O coeficiente de variação (dispersão) dá uma idéia da precisão de um experimento ou da dispersão de um conjunto de dados. É definido como o quociente entre desvio padrão e a média, multiplicado por 100. Logo, o coeficiente de variação nada mais é do que o desvio padrão em porcentagem da média. = × 100 % x s CV (amostral) CV x100 % μ s = (populacional) Exemplos. 1-) Para uma distribuição cuja média é x = 161 cm e o desvio padrão é s = 5,57 cm, logo: 100 3,459 3,5% 161 5,57 CV = × = = 2-) As várias medições do diâmetro de um mancal, efetuadas com um micrômetro, acusaram uma média de 2,49 mm e um desvio padrão de 0,012 mm, e as várias medições do comprimento natural de uma mola (não distendida) efetuadas com um outro micrômetro acusaram uma média de 0,75 cm e um desvio padrão de 0,002 cm. Qual dois micrômetros é relativamente mais preciso? .100 0,48% 2,49 0,012 1 CV = = e .100 0,27% 0,75 0,002 2 CV = = Assim, as medições do comprimento da mola são relativamente menos variável, o que significa que o segundo micrômetro é mais preciso. Para exemplificar a análise de variabilidade de dados, analisar-se-á quatro amostras de massas de estudantes. Amostras Massas (kg) x s CV Amostra 1 62 58 70 65 60 63 4,69 7,44% Amostra 2 63 63 63 63 63 63 0 0% Amostra 3 42 55 65 78 75 63 14,82 23,52% Amostra 4 38 46 85 90 56 63 23,32 37,02% Em todas as amostras da tabela acima, a médias das massas dos alunos é 63 kg. Entretanto, a dispersão observada não é a mesma. Para a amostra 1, o desvio padrão amostral é 4,69 kg, a segunda amostra possui desvio padrão nulo, ou seja, não possui Prof. Paulo Alessio – 1º Sem de 2009. 7 variabilidade, na terceira o desvio padrão é de 14,82 kg e, para a quarta, este valor sobe para 23,32 kg. Comparando os resultados dos desvios padrões calculados, se observa que, quanto maior for a dispersão dos dados, maior será o valor numérico do desvio padrão. 1.5 Cálculo do Desvio Padrão. 1.5.1 Dados não agrupados. Tomemos, como exemplo, a seguinte amostra: 40 45 48 52 54 62 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas, uma pra xi e outra para xi 2. xi xi 2 40 45 48 52 54 62 70  = 371 = 20293 Como n = 7, temos: 7.(7 1) 7.20293 371 2 − − s = = 10,25 logo, s = 10,25 1.5.2 Dados agrupados. Como, neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando a fórmula: 2 2         = −   n f x n f x i i i i s Populacional .( 1) . . 2 ( . ) 2 − S − = S n n i i n s f x f x i i Amostral Consideremos a amostra da seguinte tabela: O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para fixi 2, lembrando que para obter fixi 2 basta multiplicar cada fixi pelo seu respectivo xi. Assim: xi fi fixi fixi 2 0 2 1 6 2 12 3 7 4 3  = 30  = 63  = 165 xi 0 1 2 3 4 fi 2 6 12 7 3 Prof. Paulo Alessio – 1º Sem de 2009. 8 Logo: 30.(30 1) 30.165 63 2 − − s = = 1,062 Daí: s = 1, 062 Observação. Quando for uma distribuição de freqüências com intervalos de classes, utilizar com xi o ponto médio da classe. Exemplo. Calcular o desvio padrão para a seguinte distribuição de freqüências. i ESTATURAS (cm) fi xi fixi fixi 2 1 150 |¾ 154 4 2 154 |¾ 158 9 3 158 |¾ 162 11 4 162 |¾ 166 8 5 166 |¾ 170 5 6 170 |¾ 174 3 S = 40  = 6440 = 1038080 Logo: 40.(40 1) 40.1038080 6440 2 − − s = daí: s = 5,64 1.6 Variância. A variância nada mais é do que o quadrado do desvio padrão. Para a população s 2 Para a Amostra s 2 Exercícios. 1) As alturas dos jogadores de um time de basquete são, em centímetros, 195, 198, 201, 192 e 204. Nessas condições, determine: a) a média das alturas (Resposta= 198 cm) b) o desvio médio (Resposta = 3,6) 2) A tabela seguinte mostra o número de operários acidentados por mês numa fábrica, durante o ano de 2000. Mês Jan. Fev. Mar. Abril. Maio. Junho Julho Agosto. Set. Out. Nov. Dez. Operários 4 8 3 6 7 7 3 8 4 4 3 3 Organize uma tabela de distribuição de freqüências e determine: a) a média aritmética dessa distribuição (Resposta = 5) b) o desvio médio (Resposta = 1,83) 3) ) Determine a média aritmética e o desvio médio, dos valores apresentados na tabela seguinte: Prof. Paulo Alessio – 1º Sem de 2009. 9 xi 2 3 4 5 6 7 fi 5 10 15 12 5 3 xifi |xi - x | fi.|xi - x |  = 211  = 53,2 Resposta.Média = 4,22 e Desvio Médio = 1,064 4) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo a uma vaga de representante no conselho da escola. Onde A, B, C, D, E e F são todas as turmas onde os candidatos podem concorrer. 3A 3B 3C 3D 3E 3F VITOR 12 15 12 16 14 15 RAFAEL 12 11 18 9 19 15 a) Calcule o desvio-padrão de cada um desses candidatos. Resposta: Vitor Desvio Padrão = 1,53 Rafael Desvio Padrão = 3,651 b) Qual dos dois candidatos é o mais regular? Resposta:O candidato mais regular é o que tem o menor desvio padrão, logo, o Vitor
Posted on: Thu, 14 Nov 2013 21:12:12 +0000

Trending Topics



Recently Viewed Topics




© 2015