DISTRIBUIÇÃO DE FREQUENCIA.
*Constitui o tipo de tabela mais importante para a Estatística Descritiva.
*Abaixo temos procedimentos para construção dessas tabelas.
CONCEITOS INICIAIS.
1. População.
Conjunto de pessoas ou objetos com uma característica comum.
A = {Eleitores do Estado de M Gerais}
2. Amostra.
Qualquer subconjunto de uma população.
B = {Eleitores da Cidade de Formiga}
3. Variável Aleatória.
É quando uma variável pode ter resultados ou valores que tendem a mudar de uma observação para outra devido a fatores de chance de ocorrer. Ex. Lançamento de uma moeda: só pode sair K ou C (coroa ou cara – podem ser associados a 0 para coroa e 1 para cara).
4. Variável Discreta.
Uma variável Xi é denominada discreta, quando entre dois de seus valores inteiros não admitir valores intermediários.
Exemplos:
a) Xi = Número de filhos de um casal.
Xi = 1, 2, 3, 4, 5,...
b) Yi = Número de livros de uma biblioteca.
Yi = 2, 3, 4,... 100,... 1000,...
5. Variável Contínua.
Uma variável Xi é denominada continua, quando entre dois de seus valores inteiros admitirem valores intermediários.
Exemplos.
a) Xi = Temperaturas da Cidade WYZ
Xi = 18o; 18,3o; 18.7o;.......
b) Yi = Capacidade em litros de uma máquina.
Yi = 6l; 6,4l; 6,8l; 6,9; 7l; 7,4l; ...
6. Dados Brutos.
São os dados após a crítica de seus valores. (Na crítica de valores são desprezados os dados que destoam da maioria. Ex. Se em uma determinada região encontramos salários que variam de 8.000,00 a 17.000,00 e aparecer um determinado salário de R$43.000,00 deverá ser desprezado para não interferir na média ou em outros cálculos necessários.)
Exemplo. Alturas em cm de 50 estudantes.
165 | 165 | 170 | 162 | 175 | 185 | 188 | 164 | 179 |
172 | 166 | 163 | 167 | 178 | 171 | 195 | 179 | 188 |
187 | 169 | 167 | 160 | 188 | 160 | 190 | 169 | 171 |
172 | 166 | 167 | 174 | 175 | 176 | 183 | 181 | 190 |
191 | 193 | 192 | 188 | 187 | 188 | 182 | 189 | 167 |
7. Rol.
É a ordenação dos dados brutos. Pode ser ordem crescente ou decrescente de seus valores.
Ex. Forme o rol dos dados do exemplo anterior.
8. Amplitude Total ou Amplitude da Amostra.
É dada pela diferença entre o maior e o menor valor do rol.
A = Xmax - Xmin
No exemplo anterior temos: (complete)
A =........-........
A =.........
9. Frequência Absoluta.
Indicam quantas vezes cada elemento aparece no rol.
Ex. f(160) = 2
f(161) = 0
f(162) = 1
f(163) = 1
etc....
10. Tabela de Variável Discreta.
É a representação da variável discreta através de uma distribuição de frequência. Cada variável com sua respectiva frequência simples ou absoluta.
NÚMERO DE FILHOS DE UM CASAL. | fi |
0 | 89 |
1 | 175 |
2 | 156 |
3 | 132 |
4 | 105 |
5 | 80 |
6 | 60 |
7 | 30 |
8 | 20 |
11. Gráfico da Distribuição de Variável Discreta.
Cada Xi é representado de acordo com a sua frequência (fi)
12. Tabela de Variável Contínua.
Os valores são representados em classes.
Idades | Número de Empregados. |
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 | 45 |
23 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 31 | 55 |
31 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 39 | 35 |
39 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 47 | 27 |
47 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 55 | 18 |
∑ | 180 |
Obs.: A tabela acima apresenta 5 classes.
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23, onde 15 é o limite inferior e 23 o superior;
23ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 31, onde 23 é o limite inferior e 31 o superior;
31ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 39, onde..............................................;
............................................................................;
................................................................................ .
A frequência da 1a classe é 45.
A frequência da 2a classe é 55.
Etc...
13. Intervalos de classe.
Pode ser escritos de acôrdo com uma das notações abaixo:
(sendo a mais utilizada atualmente a primeira.)
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 inclui o 15 e exclui o 23;
15 ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ǀ 23 exclui o 15 e inclui o 23;
15 ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 limites aparentes 15 e 23
limites reais 14,5 e 22,5.
14. Ponto Médio de uma classe.
É dado pela média aritmética dos limites de classe.
No exemplo temos:
(15+23)/2 = 19
Etc...
Teremos:
Idades | Número de Empregados. fi | Xi |
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 | 45 | 19 |
23 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 31 | 55 | 27 |
31 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 39 | 35 | 35 |
39 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 47 | 27 | 43 |
47 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 55 | 18 | 51 |
∑ | 180 | --- |
15. Frequência Acumulada Crescente (fac).
Obtemos somando a frequência de cada classe com todas frequências anteriores.
Idades | Número de Empregados. fi | Xi | fac |
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 | 45 | 19 | (0+45) 45 |
23 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 31 | 55 | 27 | (45+55) 100 |
31 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 39 | 35 | 35 | (45+55+35) 135 |
39 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 47 | 27 | 43 | (135+27) 162 |
47 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 55 | 18 | 51 | (162+18) 180 |
∑ | 180 | --- | --- |
16. Frequência Acumulada Decrescente (fad).
Obtemos somando a frequência de cada classe com todas frequências posteriores.
Idades | Número de Empregados. fi | Xi | fad |
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 | 45 | 19 | 180 |
23 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 31 | 55 | 27 | 135 |
31 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 39 | 35 | 35 | 80 |
39 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 47 | 27 | 43 | 45 |
47 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 55 | 18 | 51 | 18 |
∑ | 180 | --- | --- |
17. Frequência Relativa.
É obtida dividindo-se a frequência da classe pelo somatório da frequência total. (fi)
Idades | Número de Empregados. | Xi | Fr |
15ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 23 | 45 | 19 | |
23 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 31 | 55 | 27 | |
31 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 39 | 35 | 35 | |
39 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 47 | 27 | 43 | |
47 ǀ̶̶̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ ̶ 55 | 18 | 51 | |
∑ | 180 | --- | 1,00 |
Temos então que 25% dos elementos estão na primeira classe; 31% estão na segunda classe; 19% na terceira; etc...
Obs. A soma deve sempre dar 1,00; caso não ocorra por conta de arredondamentos deve-se subtrair ou aumentar na classe de maior frequência.
1. Histograma.
É a representação gráfica da distribuição de frequência em classes, através de um gráfico de colunas justapostas. Gráfico abaixo.
2. Polígono de frequência simples.
Fica determinado unindo-se no histograma o ponto médio de cada coluna. (fecham-se as laterais nos pontos do eixo dos x a uma distância igual à metade da coluna – ver gráfico anexo).
3. Polígonos de frequência acumulada.
É a representação da frequência acumulada através de uma linha poligonal – podem ser crescentes ou decrescentes. Também denominadas de OGIVAS.
4. Número de classes.
O número de classes de uma distribuição de frequência é dado pela fórmula de Sturges:
K = 1 + 3,32logN
onde N é o número de elementos do rol ou amostra.
Assim, se N = 100, teremos:
K = 1 + 3,32log100
K = 1 + 3,32x2
K = 1 + 6,64
K = 7,64
Como o número de classes deve ser sempre inteiro.
(K deve ser sempre arredondado para o inteiro superior)
K = 8 classe.
Obs. Na construção da distribuição devem ser evitadas classes com freqüência (zero); se isso ocorre nada impede de diminuir o número de classes para K = 7.
Pode também ser utilizado:
- se N < 25 temos K = 5 classes
- se N >= 25 temos K = Raiz quadrada de N.
5. Amplitude de classe.
É obtida dividindo-se a amplitude do rol (A) pelo número de classes (K).
h = A/K
Obs. h deve ser sempre arredondado para o inteiro superior