Apostila de Estatística

Marcelo Beneti,
Aula: 01
Temática: Conceitos básicos para o estudo da estatística

Iniciaremos nosso curso fazendo uma breve introdução sobre o conceito estatístico.

O que é estatística?
É um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos, como a taxa de natalidade, a taxa de mortalidade, índices etc.

Estatística descritiva ou dedutiva: é aquela que tem por objeto descrever e analisar determinada população, embora não pretenda tirar conclusões de caráter mais genérico.

Estatística indutiva: é o campo da estatística em que são estudados os resultados obtidos da análise de uma amostra da população; procura inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi retirada.

Fases do método estatístico

I) Coleta de dados: as características mensuráveis do fenômeno que desejamos pesquisar podem ser: contínua, periódica (exemplo: de 10 em 10 anos) ou ocasional.

II) Crítica de dados: é a conferência dos dados coletados; se houver erros, pode ser por motivos externos, ou seja, erros por parte do informante, ou por motivos internos, os quais ocorrem por parte do entrevistador ou da equipe de pesquisa.

III) Apuração dos dados: é a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação.
IV) Exposição ou apresentação dos dados: pode ser feita mediante tabelas, gráficos ou relatórios, de maneira mais clara possível, para que todos os interessados possam compreender.

V) Análise dos resultados: são as conclusões sobre o trabalho realizado; análise e interpretação dos dados obtidos.

População e amostra

População: é o todo e pode ser finita ou infinita.
● Finita – possui um número determinado de elementos. Exemplo: número de alunos da classe.
● Infinita – possui um grande número de elementos. Exemplo: a população da cidade de São Paulo.

Amostra: é um subconjunto da população, ou seja, uma parte dela.
Quando há um número muito grande de elementos, fica difícil a observação dos aspectos a serem estudados de cada um dos elementos devido ao alto custo, ao intenso trabalho e ao tempo despendido para concluir uma exaustiva observação de todos os elementos da população. Neste caso, fazemos a seleção de uma amostra (cerca de 10% da população a ser estudada), e, por intermédio dessa observação, estaremos aptos a analisar os resultados de um todo, da mesma forma que se estudássemos toda a população.









Aula: 02
Temática: Cálculos básicos para o estudo da estatística

Nessa aula iremos revisar alguns cálculos que serão de extrema importância para o estudo da estatística, ligada inclusive ao estudo em física.

Fração
É uma parte do todo, ou seja, um par ordenado cujo segundo número é diferente de zero.
, com a Є IN e b Є IN*
(a pertence ao conjunto dos números naturais e b pertence ao conjunto dos números naturais diferentes de zero).

● Fração Própria: o numerador é menor que o denominador.

Exemplo: , , etc.

● Fração Imprópria: o numerador é igual ou maior que o denominador.

Exemplo: , , , etc.

● Fração aparente: é a fração onde o numerador é múltiplo do denominador.

Exemplo: representa o número 3, pois 12 : 4 = 3.
Se o numerador for zero, a fração apresenta o número zero. Assim = 0.
Todo número natural pode ser apresentado por uma fração com denominador. 1. Assim, 7 pode ser representado por .
● Frações Equivalentes: duas frações são equivalentes quando o produto do numerador de uma pelo denominador da outra são iguais.

Exemplo: para e onde temos: 1 X 4 = 2 X 2

● Simplificação de frações: basta dividir ambos os termos por um divisor comum até chegar a uma fração irredutível.

Exemplo:

Fração irredutível é aquela cujos números são primos entre si, isto é, não possui outro divisor comum, a não ser o número 1.

Exemplo: é considerada uma fração irredutível, pois 7 e 17 são números primos entre si.

● Comparação de frações: para compararmos duas ou mais frações, devemos reduzi-la ao mesmo denominador, lembrando que, de duas frações com o mesmo denominador, a maior é aquela que tiver o maior numerador.






Operações com frações

● Adição e subtração

I. Frações homogêneas: conserva-se o denominador e adicionam-se ou subtraem-se os numeradores.

Exemplo: ou

II. Frações heterogêneas: reduzem-se as frações ao mesmo denominador, obtendo-se dessa forma frações homogêneas.

Exemplo:


Reduzindo ao mesmo denominador, vamos calcular o mínimo múltiplo comum dos denominadores como no exemplo acima:
Seja:


Logo, o m.m.c de 2 e 7 = 2 x 7 = 14

Observe que reduzimos ao mesmo denominador 7 e 2 = 14

Nota: sempre que possível, simplifique os resultados como vimos no tópico de simplificação de frações.

● Multiplicação

É o produto de numeradores por numeradores e denominadores por denominadores da fração.

Exemplo: o que resulta em .

O processo da multiplicação pode ser facilitado usando a simplificação pelo cancelamento dos fatores comuns dos numeradores e dos denominadores.

Exemplo: , nesse caso é possível simplificar 3 por 3, ou seja, , assim , ficando na forma, o que resulta em .

● Divisão

É o produto da primeira fração pelo inverso da segunda fração.

Exemplo:

● Potenciação

Devemos elevar o numerador e o denominador da fração a esse expoente.

Exemplo:

● Porcentagem ou percentagem

É uma parte de um todo, onde esse todo equivale a 100%.
Denominamos razão percentual ou centesimal as frações do tipo .

Exemplo: ; .
corresponde a 30% (trinta por cento) e corresponde a 20% (vinte por cento).
Exemplo:
1) Em uma classe de 30 alunos, 15 foram aprovados. Qual a taxa percentual de aprovação?

Onde:

Resposta: A taxa percentual de alunos aprovados foi de 50%.

2) Ao comprar um livro, obtive um desconto de R$ 3,00. Qual o preço (sem desconto) do livro, sabendo que a taxa de desconto foi de 5%?


Resposta: O preço do livro é R$ 60,00.
Aula: 03
Temática: Regras de arredondamento

Hoje iremos estudar arredondamentos, que são de fundamental importância para nossos estudos, principalmente ao calcular valores que têm muitas casas decimais. Muitas vezes, é conveniente suprimir unidades inferiores às de determinada ordem. Esta técnica é denominada arredondamento de dados ou valores.

De acordo com a Resolução nº 886/66 do IBGE:

I) < 5 (menor que 5). Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, ficará inalterado o último algarismo que permanece.

Exemplo:
43,24 passa para 43,2.
54,13 passa para 54,1.

II) > 5 (maior que 5). Quando o primeiro algarismo a ser abandonado é o 6,7,8, ou 9, aumenta-se em uma unidade o algarismo que permanece.

Exemplos:
23,87 passa para 23,9.
34,08 passa para 34,1.
74,99 passa para 75,0.

III) = 5 (igual a 5). Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
A) Se após o 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma unidade ao algarismo que permanece.

Exemplos:
6,352 passa para 6,4.
55,6501 passa para 55,7.
96,250002 passa para 96,3.

B) Se o 5 for o último algarismo ou após o 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentando de uma unidade se for ímpar.

Exemplos:
14,75 passa para 14,8
24,65 passa para 24,6
34,75000 passa para 34,8
44,8500 passa para 44,8

Observação: Nunca devemos fazer arredondamentos de sucessivos.


















Aula: 04
Temática: Variáveis

O significado de variável, de um modo geral, é algo: mutável; que muda; que sofre transformações; flexível. No significado estatístico: característica que é estudada em determinada população.

Quanto à classificação de variáveis temos:

Qualitativas

● Variável qualitativa nominal: quando os elementos dessa variável são identificados por nome.

Exemplo: cor do cabelo (loiro, ruivo), cor dos olhos (azuis, castanhos, verdes).

● Variável qualitativa ordinal: quando os elementos entre eles indicam uma ordem.

Exemplo: ótimo, bom, regular, ruim, péssimo.

Quantitativas

● Variável quantitativa discreta: valor muda em saltos ou passos (não existe continuidade).

Exemplo: número de filhos de um casal, número de carteiras em uma sala de aula etc.

● Variável quantitativa contínua: admite infinitos valores dentro de um espaço ou intervalo.

Exemplo: pesos das pessoas, como 75,2 (setenta e cinco quilos e duzentos gramas) ou altura, como 1,72 (um metro e setenta e dois centímetros), ou notas de 0 a 10 etc.
































Aula: 05
Temática: Tabulação

Antes de realizarmos qualquer relatório ou trabalho gráfico, devemos primeiramente efetuar a tabulação dos dados devidamente coletados, evitando dessa forma possíveis erros dentro do método estatístico.

Estrutura da tabela e do gráfico
Uma tabela deve ter a seguinte estrutura: cabeçalho, corpo e rodapé.

Cabeçalho: é o título do que deve ser estudado; deve conter o necessário para que sejam respondidas as seguintes questões: “o quê?” (referente ao fato); “onde?” (relativo ao lugar); “quando?” (correspondente ao tempo – anos, meses, dias).

Exemplo: número de acidentes em 1994 na Rodovia Castelo Branco.
O quê? – fato: acidentes
Onde? – lugar: Rodovia Castelo Branco
Quando? – tempo: 1994

● Lembre-se de que a estatística indutiva é a parte da estatística que, por intermédio de resultados obtidos da análise de uma amostra da população, procura inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi retirada.

Corpo: é representado por uma série de colunas e subcolunas em que se localizam os dados apurados. Segundo o corpo, as tabelas podem ser de entradas simples, de dupla entrada e de múltipla entrada.

Exemplo:
Entrada simples
PREVISÃO DA POPULAÇÃO PARA A CIDADE DE SÃO PAULO 1990 – 2019:
Anos População (1.000 Hab.)
1990 11.170
1994 12.226
2001 13.415
2009 14.913
2019 15.533
Dados fictícios


Exemplo:
Entrada dupla
CONTINGENTE DA EMPRESA “ESTATÍSTICOS Y” EM 2006:
Sexo/ Tipo Homens Mulheres Total
Maiores 50 35 85
Menores 30 15 45
Total 80 50 130
Dados fictícios
Existem também entradas múltiplas em que são envolvidas mais colunas, linhas e muito mais dados, regiões.







Exemplo:
Entrada múltipla
POPULAÇÃO PRESENTE NAS REGIÕES SUL E SUDESTE EM 1940 –1980:


1. População residente.
2. Resultados preliminares da publicação Tabulações Avançadas do censo Demográfico, baseados em uma amostra probabilística, de fração um pouco inferior a 1% da população e dos domicílios recenseados.
Rodapé: nessa parte da tabela localizam-se a legenda e todas as observações que venham esclarecer a interpretação da tabela. Também é no rodapé que se coloca a fonte dos dados. Em alguns casos, ela pode ser colocada também no cabeçalho. A fonte serve para dar maior veracidade à tabela.






















Aula: 06
Temática: Séries estatísticas

Normalmente, quando fazemos a leitura de um jornal ou de uma revista, nós nos deparamos com séries, sejam elas cronológicas ou históricas, categóricas ou específicas, geográficas, de dupla entrada. Nesta aula estudaremos exatamente essas Séries Estatísticas, que estão diretamente relacionadas ao nosso dia-a-dia.

Séries estatísticas
É toda tabela que apresenta a distribuição de um conjunto de dados quantitativos em função da época, do local ou da espécie. Podemos classificá-las como séries históricas ou cronológicas, geográficas, específicas ou categóricas.

● Séries históricas, cronológicas, temporais ou marchas
Descrevem os valores do estudo da variável em determinado local, época, discriminados segundo os intervalos de tempos variáveis.

Exemplo:
PREÇO DO ACÉM (CARNE BOVINA) NO VAREJO DE 1990 – 1994.
Anos Preço médio (US$)
1990 2,73
1991 2,12
1992 1,89
1993 2,04
1994 2,62
Fonte: APA

● Séries geográficas
São os valores de variáveis que acontecem em determinado local, região e instante, discriminados segundo regiões.

Exemplo:
DURAÇÃO MÉDIA DOS ESTUDOS SUPERIORES - 1994.
Países Número de Anos
Itália 7,5
Alemanha 7,0
França 7,0
Holanda 5,9
Inglaterra Menos de 4
Fonte: Revista Veja

● Séries específicas ou categóricas
Valores da variável, em determinado tempo e local, discriminado segundo especificações ou categorias, como: espécie de animais.

Exemplo:
REBANHOS BRASILEIROS EM 1992.
Espécies Quantidade (1.000 Cabeças)
Bovinos 154.440,8
Bubalinos 1.423,3
Eqüinos 549,5
Asininos 47,1
Muares 208,5
Suínos 34.532,2
Ovinos 19.955,9
Fonte: IBGE


● Séries conjugadas - tabela de dupla entrada
É uma conjugação de duas ou mais séries, valores de mais de uma variável.

Exemplo:
TERMINAIS TELEFÔNICOS EM SERVIÇO DE 1991 – 1993.
Regiões 1991 1992 1993
Norte 343.938 375.658 403.494
Nordeste 1.287.813 1.379.101 1.486.649
Sudeste 6.234.501 6.729.467 7.231.634
Sul 1.497.315 1.608.989 1.746.232
Centro-Oeste 713.357 778.925 884.822
FONTE: Ministério das Comunicações

Podemos observar que existe uma conjugação série geográfica/série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal. Podem existir, embora de modo mais raro, pela dificuldade de representação, séries compostas de três ou mais entradas.





































Aula: 07
Temática: Gráficos estatísticos

O gráfico é mais uma forma de apresentação dos dados estatísticos, com o objetivo de produzir no estudioso, ou no público em questão, uma impressão mais rápida e compreensível do fenômeno estudado. A partir dos gráficos podemos entender melhor as séries estatísticas.

O gráfico deve ser composto por meio de simplicidade, clareza e autenticidade, ou seja, deve expressar a verdade e possibilitar um claro entendimento ao público interessado.

Diagramas: são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano.

Vamos apresentar os gráficos mais utilizados:

Gráfico em linha
Constitui uma aplicação do processo de representação de funções num sistema de coordenadas cartesianas.
Fazemos uso de duas retas perpendiculares; as retas são do eixo x (eixo das abscissas) e do eixo y (eixo das ordenadas).
Para o melhor entendimento vamos considerar a seguinte série:

PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ 1987 – 1992.
Anos Quantidade (1.000 t)
1987 39,3
1988 39,1
1989 53,9
1990 65,1
1991 69,1
1992 59,5
Fonte: Agropalma


Fonte: Agropalma – Adaptado

Vamos considerar os anos como eixo x (abscissas) e as quantidades como ordenadas (eixo y). Assim, um ano dado e sua respectiva quantidade formam um par ordenado.
Veja a construção do gráfico:

Gráfico em colunas ou em barras
É a representação de uma série por meio de retângulos dispostos verticalmente (gráfico em colunas) ou na forma horizontal (gráfico em barras).

Exemplos:
PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL BRUTO 1989 – 1992.
Anos Quantidade Produzida (1.000t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Ministério da Agricultura

Veja a seguir as representações gráficas em colunas e barras:

Fonte: Ministério da Agricultura


Fonte: SECEX

Gráfico em colunas ou em barras múltiplas
Este tipo de gráfico é geralmente empregado quando queremos representar dois ou mais fenômenos estudados com a finalidade de comparação.

Exemplo:
BALANÇO COMERCIAL DO BRASIL (Valor US$).




Gráficos em setores
Gráfico construído com base de um círculo; é empregado sempre que desejamos ressaltar a participação de certo dado no total.
O total é representado pelo círculo que fica dividido em tantos setores quantas são as partes. Usamos normalmente até 7 partes.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360º.

Exemplos:
Dada a série:
REBANHO SUÍNO DO SUDESTE DO BRASIL - 1992

Utilizando a regra de três, temos:


Com esses dados (valores em graus) marcamos no círculo de raio arbitrário, e com um transferidor encontramos os arcos correspondentes, obtendo o gráfico abaixo:

Fonte: IBGE

Notas:
O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Se a série já é apresentada de forma percentual, obteremos os seguintes valores em graus multiplicando por 3,6. Por exemplo, ao encontrar 30% em graus podemos fazer: 30 x 3,6 = 108°.




































Aula: 08
Temática: Tabela de freqüência

Tanto os dados qualitativos quanto os quantitativos podem e devem ser agrupados em freqüências para construir uma tabela. Nesta aula vamos acompanhar esses procedimentos.

As freqüências associadas aos dados constituem a distribuição de freqüência. Uma tabela é constituída por dados organizados em linhas e colunas. A freqüência de um dado é o número de ocorrências ou repetições de um dado.

Elementos de uma distribuição de freqüência

I) Tabela Primitiva: conjunto de elementos (n) que não foram organizados.
II) Rol: é o arranjo obtido após a ordenação dos dados que pode ser crescente ou decrescente.
III) Classe (i): são intervalos de alteração da variável.
IV) Limites de classe (ℓi, Li): são os extremos de cada classe. O menor é o limite inferior (ℓi); o maior número é o limite superior da classe (Li).
V) Amplitude de um intervalo de classe (h): ou simplesmente intervalo de classe, é a medida do intervalo que define a classe. Esta medida é obtida pela diferença entre os limites superior e inferior. Assim, temos: hi = Li – ℓi
Vl) Amplitude total de distribuição (H): é a diferença entre o limite superior máximo e o limite inferior mínimo: H = L(max) – ℓ(mín)
Vll) Amplitude amostral (AA): é a diferença entre o valor máximo e o valor mínimo da amostra: AA = x(max) – x(mín)
Vlll) Ponto médio de uma classe (xi): é o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe, calculamos a soma dos limites e dividimos por 2, somente usado quando houver intervalos de classes. A fórmula utilizada será: , onde ℓi é o limite inferior e Li é o limite superior.

Tipos de freqüências

I) Freqüência simples ou absoluta (fi): são os valores que realmente representam o número de dados de cada classe, ou seja, o número de vezes que o elemento aparece na amostra.
II) Freqüência absoluta acumulada (fac): é o acumulo de freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe.
III) Freqüência relativa (fr): são os valores das razões entre a freqüência absoluta e a freqüência total, sendo n igual ao número total de elementos de uma amostra ou tabela. Dada por:
IV) Freqüência relativa acumulada (fr.acu): é o acúmulo da freqüência relativa do valor da variável com todas as freqüências relativas anteriores. Freqüência percentual acumulada (f%a): é o acúmulo da das porcentagens de uma tabela. Dada por: f%a= fra.100

Note que e n = ∑ fi ; e que ∑ fr = 1. (∑ = Somatório)
Classes

I) O número de classes (nc): sendo da ordem , n é o número total dos elementos da amostra. Onde .
II) Amplitude de um intervalo de classe (h): A primeira preocupação que temos na construção de uma distribuição de freqüência com intervalo de classe é a determinação das amplitudes do intervalo. O nosso intervalo de classe sempre começará pelo menor elemento da amostra e a sua amplitude será determinada pela fórmula:
O resultado da amplitude sempre deverá ser arredondado para o inteiro mais próximo.

Exemplo:

Tabela de freqüência.
Para a variável estado civil, construímos a seguinte tabela de freqüência:

Estado civil Freqüência absoluta (fi) Freqüência relativa (fr) Porcentagem
Solteiro 9 9/20 = 0,45 45%
Casado 8 8/20 = 0,40 40%
Separado 3 3/20 = 0,15 15%
Total (∑) 20 1 100%
Fonte: Iezzi ,Gelson Matemática Ciência e Aplicações - Volume 3

Exemplo:

Tabela de freqüência com intervalo de classe.
Utilizando 5 classes de intervalo, todas com o mesmo comprimento, é possível reunir os dados referentes à renda mensal da tabela seguinte:

Classes de valores Freqüência absoluta (fi) Freqüência
relativa (fr) Porcentagem
5―׀ 8 2 2/20 = 0,1 10%
8―׀ 11 5 5/20 = 0,25 25%
11―׀ 14 7 7/20 = 0,35 35%
14―׀ 17 4 4/20 = 0,2 20%
17―׀ 20 2 2/20 = 0,1 10%
∑ 20 1 100%
Dados fictícios

Observação: ―׀ab, é um intervalo fechado à esquerda e aberto à direita, assim como a ≤ x< b.

Exemplo:
Utilizando a tabela primitiva e o rol:
Um dentista anotou o número de clientes atendidos por dia, durante um período de 30 dias, e obteve os seguintes dados:
4; 6; 7; 4; 4; 5; 4; 6; 5; 5; 4; 5; 7; 5; 5; 4; 7; 5; 6; 5; 4; 5; 5; 6; 5; 7; 4; 6; 6; 7.
Rol: 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 6; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7.
Organize esses dados em forma de uma tabela total de freqüência.
i Freqüência absoluta (fi) Freqüência acumulada (fac) Freqüência relativa (fr) Porcentagem
4 8 8 8/30 = 0,267 26,70%
5 11 19 11/30=0,366 36,60%
6 6 25 6/30 = 0,20 20,00%
7 5 30 5/30 = 0,167 16,70%
∑ 30 1 100%
Dados fictícios















Aula: 09
Temática: Histogramas e polígonos de freqüência

Na aula de hoje vamos aprender como elaborar gráficos por meio da tabela de freqüência.

Histograma

Para dados agrupados em classes, a representação gráfica da distribuição é feita por meio de um histograma. É muito semelhante ao gráfico de colunas, porém, neste caso, a área de cada retângulo (usualmente 1 cm ou 2 cm de base) é proporcional à freqüência da classe, e os retângulos se tocam.



No histograma, se ligarmos os pontos médios da parte superior de cada retângulo e “fecharmos” essa curva poligonal, obteremos um polígono de freqüência. Veja a seguir:


Polígono de freqüência

O polígono de freqüência é um gráfico em linha, cujas freqüências são marcadas sobre as perpendiculares ao eixo horizontal e erguidas a partir dos pontos médios (xi) de cada intervalo de classe. Em outras palavras, as junções são formadas pelo ponto médio da classe na vertical, com a freqüência da classe na horizontal.

Exemplo: construir o histograma e o polígono de freqüência da distribuição abaixo:

Idades Freqüência absoluta (fi) xi
2 I− 4 8 3
4 I− 6 8 5
6 I− 8 14 7
8 I− 10 5 9
∑ 35

Ao construir o polígono de freqüência, se o limite inferior de intervalo da primeira classe é 02 e o limite superior da última classe é 10, o polígono será encerrado em 01 e 11.


Nota: para obtermos um polígono, devemos ligar os extremos de cada linha obtida aos pontos médios da classe anterior, bem como ao ponto médio posterior à última classe da distribuição.

Exemplo:





Aula: 10
Temática: Medidas de tendência central

Começaremos a estudar as medidas de tendência central média, mediana e moda. O conteúdo será dividido em 3 aulas, e, hoje, veremos a Média.

Média aritmética / ponderada
A) Para amostra
A média aritmética, ou simplesmente média, é a soma de todos os elementos de uma amostra na qual é dividida pelo número de elementos; vamos representar a média com o símbolo . Para calcularmos a média usaremos:


Onde é a média aritmética, n o número de valores e xi os valores da variável.

Notas:

1º) A Média Aritmética situa-se entre o valor máximo e o mínimo da distribuição, podendo, inclusive, vir a ser um número não presente na distribuição.

2º) Quando comparada entre dois grupos possibilita algumas interpretações, identificado, por exemplo, qual o grupo com resultados mais ou menos elevados.

3º) O cálculo da média aritmética é feito a partir da divisão da somatória de todos os valores da distribuição pelo número total de observações da série. Em outras palavras, é o quociente da divisão da soma dos valores da variável pelo número total deles.

Exemplo:
Sabendo-se que a produção leiteira diária de uma vaca holandesa, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, quanto foi a produção média da semana?
litros

B) Para dados agrupados sem intervalo de Classe
A coluna de freqüência de uma tabela indica a repetição de um dos elementos. Neste caso, a média será calculada através do produto entre o valor da variável e sua respectiva freqüência e o resultado dividido pelo número total de elementos da tabela. A fórmula usada para este cálculo é:


Exemplo:
De acordo com dados apresentados na tabela a seguir, calcule a média aritmética.

Idade (xi) Número de pessoas (fi) xi . fi
21 02 21 x 2 = 42
22 05 22 x 5 = 110
23 08 23 x 8 = 184
24 06 24 x 6 = 144
25 05 25 x 5 = 125
26 04 26 x 4 = 104
∑ 30 709



C) Para dados agrupados em classes
É muito parecida com o cálculo dos dados agrupados sem classe. O que difere é a presença do ponto médio, sendo assim, o não é mais a variável e sim o seu ponto médio, sua respectiva freqüência e o resultado dividido pelo número total de elementos da tabela. A fórmula será:


Exemplo:
Considerando os dados da tabela a seguir, calcule a média.

Classes fi xi (ponto médio) xi . fi
4 ı− 5 01 4,5 4,5 x 1 = 4,5
5 ı− 6 04 5,5 5,5 x 4 = 22,0
6 ı− 7 11 6,5 6,5 x 11 = 71,5
7 ı− 8 07 7,5 7,5 x 7 = 52,5
8 ı− 9 02 8,5 8,5 x 2 = 17,0
∑ 25 167,5

























Aula: 11
Temática: Mediana

A mediana é o valor que divide um conjunto de dados ordenados ao meio (50%), ou seja, ela nos fornece o elemento central desse conjunto de dados.

A) Para amostra com número de elementos ímpar, usamos:

Exemplo:
Se considerarmos 2; 3; 4; 6; 7, temos 5 elementos. Logo:

O 3º elemento, que é o 4, é o termo central da amostra.

Nota: os dados devem ser colocados em ordem crescente.

B) Para amostra com número par de elementos, usamos:
e +1
Exemplo:
Se considerarmos 2; 3; 3; 6; 7; 8 temos 6 elementos. Logo:
e
Encontramos o 3º elemento e o 4º elemento. Então, tiramos a média entre o 3º e 4º elemento do rol. Logo:

Portanto Md = 4,5


C) Para dados agrupados sem classe
Será necessário identificar a freqüência acumulada imediatamente superior a metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada tomemos a tabela a seguir completando-a com a coluna correspondente à freqüência acumulada

Exemplo:
De acordo com a tabela abaixo, calcule a mediana.
Nº de estudantes fi fac
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ 34

Seja:

A menor freqüência que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo:
Md = 2 estudantes
Nota:
No caso de existir uma fac, tal que:
,
a mediana será dada por:

ou seja, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e o seguinte.



xi fi fac
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
∑ 8
Assim:

Logo:
, mediana igual a 15,5.

D) Para dados agrupados em classes
Para calcular a mediana, devemos, primeiramente, identificar na tabela, por intermédio da coluna de freqüência acumulada, a classe da mediana por meio da fórmula:

Onde, ℓ* é o limite inferior da classe da mediana; F(ant) é a freqüência acumulada da classe anterior à classe da mediana; f* é a freqüência simples da classe da mediana; h* é a amplitude da classe da mediana; é o número de elementos da tabela.

Exemplo:
De acordo com a distribuição abaixo, calcule a mediana.

Altura (cm) fi fac
155 ı− 160 05 05
160 ı− 165 09 14
165 ı− 170 10 24
170 ı− 175 12 36
175 ı− 180 05 41
∑ 41

Classe da mediana será: . Sendo 20,5º elemento = 21º elemento






















Aula: 12
Temática: Moda

A moda de um conjunto de dados é o valor que se repete mais, isto é, aquele com maior freqüência entre os dados. Existem casos em que há mais de uma moda, e outros em que a moda não existe. Iremos representá-la por Mo.

A) Para amostra

Exemplo:
O número de livros vendidos a cada hora foi coletado em três livrarias (A, B e C). Os dados obtidos em um período de oito horas foram:
Livraria A: 0; 1; 2; 2; 2; 2; 3; 4. A moda é 2.
Livraria B: 1; 2; 2; 2; 3; 3; 3; 5. As modas são 2 e 3 (bimodal).
Livraria C: 0; 0; 1; 1; 2; 2; 3; 3. Não existe moda (amodal).

B) Para dados agrupados sem classe

Exemplo:
A tabela abaixo mostra as horas de atraso em 30 vôos de uma companhia aérea. Determine a moda:
Horas Freqüência
0 15
1 08
2 04
3 02
4 01

Sendo assim, M = 0 horas

C) Para dados agrupados em classes

Neste caso, precisaremos inicialmente achar a classe de maior freqüência, a qual chamamos de classe modal. Através desta classe é que iremos calcular a moda por intermédio da fórmula:
, sendo:
ℓ* o limite inferior da classe modal;
D1 a fi da classe modal – fi anterior;
D2 a fi da classe modal – fi posterior;
h a amplitude da classe modal (intervalo).

Exemplo:
De acordo com a tabela abaixo, calcule a moda:
Altura (cm) Nº de pessoas
155 ı− 160 05
160 ı− 165 09
165 ı− 170 10
170 ı− 175 12
175 ı− 180 05
∑ 41


Expressões gráficas da Moda
Na curva de freqüência, a moda é o valor que corresponde, no eixo das abscissas, ao ponto de ordenada máxima.














Aula: 13
Temática: Posição relativa de média, mediana e moda

Nesta aula veremos as posições gráficas e faremos exercícios envolvendo as três medidas de tendência central. A partir daí entenderemos o porquê dessas medidas através dos cálculos e da representação gráfica, além de observarmos que uma medida é muito próxima da outra.

Se uma distribuição é simétrica, as três medidas coincidem. No entanto, a assimetria as torna diferentes, e essa diferença é tanto maior quanto maior é a assimetria. Então, em uma distribuição no formato de sino, temos:
, no caso da curva simétrica;
, no caso da curva assimétrica negativa;
, no caso da curva assimétrica positiva.





Aula: 14
Temática: Conceitos básicos de dispersão ou variabilidade

Na unidade anterior vimos que um conjunto de valores pode ser convenientemente sintetizado por meio de procedimentos matemáticos com poucos valores representativos - média aritmética, mediana e moda.

No entanto, quando se trata de representar dados estatísticos, mesmo àqueles já convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de como se apresentavam esses mesmos dados na tabela. Sendo assim, não é suficiente dar uma medida de tendência central para caracterizar perfeitamente um conjunto de valores, por exemplo, mesmo sabendo que a temperatura média de duas cidades é a mesma, igual a 26º. Ainda assim, somos levados a pensar sobre a temperatura e sobre o clima dessas cidades. Em uma delas pode variar de um clima muito quente de um ponto da cidade como outro mais favorável. Consideremos o seguinte conjunto de valores das variáveis x, y e z.

Exemplo: x: 70; 70; 70; 70; 70
y: 67; 70; 70; 71; 72
z: 4; 16; 50; 120; 160
Calculando a média aritmética de cada um desses conjuntos, obtemos a mesma média:
Média de x = 350/5 = 70
Média de y = 350/5 = 70
Média de z = 350/5 = 70

Observamos que a média é a mesma nos três casos, mas podemos notar que a média de x é mais homogênea, ou seja, os valores são iguais e, por sua vez, y é mais homogêneo que z.
Chamamos de dispersão ou variabilidade a maior ou menor diversificação em torno de um valor de tendência central. Tomado como ponto de comparação, no exemplo acima, o x apresenta uma dispersão ou variabilidade nula e o conjunto y apresenta dispersão ou variabilidade menor que z.
Para estudarmos os valores de uma certa variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a estatística recorre às medidas de dispersão ou variabilidade.
Dessas medidas, estudaremos a amplitude total, o desvio médio, o desvio padrão e o coeficiente de variação.








Aula: 15
Temática: Amplitude total

Nesta aula veremos a amplitude total e algumas aplicações.

A amplitude total é a diferença entre o maior e o menor valor observado.
AT = x(máx.) – x(mín.)
Exemplo:
Para os valores 30; 40; 60; 70; 80, temos:
AT = 80 – 30 = 50

Quando dizemos que a amplitude total dos valores é 50, estamos afirmando alguma coisa referente à sua concentração. Quanto maior a amplitude total, maior a dispersão ou variabilidade dos dados da variável.

Dados não agrupados

Exemplo:
Conjunto x: 70; 70; 70; 70; 70
ATx= 70 – 70 = 0 → dispersão ou variabilidade nula
Conjunto y: 67; 70; 70; 71; 72
ATy = 72 – 67 = 5
Conjunto z: 4; 16; 50; 120; 160
ATz = 160 – 4 = 156

Podemos observar que o conjunto que apresenta maior dispersão ou variabilidade é o conjunto Z.

Dados agrupados sem intervalos de classe

Neste caso, temos: AT = x(máx.) – x (mín.)
Exemplo:
Considerando a tabela a seguir:
xi fi
0 2
1 6
2 12
3 7
4 3

Temos: AT = 4 – 0 = 4
Logo: AT = 4

Com intervalos de classe

Nesse caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe:
AT = L(máx.) – ℓ(mín.)
Considerando a distribuição abaixo:
i Estaturas (cm) fi
1 150 ı− 155 04
2 155 ı− 160 09
3 160 ı− 165 11
4 165 ı− 170 08
5 170 ı− 175 05
6 175 ı− 180 03
∑ 40

Assim:
AT = 180 – 150 = 30 cm

O inconveniente da amplitude total é que só podem ser levados em consideração os valores extremos, desconsiderando os valores intermediários.

Curiosidade
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle de qualidade, ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade.


























Aula: 16
Temática: Desvio médio

Chamamos de desvio a diferença entre um valor e a média dos dados, ou seja, a diferença entre cada elemento de uma série de dados e a média aritmética dos elementos dessa série.


Desvio em relação à média (di)
Desvio em relação à média é a diferença entre cada elemento da série e a média que o representa.

Exemplo:
Seja o rol: 11; 46; 56; 62; 65; 80; 104; 130; 166.


x1 = 11 x2 = 46 x3 = 56
x4 = 62 x5 = 65 x6 = 80
x7 = 104 x8 = 130 x9 = 166

d1 = 11 – 80 = – 69 d2 = 46 – 80 = – 34 d3 = 56 – 80 = – 24
d4 = 62 – 80 = – 18 d5 = 65 – 80 = – 15 d6 = 80 – 80 = 0
d7=104 – 80 = 24 d8=130 – 80 = 50 d9 = 166 – 80 = 86

Desvio médio

Exemplo:
Consideremos os seguintes dados:
10; 11; 11; 12; 12; 13; 13; 14.
A média dos dados será:
Média:
( ) =

Desvio médio:


O desvio médio avalia a variabilidade ou a dispersão dos dados em torno da média aritmética, isto é, elas indicam a representatividade da média.

a) Para dados agrupados sem intervalo de classe.
xi fi xi . fi
05 02 10
07 03 21
08 05 40
09 04 36
11 02 22
∑ 16 129

Média →
Logo:

│xi – │= │di│
│di│. fi
│5 – 8,06│ = 3,06 6,12
│7 – 8,06│ = 1,06 3,18
│8 – 8,06│ = 0,06 0,30
│9 – 8,06│ = 0,94 3,76
│11 – 8,06│ = 2,94 5,88
∑ 19,24

Portanto:


























Aula: 17
Temática: Variância e desvio padrão

De todas as medidas de dispersão, a mais utilizada é o desvio padrão. Esta medida se baseia nos desvios de cada valor de uma série em relação à média, considerando (xi – x)², pois sabemos que a soma desses desvios é igual a zero.

O desvio padrão resultará da raiz quadrada da variância (S²). Como vimos, a amplitude total é instável por se deixar influenciar pelos valores extremos que são, em sua maioria, devidos ao acaso. A variância e o desvio padrão são medidas que fogem a essa falha, pois leva em conta a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis.

Mostraremos as seguintes fórmulas para o cálculo do desvio padrão:

Desvio padrão – dados não agrupados

Exemplo:
De acordo com a amostra 5; 7; 9; 11; 13, calcule o desvio padrão.
A fórmula utilizada é:

Lembrando que ∑fi é igual a n.

Para facilitar este cálculo iremos transportar esta amostra para uma tabela.
xi xi²
5 25
7 49
9 81
11 121
13 169
∑ = 45 ∑ = 445
Como n é igual a 5 temos:


Desvio padrão – dados agrupados

● Sem intervalos de classe

Exemplo:
De acordo com a tabela abaixo calcule o desvio padrão
Nº de filhos fi xi . fi xi² . fi
0 02 00 00
1 06 06 06
2 12 24 48
3 07 21 63
4 03 12 48
Total 30 63 165



● Com intervalo de classe

A única diferença é que o xi neste caso se refere ao ponto médio de cada classe, ou seja, temos de abrir uma nova coluna para o ponto médio (xi).

Exemplo:

De acordo com a tabela a seguir calcular o desvio padrão.

Estaturas (cm) fi xi xi . fi xi² . fi
150 ı− 154 04 152 608 92.416
154 ı− 158 09 156 1.404 219.024
158 ı− 162 11 160 1.760 281.600
162 ı− 166 08 164 1.312 215.168
166 ı− 170 05 168 840 141.120
170 ı− 174 03 172 516 88.752
∑ 40 6.440 1.038.080













Aula: 18
Temática: Coeficiente de variação

O desvio padrão, por si somente, não produz muita coerência. Para contornar algumas dificuldades ou limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, ou seja, podemos caracterizar por meio de uma porcentagem.

Essa medida em forma de porcentagem é denominada coeficiente de variação:

Onde CV é o coeficiente de variação e S é o desvio padrão.

A tabela abaixo se refere às estaturas, onde: = 161 cm e S = 5,56.
Estaturas (cm) fi xi xi . fi xi² . fi
150 ı− 154 04 152 608 92.416
154 ı− 158 09 156 1.404 219.024
158 ı− 162 11 160 1.760 281.600
162 ı− 166 08 164 1.312 215.168
166 ı− 170 05 168 840 141.120
170 ı− 174 03 172 516 88.752
∑ 40 6.440 1.038.080
Temos, então:
Esse resultado significa que existe uma variação em torno da média de 3,46%.








Aula: 19
Temática: Assimetria - Introdução

Como vimos na unidade III, numa distribuição simétrica, as medidas de tendência central coincidem, ou seja, a média, a moda e a mediana. Sendo a distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; sendo assimétrica à direita ou positiva, a média é maior que a moda.




Baseando-se nessas relações entre a média e a moda, podemos empregá-las para determinar o tipo de assimetria.

Assim, calculamos o valor da diferença: Média – Moda, se:

Média – Moda = 0 → Assimetria nula ou distribuição simétrica;
Média – Moda < 0 → Assimetria negativa ou à esquerda;
Média – Moda > 0 → Assimetria positiva ou à direita.


Exemplo:

Distribuição A
xi fi
02 ı− 06 06
06 ı− 10 12
10 ı− 14 24
14 ı− 18 12
18 ı− 22 06
Σ 60

Temos:
Média = 12; Mediana = 12; Moda = 12; S = 4,42.

Distribuição B
xi fi
02 ı− 06 06
06 ı− 10 12
10 ı− 14 24
14 ı− 18 30
18 ı− 22 06
Σ 78


Temos:
Média = 12,9 Mediana = 13,5 Moda = 16 S = 4,2

Distribuição C
xi fi
02 ı− 06 06
06 ı− 10 30
10 ı− 14 24
14 ı− 18 12
18 ı− 22 06
Σ 78
Temos:
Média = 11,1 Kg Mediana = 10,5 Kg Moda = 8 Kg S = 4,20Kg

Portanto, temos a seguinte situação em cada distribuição:
Distribuição A: 12 – 12 = 0; a distribuição é simétrica.
Distribuição B: 12,9 – 16 = – 3,1; a distribuição é assimétrica negativa.
Distribuição C: 11,1 – 8 = 3,1; a distribuição é assimétrica positiva.






















Aula: 20
Temática: Coeficiente de assimetria

A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a possibilidade de comparação entre as medidas de duas distribuições. Por este motivo, é viável usarmos o coeficiente de assimetria de Pearson, dado por:

Se 0,15 < │AS│< 1, a assimetria é considerada moderada: se │AS│>1, é forte.

Exemplo:
Considerando as distribuições A, B, e C dadas na aula anterior, temos:














Aula: 21
Temática: Quartil e percentil

Antes de entrarmos em medidas de curtose devemos ter noções sobre Quartil e Percentil, que são medidas de posição.

Quartil
São valores que dividem um conjunto de elementos ordenados em quatro partes iguais, ou seja, cada parte contém 25% desses elementos.
Há, portanto, três quartis: Q1, Q2 e Q3.
Q1 – é chamado de primeiro quartil, ou seja, valor que deixa 25% dos elementos à sua esquerda e 75% dos elementos à sua direita.
Q2 – é chamado de segundo quartil e coincide com a mediana (Q2 = Md), ou seja, 50% dos elementos estão à sua esquerda e 50% à sua direita.
Q3 – é chamado de terceiro quartil, ou seja, valor que deixa 75% dos elementos à sua esquerda e 25% à sua direita.

Quando os dados são agrupados para determinar os quartis, usamos a mesma técnica do cálculo da mediana, bastando substituir na fórmula da mediana, por ; sendo k o número de ordem do quartil.

No primeiro quartil (Q1), utiliza-se:

Onde, ℓQ1 é o limite inferior da classe do primeiro quartil, é a amplitude do intervalo da classe mediana, n é o número de elementos da tabela (Σfi) e ∑F(ant) é a freqüência acumulada do primeiro quartil.

No segundo quartil (Q2), utiliza-se a mesma fórmula da mediana.

No terceiro quartil (Q3), utiliza-se:

Exemplo: com os dados apresentados na tabela abaixo, calcule o primeiro e terceiro quartil:

Classes fi Fac
0 ı− 2 03 03
2 ı− 4 06 09
4 ı− 6 12 21
6 ı− 8 09 30
8 ı−10 06 36
 36

Primeiro quartil
1º) Achar a classe do primeiro quartil:

O 9º elemento olhando no Fac se encontra na segunda classe.

2º) Depois de localizada a classe do primeiro quartil, utilizaremos a expressão abaixo para obter o valor desejado.


Terceiro quartil
1º) Achar a classe do terceiro quartil:

O vigésimo sétimo elemento olhando na Fac está na quarta classe. Logo:


Isto é: 4 deixa 25 % dos elementos (1º quartil)
7,33 deixa 75% dos elementos (2º quartil)
Percentil
Denominamos percentis aos noventa e nove valores que separam uma série em 100 partes iguais. A notação que usaremos para os percentis será Pi, onde o índice i indica a ordem do percentil considerado.

Exemplo:
P10 indica que 10% dos dados estão ordenados à sua esquerda e 90% à direita de P10.

Cálculo de um percentil
Para calcularmos os percentis dos dados em uma tabela de freqüência, devemos identificar, na freqüência acumulada, a classe do percentil desejado através da fórmula , que é a posição do percentil em estudo. Para obtermos a posição da classe do percentil usaremos a expressão:


Observação: P10 também pode ter a denominação de 1º decil (Di), assim como P20 é igual ao 2º decil (D2) e assim por diante.

Exemplo:
Calcular o 15º percentil referente à tabela abaixo.
Classes fi Fac
4,85 ı− 4,90 03 03
4,90 ı− 4,95 06 09
4,95 ı− 5,00 12 21
5,00 ı− 5,05 09 30
5,05 ı− 5,10 06 36
Total 36

1º) Achar a classe de P15.
(5,4º elemento)

Observando na Fac, podemos afirmar que o 15º percentil se encontra na segunda classe.

2º) Após encontrarmos a classe, iremos obter o valor do 15º percentil através da fórmula a seguir:







Aula: 22
Temática: Regressão

Sempre que vamos estudar uma variável em função de outra, fazemos uma análise de regressão. A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas.

A variante sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente.
Assim, podemos supor que x seja a variável independente e y a variável dependente. Vamos procurar determinar o ajustamento de uma reta na relação entre essas variáveis, ou seja, vamos obter uma função definida por y = ax + b; onde a e b são parâmetros.

Exemplo:
Sejam duas variáveis x e y entre as quais existe uma correlação acentuada, embora não perfeita, como as que formam na tabela abaixo:
xi 05 08 07 10 06 07 09 03 08 02
yi 06 09 08 10 05 07 08 04 06 02

Cujo diagrama de dispersão é dado por:

Podemos observar, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por:
y = ax + b
Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das equações:
e
Onde:
n é o número de observações;
é a média dos valores xi ;
é a média dos valores yi .

Observação:
Como estamos usando uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo assim, escrevemos:

Onde é o y estimado.

Vamos formar a tabela de valores (para n = 10).
xi yi xi.yi xi²
5 6 30 25
8 9 72 64
7 8 56 49
10 10 100 100
6 5 30 36
7 7 49 49
9 8 72 81
3 4 12 9
8 6 48 64
2 2 4 4
∑ = 65 ∑ = 65 ∑ = 473 ∑ = 481

Assim:

Como:
= 65/10 = 6,5 e = 65/10 = 6,5
Temos:

Onde:
a = 0,86 e b = 0,89
Logo:
ŷ = 0,86 x + 0,89

Ao traçar a reta no gráfico, determinamos dois de seus pontos:
x = 0  ŷ = 0,89
x = 5  ŷ = 0,86 . 5 + 0,89 = 5,19
Assim temos:


Interpolação e extrapolação
Voltando à tabela, observamos que 4,0 não aparece entre as notas de Geografia. Então, podemos estimar a nota correspondente em História fazendo x = 4,0 na equação:

x = 4,0  ŷ = 0,86 . 4,0 + 0,89 = 4,33

O mesmo acontece com a nota 1,0. Repetindo o procedimento, temos:
x = 1,0  ŷ = 0,86 . 1,0 + 0,89 = 1,75

Como 4 Є [2, 10], dizemos que foi feita uma interpolação; e como 1 [2, 10], dizemos que foi feita uma extrapolação.













Aula: 23
Temática: Noções de probabilidade: espaço amostral e evento

O estudo da probabilidade começou na Itália, quando o matemático e médico Giloramo Cordano (1501 – 1576) relacionou noções elementares de probabilidade com jogos de azar. Atualmente, grande quantidade de jogos são oferecidos, entre os quais citamos, por exemplo: a loteria federal, a sena, a megasena, a loteca. É natural que se pense nas chances de ganhar um prêmio antes de decidir em qual deles jogar.

Muitas vezes, ao acordarmos, perguntamos para nós mesmos: será que vai chover? De um modo ou de outro atribuímos um valor à chance de chover, e, então, decidimos o tipo de roupa que usaremos e se levaremos ou não o guarda-chuva. Sendo assim, as probabilidades estão associadas a eventos.

Experimento aleatório
São experimentos cujos resultados ocorrem ao acaso. Mesmo que repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.

Exemplo: a afirmação “é provável que eu vença o jogo de xadrez hoje” pode resultar:
a) que, apesar do favoritismo, eu perca;
b) que, como pensei, eu vença;
c) que haja um empate.
Como vimos, o resultado final depende do acaso.

Espaço amostral (S)
Cada experimento corresponde, em geral, a vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1; 2; 3; 4; 5 ou 6.
Ou seja:
a) Lançamos a moeda e observamos o resultado da face superior:
S = {cara, coroa}

b) Ao lançarmos um dado vamos observar o resultado na face superior:
S = {1; 2; 3; 4; 5; 6}

c) Lançamos duas moedas diferentes e observamos o resultado na face de cada moeda:
S = {(cara, cara); (cara, coroa); (coroa, cara); (coroa, coroa)}

Evento
Podemos chamar de evento qualquer subconjunto do espaço amostral (S). Será representado por qualquer letra maiúscula de nosso alfabeto.

Exemplo: No lançamento de um dado onde S = {1; 2; 3; 4; 5; 6}, temos:
A = {2; 4; 6} está contido em S; logo, A é um evento de S.
G = {1; 2; 3; 4; 5; 6} está contido em S; logo, G é um evento de S.
L = 7 está contido em S; logo, L é um evento impossível de S.

Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser definidos pelas sentenças:
“obter um número par na face superior”
“obter um número menor ou igual a 6 na face superior”
“obter um número maior que 6 na face superior”




Aula: 24
Temática: Noção informal de probabilidade

Chama-se probabilidade de ocorrer o evento A, a razão entre o número de elementos de A: n(A) e o número de elementos de S: n (S).


Exemplos:
1º Lançando-se um dado, qual a probabilidade de ocorrer na face superior um número par?
S = {1, 2, 3, 4, 5, 6} → n(s) = 6 elementos
A = {2, 4, 6} → n(A) = 3 elementos
ou 50%

2º Lançando-se uma moeda três vezes, sucessivamente, qual a probabilidade de obtermos pelo menos uma cara?
Vamos obter os elementos do espaço amostral através de um diagrama conhecido por árvore de probabilidades ou simplesmente diagrama de árvore.
K (K,K,K)
K
C (K,K,C)
K
K (K,C,K)
C
C (K,C,C)


K (C,K,K)
K
C (C,K,C)
C
K (C,C,K)
C
C (C,C,C)

K = Cara C = Coroa n(s) = 8 elementos
O evento sair pelo menos uma cara é formado por seqüências que apresentam uma, duas ou três vezes cara, isto é:
A = {(K,C,C); (C,K,C); (C,C,K); (K,K,C); (K,C,K); (C,K,K); (K,K,K)} → N (A) = 7
7 elementos























Aula: 25
Temática: Eventos complementares

Um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:
p + q = 1 q = 1 – p

Assim, se a probabilidade de realizar um certo evento é , a probabilidade de que ele não ocorra é q = 1 – p, ou seja:

Sabemos que a probabilidade de tirar o 2 no lançamento de um dado é . Logo, a probabilidade de não tirar o 2 no lançamento de um dado é:

Associação de eventos
I) Dados dois eventos A e B, o evento A U B (A união com B) ocorre somente se houver pelo menos um desses eventos (A, B ou A e B).
II) Dados dois eventos A e B, o evento A ∩ B (A intersecção com B) ocorre, somente se houver, simultaneamente, o evento A e o evento B.
Se A for um evento, o evento complementar de A é aquele que ocorrerá se, e somente se, não ocorrer o evento A.

Demonstre que no lançamento de um dado, o evento complementar do evento “número ímpar” é o “evento número par”.

Resolução:
Considerando S = {1, 2, 3, 4, 5, 6} e E1= {1, 3, 5} e E2 = {2, 4, 6}

Observamos que:
a) {1, 3, 5} U {2, 4, 6} = {1, 2, 3, 4, 5, 6} = E1 U E2 = S
b) {1, 3, 5} ∩ {2, 4, 6} =  = E1 ∩ E2 = 
Portanto: p(E1) + p (E2) = 1


























Aula: 26
Temática: Eventos mutuamente exclusivos

Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um, exclui a realização do(s) outro(s).

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro ocorra é igual à soma das probabilidades de que cada um deles se realize, ou seja, os elementos desses eventos não se repetem.
P (A U B) = P(A) + P(B)

Considerando dois eventos A e B contidos num mesmo espaço amostral, existirá a presença de elementos repetidos. Sendo assim:
P(A U B) = P(A) + P(B) – P (A ∩ B)

Exemplo: uma urna contém 20 bolas idênticas numeradas de 1 a 20. Extraindo-se uma bola ao acaso dessa urna, qual a probabilidade de o número da bola sorteada ser:
a) múltiplo de 2 ou 3? b) múltiplo de 5 ou 7?

Resolução:
a) Consideramos os seguintes eventos:
A → o número múltiplo de 2:
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}
A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20} →

B → o número múltiplo de 3:
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}
B = {3, 6, 12, 15, 18} →
A ∩ B = {6, 12, 18} →
Como ou 65%.

b) Consideramos os seguintes eventos:
A → o número é múltiplo de 5:
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}
A = {5, 10, 15, 20} =

B → o número é múltiplo de 7:
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}
B = {7, 14} =

Como A ∩ B = , então P (A U B) = P(A) + P(B). Assim:
ou 30%












Aula: 27
Temática: Probabilidade condicional

Muitas vezes quando realizamos um experimento, temos informações adicionais sobre a ocorrência de um evento. Neste caso, necessitamos utilizar esta informação adicional para re-alocar probabilidades aos outros eventos.

Considerando os eventos A e B de um espaço amostral S, defini-se como probabilidade condicional do evento A, tendo ocorrido o evento B e indicado por , a razão:

Exemplo:
No lançamento de 2 dados, observando as faces de cima, para calcular a probabilidade de sair o número 5 no primeiro dado, sabendo que a primeira soma dos 2 números é maior que 7, consideramos:
S = {(1, 1); (1, 2); ... ; (6, 5); (6, 6)}  n(S) = 36
Evento A: número 5 no primeiro dado
A = {(5, 1); (5, 2); (5, 3); (5, 4); (5, 5); (5, 6)}
Evento B: a soma dos dois números é maior que 7
B = {(2, 6); (3, 5); (3, 6); (4, 4); (4, 5); (4, 6); (5, 3);
(5, 4); (5, 5); (5, 6); (6, 2); (6, 3); (6, 4); (6, 5); (6; 6)}

A ∩ B = {(5, 3); (5, 4); (5, 5); (5, 6)}
P(A ∩ B) =
P(B) =
Assim,
● Multiplicação de probabilidades
A probabilidade de acontecer P(A ∩ B) é igual ao produto da probabilidade de um deles pela probabilidade do outro em relação ao primeiro.
Sendo, ou
Então: ou

● Eventos independentes
Dizemos que dois eventos são independentes quando a realização ou a não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Ou seja, dois eventos A e B de um espaço amostral S, são independentes quando ou .
Sendo os eventos A e B independentes, temos:
I) e Il)

Substituindo I em II, temos:
P (A ∩ B) = P(A) x P(B)

Exemplo: Uma caixa contém 20 lâmpadas das quais 6 são defeituosas. Retirando-se duas lâmpadas, qual a probabilidade de ambas serem boas quando:
a) há reposição? b) não há reposição?

Resolução:
Temos n(S) = 20 lâmpadas. Consideremos os seguintes eventos:
A: a primeira lâmpada é boa.
B: a segunda lâmpada é boa.

A e B são eventos independentes, pois o fato de sair uma lâmpada boa na primeira não influi em sair uma lâmpada boa na segunda.
a) com reposição:
n(S) = 20 lâmpadas
n(A) = 14 lâmpadas boas =
n(B) = 14 lâmpadas boas =
P (A ∩ B) = P(A) x P(B) = x = = = 49%

b) sem reposição
n(S) = 20 lâmpadas
n(A) = 14 lâmpadas boas =

2ª lâmpada boa.
n(S) = 19 lâmpadas
n(B) = 13 lâmpadas boas =
P (A ∩ B) = P(A) x P(B) = x = = = 47,9%







Aula: 28
Temática: Estatística inferencial

Estatística inferencial é o nome dado ao conjunto de técnicas analíticas, utilizado para identificar e caracterizar relações entre variáveis. Os seus principais componentes são:

● Teste de Hipóteses: conjunto de métodos para calcular a probabilidade da diferença entre duas médias (ou dois percentuais) ser devido ao acaso. Há tipos diferentes de teste em função da distribuição de probabilidade dos dados e das suas escalas numéricas, sendo testes paramétricos para variáveis intervalares ou de razão com distribuição gaussiana e testes não-paramétricos para outros tipos de variáveis. Também existem testes diferentes para a comparação de duas variáveis distintas (testes pareados) e de dois subgrupos dentro de uma mesma variável (testes não pareados). Uma diferença estatisticamente significativa é aquela em que a chance dela ter ocorrido por acaso é considerada baixa o suficiente (geralmente 5% ou menos).



● Coeficiente de correlação: é uma forma de identificar a existência ou não de uma relação entre duas variáveis e, caso ela exista, de quantificar tal relação (como vimos na unidade V). O grau de relacionamento é dado pelo calor do coeficiente, o qual pode variar de “0” (sem relacionamento algum) a “1” (perfeito relacionamento). A natureza positiva (quando uma aumenta, a outra também o faz) ou negativa (quando uma aumenta, a outra diminui) é dada, respectivamente, pelo sinal positivo ou negativo do coeficiente. A existência ou não de um relacionamento entre as variáveis é dada pela probabilidade do coeficiente encontrado ser devida ao acaso (o seu valor de “p”). A forma de cálculo do coeficiente varia conforme a escala numérica e a distribuição de probabilidade das variáveis desenvolvidas, mas ele corresponde matematicamente ao coeficiente da reta de regressão linear.



● Diagrama de dispersão: como já vimos antes, é a representação de duas ou mais variáveis através de gráficos cartesianos onde cada eixo representa uma das variáveis. Assim, os registros são tomados como sendo as coordenadas de um ponto num espaço bidimensional (dois eixos cartesianos) ou tridimensional (três eixos cartesianos). O objetivo básico dessa forma de representar dados é o de procurar identificar, no conjunto de pontos que constituem os dados de um experimento ou observação, padrões que surgiram a natureza da relação entre as variáveis consideradas.



● Curvas de sobrevida: como o próprio nome diz, a análise do tempo que decorre até a ocorrência de um evento envolve a estimativa da probabilidade de um evento, que ocorrerá em diferentes períodos. A análise de sobrevivência estima a probabilidade de sobrevivência como uma função do tempo, a contar de um ponto de partida, que pode ser, por exemplo, a data de um diagnóstico ou de uma intervenção.



● Análise de séries temporais: conjunto de técnicas estatísticas orientadas para identificação das tendências de uma ou mais variáveis em função do tempo. Em linhas gerais, são diversos procedimentos para a diferenciação entre as oscilações devido ao acaso daquelas que são um reflexo da dinâmica do fenômeno que está sendo estudado. Parte do processo envolve tomar a curva produzida pela variável quando esta é traçada em função do tempo (série temporal) e “suavizá-la” por meio de muitos métodos, de modo a produzir uma série suavizada que mostra as principais tendências de evolução e uma série de resíduos que representa as variações aleatórias.




















Aula: 29
Temática: Amostragem

Os problemas de amostragem podem ser mais ou menos complexos e sutis, dependendo das populações e das variáveis que se deseja estudar. De um lado, os problemas de amostragem para um controle de qualidade de produtos industriais são de fácil resolução. Por outro lado, em pesquisas econômicas, sociais ou de opinião, a complexidade desses problemas é normalmente grande. O problema de amostragem exige muito bom senso e experiência e é sempre conveniente que o trabalho do estatístico seja complementado pelo trabalho de um especialista do assunto em estudo. Basicamente existem dois tipos de amostragem: a probabilística e a não probabilística. Vamos estudar cada uma delas.

AMOSTRAGEM PROBABILÍSTICA
É possível usar combinações de várias técnicas de amostragem probabilística, embora seja comum utilizar as técnicas isentas de mistura e, entre estas, as principais serão citadas a seguir. Veremos alguns tipos:

Amostragem casual simples (ou ao acaso)
Consiste em enumerar os elementos de uma população e escolher os n elementos dessa seqüência, que irão compor a amostra através de um dispositivo aleatório qualquer como a tabela de Tipet (Edgenworth, Kendall, Fisher, etc.) ou a tabela de números ao acaso.
A tabela de números ao acaso é constituída por inúmeros dígitos gerados por um processo equivalente a um sorteio equiprovável. Seja, então, a população constituída por N = 700 elementos e dela quer-se extrair uma amostra casual simples de n = 20 elementos. Os elementos da população devem ser enumerados de 001 a 700 e devem-se tomar os números dessa tabela sempre com três algarismos, de forma subseqüente, os quais indicarão os elementos da amostra.
Exemplo: se, a partir do dígito sorteado no início, os numerados observados forem:
118 853 060 981 833 398 299 ...

Os elementos sorteados para amostra serão os de ordem 118,060,398,299 etc. É claro que os grupos 853,981 e 833 foram desprezados, pois não constam da população. Da mesma forma seriam desprezados os grupos que aparecessem mais de uma vez (se a amostragem for sem reposição).

Amostragem sistemática
Representa uma abreviação do processo anterior. É normalmente usada quando os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente (sistematicamente).

Exemplo: em um processo contínuo de produção, poder-se-ia, a cada 30 peças produzidas, retirar 1 peça para pertencer a uma amostra da população diária.

Amostragem por meio de conglomerados
Quando a população apresenta uma subdivisão em grupos menores (denominados conglomerados), sorteia-se um número suficiente de conglomerados, e os elementos desses conglomerados sorteados vão compor a amostra. Convém usar esse processo quando é difícil (ou praticamente impossível) selecionar os elementos de uma população, mas é fácil sortear os conglomerados; muitas vezes, ele também é usado por motivos de ordem prática e econômica.

Exemplo: estimar o número de cabeças de suínos de uma certa região administrativa. Neste caso, serão selecionados alguns municípios dessa região para compor a amostra.


Amostragem estratificada
Usado quando a população é constituída por sub-populações (ou estratos) nas quais o comportamento da variável em estudo é razoavelmente homogêneo dentro de cada estrato, mas substancialmente diverso de estrato para estrato. Neste caso, se o sorteio fosse feito ao acaso, poderia ocorrer de vários estratos não serem representados na amostra e essa tendência seria tanto maior quanto menor fosse o tamanho da amostra. O processo consiste, então, em especificar quantos elementos serão retirados de cada estrato para formar a amostra. Existem 3 sub-tipos desse processo: uniforme (ou não proporcional), proporcional e ótima.

Amostragem múltipla
Nesse caso, a amostra é retirada em diversas etapas sucessivas. Em função dos resultados obtidos em cada etapa, pode-se saber se serão necessárias outras etapas ou se elas serão dispensadas. A amostragem seqüencial é um caso particular extremo desse processo, e nela a amostra vai sendo acrescida, item por item, até chegar à conclusão no sentido de aceitar ou não uma certa hipótese; com isso, pretende-se minimizar o número médio de itens inspecionados a longo prazo.

AMOSTRAGEM NÃO PROBABILÍSTICA
É um processo de amostragem subjetivo e seu rendimento depende do conhecimento que possui o pesquisador a respeito da estrutura das populações e a amostra é uma parcela proporcional desta estrutura. Ela é empregada, muitas vezes, por simplicidade ou pela impossibilidade de se obter uma amostragem probabilística. Embora o erro de amostragem não possa ser estimado, esse tipo de amostragem pode ser usado quando os efeitos de sua utilização puderem ser considerados equivalentes aos de uma amostragem probabilística.

Exemplo: Suponha-se que o último recenseamento realizado numa região tenha mostrado que a população tem a seguinte estrutura (sob o ponto de vista profissional): 35% operários, 10% agricultores, 5% profissionais liberais, 15% empregados, 8% funcionários e 27% sem profissão. Ao pretender obter uma amostra de 2.000 pessoas, deve-se procurar formá-la com 700 operários, 200 agricultores, 100 profissionais liberais, 300 empregados, 160 funcionários e 540 sem profissão, sendo cada um deles selecionado livremente.

Plano de amostragem
O plano de amostragem é constituído das seguintes fases:

1º Definição dos objetivos
A) definição do fato;
B) definição dos setores geográficos ou específicos (onde);
C) qual o grau de precisão exigida;
D) tempo disponível;
E) custo previsto.

2º Definição dos meios
A) Qual tipo de amostragem é aleatório ou não?
B) Qual a amplitude ou tamanho?
C) Qual o método para levantamento dos dados: fone, correio, mala direta...
D) Como os interessados serão questionados?

3º Preparação do plano (sondagem propriamente dita)
A) Elaboração do questionário (completo – concreto – secreto – discreto):
● definir as informações procuradas;
● elaborar o questionário transformando as informações procuradas em questões;
● distribuição das perguntas no questionário.
B) Características das questões:
● despertar o interesse do público;
● ser explícito;
● ser facilmente compreensível (usar fácil linguagem);
● suscitar respostas não tendenciosas.
C) Experimentação do questionário:
● verificar se as respostas estão sendo respondidas com precisão (pré-teste).
D) Execução, coleta, crítica, apuração e apresentação dos dados.

4º Análise dos resultados
A) determinar uma característica (número ou proporção dos tomadores de refrigerante, por exemplo);
B) verificação de uma hipótese (receptividade de um evento publicitário, por exemplo);
C) estimar e verificar os parâmetros.

5º Relatório final
A) claro, indicando todos os detalhes (forma, lugar, tamanho, técnicas usadas, dificuldades e limitações);
B) honesto, isto é, sem idéias pré-concebidas, aceitando o resultado, seja ele positivo ou negativo.










EXERCÍCIOS

Atividades
1) É considerado um subconjunto da população:
a) Amostra.
b) População finita.
c) População infinita.
d) Estatística descritiva.
e) n.d.a

2) Analise as afirmativas a seguir:
I. Estatística é um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos.
II. População finita é um grande número de indivíduos, o que torna difícil quantificar e realizar os trabalhos de coleta de dados.
III. População finita é um determinado número de indivíduos, como o número de animais em um estábulo.
Pode-se dizer que são corretas as afirmações:
a) Somente I.
b) Somente I e II.
c) Somente I e III.
d) Somente I, II e III.

3) Qual dessas fases do método estatístico corresponde à pesquisa com indivíduos?
a) Crítica de dados.
b) Coleta de dados.
c) Análise dos resultados.
d) Exposição ou apresentação dos dados.


Atividades
1) O resultado de é:
a) b) c) d)

2) Quanto é :
a) b) c) d)

3) Em uma classe de 50 alunos, 15 faltaram. Qual a porcentagem de alunos presentes na classe?
a) 30% b) 70% c) 25% d) 35%

4) Por quanto devo vender um objeto que me custou R$ 150,00 para obter um lucro de 20%?
a) R$ 170,00 b) R$ 180,00 c) R$ 185,00 d) R$ 190,00

Atividades
1) Arredondar de acordo com o que se pede.

Para o inteiro mais próximo de:
a) 53,02 − 23,5 − 99,900 − 26,5
b) 98,49 − 108,5 − 1,008 − 49,98
c) 71,50002 − 739,5 − 40,900 − 128,53

Para o centésimo mais próximo de:
d) 20,742 − 46,727 − 28,255
e) 205,2384 − 12,352 − 253,650
f) 5,385 − 45,097 − 39,490

Para o décimo mais próximo de:
g) 0,061 − 23,40 − 120,4500
h) 0,223 − 234,7832 − 26,55
i) 7,7 − 129,98 − 12,235

2) Uma transportadora entregou em um mês:
6,19655 toneladas de produtos eletrônicos;
15,8561 toneladas de brinquedos;
13,6455 toneladas de alimentos;
09,7450 toneladas de papel;
10,3400 toneladas de remédio;
12,2350 toneladas de tecidos.

Calcule quanto a transportadora entregou nesse mês, em toneladas:
a) sem arredondar.
b) arredondando para o centésimo mais próximo.
c) arredondando para o inteiro mais próximo.

Atividades
Classifique as variáveis em qualitativas, quantitativas discretas ou quantitativas contínuas:
a) alunos de uma escola
b) raça de cachorros
c) altura de determinada pessoa
d) peso de um bebê
e) número de filhos
f) cor de pele
g) os pontos obtidos na jogada de um dado
h) valor do salário
i) sexo
j) idade

Exercícios de auto-avaliação – Unidade I

1) Assinale a alternativa incorreta:
a) População se refere a uma amostra da mesma.
b) Amostra é um subconjunto da população.
c) População finita se refere a um determinado número de elementos.
d) Estatística são métodos quantitativos que medem os fenômenos coletivos.
Resposta: A

2) Arredonde 4,25 + 12,035 + 1,9 para o mais próximo décimo e assinale a alternativa correta:
a) 18,1
b) 18,2
c) 18,18
d) 18,185
Resposta: B

3) Efetuando a subtração: 0,33 – 0,22 e arredondando para o mais próximo décimo, ficaria:
a) 0,1
b) 1,0
c) 0,11
d) 0,2
Resposta: A

4) Sexo pode ser considerado uma variável:
a) Qualitativa nominal.
b) Qualitativa ordinal.
c) Quantitativa discreta.
d) Quantitativa contínua.
Resposta: A

5) Refere-se a uma característica a ser estudada. Estamos falando de:
a) População.
b) Amostra.
c) Variável.
d) Pessoas no geral.
Resposta: C

Exercícios de auto-avaliação – Unidade II

1) Monte uma série cronológica para representar a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos anos de 1976 a 1981 em milhares de alunos: 1976 – 19.720; 1977 – 20.567; 1978 – 21.473; 1979 – 21.887; 1980 – 22.598; 1981 – 22.473.
Ano Matriculados
1976 19.720
1977 20.567
1978 21.473
1979 21.887
1980 22.598
1981 22.473
a) b)
Ano Matriculados
1981 19.720
1980 20.567
1979 21.473
1978 21.887
1977 22.598
1976 22.473

Ano Matriculados
1976 22.598
1977 22.473
1978 21.887
1979 21.473
1980 20.567
1981 19.720
c) d)
Ano Matriculados
1976 19.720
1977 20.567
1978 21.473
1979 21.887
1980 22.473
1981 22.598


2) Idealize uma série geográfica para representar o seguinte fato: ESTABELECIMENTOS DE ENSINO NA REGIÃO NORTE DO BRASIL EM 1992. A região Norte subdivide-se em Rondônia, Acre, Amazonas, Roraima, Pará e Amapá. Possuem um total de 29, 13, 78, 4, 110 e 9 estabelecimentos de ensino, respectivamente.
a) b)

Cidades Estabelecimentos
Acre 13
Amapá 78
Amazonas 9
Pará 110
Rondônia 29
Roraima 4
Cidades Estabelecimentos
Acre 13
Amapá 9
Amazonas 4
Pará 110
Rondônia 29
Roraima 78



c) d)

Cidades Estabelecimentos
Acre 78
Amapá 13
Amazonas 9
Pará 110
Rondônia 29
Roraima 4
Cidades Estabelecimentos
Acre 13
Amapá 9
Amazonas 78
Pará 110
Rondônia 29
Roraima 4

3) Considere a série estatística e complete-a, determinando as percentagens com uma casa decimal.
Séries Alunos Matriculados %
1ª 546
2ª 328
3ª 280
4ª 120
Total 1.274

a) 54,6%; 32,8%; 28,0%; 12,0%;
b) 42,857%; 25,745%; 21,978%; 9,41%;
c) 42,9%; 25,7%; 22,0%; 9,4%;
d) 43%; 26%; 22%; 9%.

4) Segundo a série a seguir, calcule a porcentagem de alunos matriculados conforme o nível de ensino:
Categorias Número de alunos %
Ensino Fundamental 19.286
Ensino Médio 1.681
Ensino Superior 234
Total 21.201

a) 91%; 8%; 1%;
b) 90%; 8%; 2%;
d) 91%; 7%; 2%;
c) 90%; 7%; 3%.

5) A tabela a seguir relaciona o tipo de transporte utilizado por 240 pessoas de uma metrópole nacional. Encontre o gráfico de setores correspondente.
Transporte Quantidade
Metrô 90
Ônibus 80
Trem 30
Particular 40
Total 240

















Exercícios de auto-avaliação – Unidade III

1) A média e a mediana da seguinte série 10, 28, 31, 27, 27 é respectivamente:
a) 24,6 e 31
b) 27 e 31
c) 24,6 e 27
d) 27 e 24,6
Resposta: A

2) A média e a moda da série 10, 11, 15, 17, 18, 21, 27, 30 é respectivamente:
a) 18,6 e amodal
b) 22,8 e amodal
c) não existe média nem moda
d) 18,6 e 17
Resposta: A

3) A média, mediana e moda da tabela abaixo são respectivamente:
Alimentação (R$) Nº de funcionários
145 ı− 151 10
151 ı− 157 9
157 ı− 163 8
163 ı− 169 6
169 ı− 175 3
175 ı− 181 3
181 ı− 187 1
 = 40

a) = 159 Md = 157,8 Mo = 148
b) = 159,4 Md = 159 Mo = 137
c) = 159,4 Md = 157,8 Mo = 148
d) = 159,1 Md = 158 Mo = 
Resposta: C

4) A moda da série 10, 9, 8, 10, 5, 9 e 7 é:
a) 10
b) 9
c) 9 e 10
d) 7
Resposta: C

5) É denominada amodal a série que:
a) Não tem nenhum valor que é mais freqüente;
b) Quando tem duas modas.
c) Quando tem três modas.
d) Quando a média é maior que a moda.
Resposta: A

Exercícios de auto-avaliação – Unidade IV

1) Em um exame final de álgebra, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão de 0,8. Em estatística, entretanto, o grau médio final foi de 7,3 e o desvio padrão 0,76. Em qual disciplina foi maior a dispersão?
a) Álgebra.
b) Estatística.
c) Não houve dispersão em nenhuma das disciplinas.
d) As duas disciplinas tiveram a mesma dispersão.
Resposta: B

2) Um grupo A de 85 adolescentes tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo B de 125 adolescentes tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação dos Grupos A e B respectivamente? Qual o grupo mais homogêneo?
a) 3,72% e 3,71% - Grupo A
b) 3,72% e 3,71% - Grupo B
c) 3,27% e 3,71% - Grupo A
d) 3,72% e 3,17% - Grupo B
Resposta: B

3) Dada a amostra 2, 3, 4, 5, 7, 10, 12, assinale a alternativa que apresenta a amplitude total:
a) 10
b) 08
c) 07
d) 06
Resposta: A

4) O coeficiente de variação é uma medida que expressa a razão entre:
a) Desvio padrão e média.
b) Desvio padrão e amplitude.
c) Amplitude e mediana.
d) Desvio padrão e moda.
Resposta: A

5) Dada as seguintes amostras, encontre a amplitude de cada conjunto.
I) 20; 14; 15; 19; 21; 22; 20
II) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
a) 0 e 3,7
b) 2 e 8,3
c) 8 e 9,2
d) 6 e 9,2
Resposta: C



Exercícios de auto-avaliação – Unidade V

1) Se o coeficiente de assimetria for AS = 0,263, quer dizer que a distribuição é:
a) Simétrica.
b) Assimétrica positiva.
c) Assimétrica negativa.
d) Simétrica positiva.
Resposta: B

2) Seja o coeficiente de curtose C = 0,623, que tipo de curva ela apresenta:
a) Platicúrtica.
b) Mesocúrtica.
c) Leptocúrtica.
d) Leptocúrtica Positiva.
Resposta: A

3) Observe as medidas da distribuição de freqüência apresentada e encontre o tipo de assimetria: média = 45 e moda = 50
a) Assimetria positiva.
b) Simétrica.
c) Assimétrica negativa.
d) Simétrica positiva.
Resposta: C

4) Como podemos definir curtose?
a) O limite de achatamento de uma distribuição em relação a uma distribuição variável.
b) O grau de achatamento de uma distribuição em relação a uma distribuição padrão.
c) O perímetro de achatamento de uma distribuição em relação a uma distribuição padrão.
d) O grau de achatamento de uma distribuição em relação a uma distribuição variável.
Resposta: B

5) Uma distribuição apresenta uma média aritmética e um desvio padrão, respectivamente, 18,3 e 1,47. Encontre o coeficiente de variação.
a) 8,03%
b) 3,10%
c) 2,83%
d) 2,32%
Resposta: A















Exercícios de auto-avaliação – Unidade VI

1) Numa urna há 10 bolas numeradas de 1 a 10. Retirando-se uma bola da urna, qual a probabilidade dessa bola não ser a de número 7?
a)
b)
c)
d)
Resposta: D

2) Qual a probabilidade de ocorrer o número 3 no lançamento de um dado?
a)
b)
c)
d)
Resposta: B

3) Retirando-se uma carta ao acaso, de um baralho de 52 cartas, observa-se que é um ás. Qual a probabilidade de que seja de espadas?
a)
b)
c)
d)
Resposta: B

4) No lançamento de dois dados honestos, qual a probabilidade de se obter um par de pontos iguais?
a)
b)
c)
d)
Resposta: D

5) Assinale a sentença que apresenta fases do plano de amostragem:
a) Definição de objetivos; definição dos meios; resolução dos problemas.
b) Definição dos objetivos; definição dos meios; relatório final.
c) Seleção de entrevistadores; dinâmica de grupo; entrevista final.
d) Relatório final; entrevista; escolha do pessoal.
Resposta: B










Exercício Extra


Considerando as notas de um teste de inteligência aplicado a 100 alunos



64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73


Forme uma distribuição de freqüência usando intervalo de 6 tendo como limite inferior 62

Classes Fi Fac FR % Ponto Médio Frac%

















1) (FAAP) Numa cidade, 12% da população são estrangeiros. Sabendo-se que 11.968.000 são brasileiros, qual é a população total?
a) 1.360.000
b) 13.600.000
c) 136.000.000
d) 10.531.840
Resposta: B
Auto 3

6) De acordo com a tabela abaixo encontre o histograma:
Peso (Kg) Nº de alunos
40 ı− 45 03
45 ı− 50 08
50 ı− 55 12
55 ı− 60 08
60 ı− 65 06
65 ı− 70 03


Resposta: A




Auto 6

5) Lançamos dois dados. Qual a probabilidade de obtermos 1 no primeiro dado e 5 no segundo dado?
a) b) c) d)

5) No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5?
a)
b)
c)
d)
Resposta: A

6) Qual a probabilidade de sair uma carta de copas ou de ouro quando retiramos uma carta de um baralho de 52 cartas?
a)
b)
c)
d)
Resposta: B

7) “Usada quando a população é constituída de sub-populações (ou estratos)”, estamos falando de:
a) Amostragem estratificada.
b) Amostragem radial.
c) Amostragem gradativa.
d) Amostragem por meio de conglomerados.
Resposta: A












Avaliação à distância I

1) Observe as frações e suas respectivas representações decimais.
I) II) III) IV)
Utilizando as igualdades acima, escolha a alternativa correta:
a) I e II
b) I e IV
c) I, II e III
d) I, II, III e IV
Resposta: C

2) O número decimal 0,09 pode ser escrito por extenso como:
a) Nove décimos.
b) Nove centésimos.
c) Nove milésimos.
d) Nove avos.
Resposta: C

3) Um colégio registrou em março, na 1ª série, matrículas de 40 alunos e a matrícula efetiva, em dezembro, de 35 alunos. A taxa de evasão foi de:
a) 0,125%
b) 12,5%
c) 1,25%
d) 125%
Resposta: B

4) Encontre o valor das expressões, respectivamente:
I) II) III)
a) ; ;
b) ; ;
c) ; ;
d) ; ;
Resposta: D

5) Como podemos definir de estatística?
a) É uma ciência exata que estuda vários dados aleatórios, que apresentam resultados previsíveis, mesmo que em condições complexas.
b) É um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos.
c) É um método matemático que serve para conduzir os processos incontáveis.
d) É um conjunto de gráficos e processos qualitativos que servem para estudar e medir os fenômenos individuais.
Resposta: B

6) Ao contratar um serviço, uma empresa necessitou antecipar 24% do pagamento, equivalente a R$ 300,00. Encontre o valor total do serviço contratado.
a) R$ 1.250,00
b) R$ 1.520,00
c) R$ 1.245.00
d) R$ 1.232,00
Resposta: A

7) Que série estatística estuda as variáveis de localidade (países, regiões, estados, municípios)?
a) Série cronológica.
b) Série histórica.
c) Série geográfica.
d) Série categórica.
Resposta: C

8) ‘Um gráfico pode fazer a representação de uma série estatística por meio de retângulos dispostos verticalmente’. Esta afirmação está de acordo com a seguinte alternativa:
a) Gráfico de linhas.
b) Gráfico de barras.
c) Gráfico de setores.
d) Gráfico de colunas.
Resposta: D

9) Qual o gráfico que melhor auxilia uma distribuição de dois fenômenos, com finalidade de comparação?
a) Gráfico de barras ou colunas múltiplas.
b) Gráfico de setores ou pictograma.
c) Histograma ou cartograma.
d) Gráfico polar.
Resposta: A

10) Os gráficos A e B são respectivamente:

a) Histograma e gráfico em colunas.
b) Gráfico em colunas e histograma.
c) Gráficos em colunas e polígono de freqüência.
d) Histograma e polígono de freqüência.
Resposta: A

Avaliação à distância II

1) Em um concurso de talentos infantis, um grupo de crianças, apresenta as idades: 6; 10; 7; 9; 8; 7; 9; 6; 10. Encontre a média aritmética da idade dessas crianças.
a) 9 b) 8 c) 7 d) 6
Resposta: B

2) Em uma multinacional com 800 funcionários, 600 recebem um salário equivalente a R$ 600,00 e restante o equivalente a R$ 400,00. Determine o salário médio desses funcionários.
a) R$ 500,00 b) R$ 450,00 c) R$ 550,00 d) R$ 650,00
Resposta: C

3) As notas obtidas de um grupo de 40 universitários em uma das provas do vestibular foram dispostas na seguinte distribuição:
Notas Nº de alunos
1 4
2 4
3 8
4 1
5 2
6 7
7 7
8 5
9 1
10 1

Nesse caso, a nota mediana foi de:
a) 3 b) 8 c) 7 d) 6
Resposta: D

4) Quatro grupos de estudantes apresentam 18, 20, 10 e 15 indivíduos, e pesos médios de 70, 74, 77 e 81 Kg, respectivamente. Determine o peso médio de todos os estudantes:
a) 74 kg b) 75,5 kg c) 75 Kg d) 77,5 Kg
Resposta: C
5) De acordo com as afirmações a seguir, assinale a alternativa que apresenta verdade:
I) É denominada bimodal a série que apresenta duas modas.
II) A moda é o valor que apresenta maior freqüência numa série.
III) Amodal são valores que apresentam freqüência superior a três modas.
a) I e II
b) I e III
c) II e III
d) I, II e III
Resposta: A

6) O desvio padrão do conjunto de dados A = {2; 4; 6; 8; 10} é aproximadamente:
a) 4 b) 4,82 c) 2,82 d) 8
Resposta: C

7) Numa pesquisa realizada, a média de questões respondidas foi de 57,5 com desvio padrão de 5,98. O coeficiente de variação foi de:
a) 6,75% b) 7,62% c) 10,4% d) 11,4%
Resposta: C






AVALIAÇÃO PRESENCIAL

Com base na tabela de distribuição, responda às questões 1 e 2:
Classes 42 ı− 44 44 ı− 46 46 ı− 48 48 ı− 50 50 ı− 52
fi 22 24 56 59 25

1) Nessa distribuição os pontos médios encontrados são:
a) 64; 67; 70; 73; 51
b) 44; 46; 48; 50; 52
c) 86; 90; 94; 98; 102
d) 43; 45; 47; 49; 51
Resposta: A

2) Nessa distribuição a amplitude dos intervalos de classes é:
a) 52
b) 10
c) 6
d) 2
Resposta: D

3) Com base nos conjuntos de valores abaixo, em relação à moda, podemos dizer que:
A = {3; 5; 6; 8; 9; 10; 10; 10; 11; 12; 17}
B = {4; 4; 5; 5; 6; 6; 7; 7}
C = {2; 3; 4; 5; 5; 5; 5; 6; 7; 8; 8; 8; 8; 9; 10; 11}

I – No conjunto A, a moda é 10.
II – No conjunto B, as modas são 4; 5; 6 e 7.
III – No conjunto C, as modas são 5 e 8, portanto, bimodal.

a) Apenas as afirmações I e II estão corretas.
b) Apenas as afirmações II e III estão corretas.

c) Apenas as afirmações I e III estão corretas.
d) Apenas a afirmação I está correta.
Resposta: C

4) De acordo com a tabela de freqüência a seguir, encontre o histograma:
Peso (Kg) Nº de alunos
40 ı− 45 03
45 ı− 50 08
50 ı− 55 12
55 ı− 60 08
60 ı− 65 06
65 ı− 70 03


Resposta: A



5) De acordo com a distribuição, encontre o desvio padrão?
Classes fi
45 ı− 47 80
47 ı− 49 260
49 ı− 51 200
51 ı− 52 160
53 ı− 54 20
Total 720
a) 4,3
b) 2,1
c) 1,8
d) 2,07
Resposta: D

6) Utilizando os dados do exercício anterior (exerc. 5), encontre a média da distribuição.
a) 46
b) 48
c) 49
d) 52
Resposta: C

7) No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5?
a)
b)
c)
d)
Resposta: A



AVALIAÇÃO SUBSTITUTIVA

1) Numa empresa multinacional, 12% dos funcionários são mulheres. Sabendo-se que 11.968 são homens, qual é a quantidade total de funcionários desta empresa?
a) 1.360
b) 13.600
c) 136.000
d) 11.196
Resposta: B

2) Determinada indústria fez uma pesquisa sobre os produtos mais aceitos nas cidades em que faz distribuição:
Produto Cidades
A 62
B 90
C 88
D 92
E 110
F 86


Encontre a média aritmética das cidades.
a) 76
b) 84
c) 88
d) 92
Resposta: C

3) Utilizando os dados do exercício anterior (exercício 2), encontre o desvio médio.
a) 9,3
b) 14,3
c) 17,3
d) 18,3
Resposta: A

4) Utilizando os dados do exercício 2, encontre a variância e o desvio padrão, respectivamente.
a) 88,6 e 9,41
b) 127,5 e 11,29
c) 197,3 e 14
d) 218,3 e 14,7
Resposta: C

5) Lucas, Pedro e João têm a mesma idade. A soma dessas idades com as de Paulo (13), André (18) e Felipe (20) é 96 anos. Qual é a moda e qual é a média aritmética dessas seis idades, respectivamente?
a) 16 e 15
b) 14 e 15
c) 15 e 14
d) 15 e 16
Resposta: D

6) Qual a probabilidade de sair um Às ou uma carta de ouro quando retiramos uma carta de um baralho de 52 cartas?
a)
b)
c)
d)
Resposta: C

7) Determinada distribuição de freqüência apresenta as seguintes medidas: ; e . Encontre o coeficiente de assimetria.
a) 131,2
b) 0,283
c) 0,213
d) 0,481
Resposta: B
























Avalie este artigo:
(0)

Curta o Administradores.com no Facebook
Acompanhe o Administradores no Twitter
Receba Grátis a Newsletter do Administradores

As opiniões veiculadas nos artigos de colunistas e membros não refletem necessariamente a opinião do Administradores.com.br.