Quartis

Da WikiCiências
Share/Save/Bookmark
Ir para: navegação, pesquisa

Referência : Martins, E.G.M., (2014) Quartis, Rev. Ciência Elem., V2(4):268
Autores: Maria Eugénia Graça Martins
Editor: José Francisco Rodrigues
DOI: [http://doi.org/10.24927/rce2014.268]

PDF Download


Os quartis são medidas de localização que dividem a amostra (ou coleção) de dados de tipo quantitativo (ou qualitativo ordinal) ordenada, em quatro partes, cada uma com uma percentagem de dados aproximadamente igual. O 1º quartil ou quartil inferior, representado por Q1 (ou Q0,25) e o 3º quartil ou quartil superior, representado por Q3 (ou Q0,75) são medidas que localizam alguns pontos da distribuição dos dados de tal forma que aproximadamente 25% dos dados são inferiores ou iguais a Q1, aproximadamente 25% dos dados são superiores ou iguais a Q3 e os restantes dados, aproximadamente 50%, situam-se entre Q1 e Q3. De um modo geral, quando nos referimos aos quartis, estamos a referir-nos ao 1º e 3º quartis, uma vez que o 2º quartil é designado por mediana.

Dada uma amostra, considera-se que o 1º quartil é o valor tal que pelo menos 25% dos dados são não maiores do que ele e pelo menos 75% dos dados são não menores do que ele e o 3º quartil é o valor tal que pelo menos 75% dos dados são não maiores do que ele e pelo menos 25% dos dados são não menores do que ele.


Há vários processos para calcular os quartis, que não conduzem necessariamente aos mesmos valores, mas a valores próximos, desde que a amostra tenha uma dimensão razoável, que é a situação de interesse em Estatística, em que se procura resumir a informação contida nos dados, através de algumas medidas.


Uma metodologia que pode ser seguida para obter os quartis é a seguinte:

  • Ordenar os dados por ordem crescente e calcular a mediana;
  • O 1.º quartil, Q1, é a mediana dos dados que ficam para a esquerda da mediana;
  • O 3.º quartil, Q3, é a mediana dos dados que ficam para a direita da mediana.

Quando o número de dados é ímpar, o processo seguido, por exemplo, em MANN (1995) ou MOORE (1996), considera cada uma das partes em que fica dividida a amostra pela mediana, sem a incluir. Por exemplo,

Img Quartis v2 1.png

Esta metodologia não é seguida por outros autores, como por exemplo DE VEAUX et al. (2004) que inclui a mediana nas duas partes. Assim, o 1º e 3º quartis viriam, no caso do exemplo anterior

Img Quartis v2 2.2.png

No caso do número de dados ser par, 2n, com n \(\in \mathbb{N}\), não há ambiguidade na definição dos quartis que serão sempre as medianas de conjuntos de dados com n elementos.

Do mesmo modo que a mediana, também se podem obter os quartis a partir das tabelas de frequências com os dados agrupados.

À diferença entre o 3º quartil e o 1º quartil dá-se o nome de amplitude interquartil, que é uma medida da variabilidade ou dispersão (medidas de dispersão) entre os dados.

Os quartis são utilizados na construção do diagrama de extremos e quartis e do diagrama caixa de bigodes.

A característica populacional que corresponde à característica amostral quartil, também se denomina quartil e determina-se da mesma maneira (para uma população finita). Depende do contexto saber se nos estamos a referir à estatística - quartil amostral, ou ao parâmetro - quartil populacional.


Nota:

Sendo os quartis um caso especial dos quantis, podem-se utilizar as fórmulas aí consideradas para a sua obtenção. Um método mais elaborado para o cálculo dos quartis (Murteira, 2002), será descrito a seguir, por ser também o método utilizado na folha de Excel. Neste processo, começa por se considerar para a determinação do 1º e 3º quartis, respetivamente as “posições” \(\rm{\displaystyle\frac{n+3}{4}}\) e \(\rm{\displaystyle\frac{3n+1}{4}}\)(1). No que respeita o 1º quartil, Q1, se \(\rm{\displaystyle\frac{n+3}{4}}\) for inteiro, então Q1 será a observação de ordem \(\rm{\displaystyle\frac{n + 3}{4}=k}\), na amostra ordenada. Se \(\rm{\displaystyle\frac{n+3}{4}}\) não for inteiro, seja \(\rm{\displaystyle\frac{n+3}{4}=k+\varepsilon}\), em que representamos por \(\rm{\varepsilon}\) a parte decimal (igual a 0,25, 0,5 ou 0,75). Para obter Q1 considera-se uma interpolação linear, fazendo uma média ponderada entre a observação de ordem \(\rm{k}\) e a observação de ordem \(\rm{(k+1)}\):


\(\rm{Q_1=observação\ de\ ordem\ k \ +\ \varepsilon\ (observação\ de\ ordem\ (k+1)\ - \ observação\ de\ ordem \ k)}\)


O raciocínio utilizado para obter o 3º quartil, Q3, é idêntico ao descrito para a determinação do 1º quartil, considerando agora a posição \(\rm{\displaystyle\frac{3n+1}{4}}\) em vez de \(\rm{\displaystyle\frac{n+3}{4}}\).

Adiantamos que quando a dimensão da amostra é ímpar, este processo conduz aos mesmos resultados que o considerado por DE VEAUX et al. (2004), em que se considera os quartis como as medianas de cada uma das partes em que fica dividida a amostra, incluindo a mediana em cada uma dessas partes.

Considere-se, por exemplo, os seguintes dados correspondentes às alturas em cm, dos 20 alunos de uma turma (a amostra já se encontra ordenada):

TabelaQuartis.png

De acordo com a metodologia descrita anteriormente, o 1º quartil e o 3º quartil estão, respetivamente, nas “posições” 5,75 e 15,25 pelo que realizando as interpolações lineares, tem-se


\(\rm{Q_1=130+0,75\times(131-130)}\) e \(\rm{Q_3=140+0,25\times(142-140)}\)
\(\, \quad\quad\rm{=130,75}\) \(\, \quad\quad\rm{=140,5}\)


Na folha de Excel obtém-se:

Tabela2.png

(1) Dada uma amostra de dimensão n, ordenada, considera-se que a “posição” da mediana é definida por \(\rm{\displaystyle\frac{n+1}{2}}\). Quando n é ímpar, a mediana corresponde à observação de ordem \(\rm{\displaystyle\frac{n+1}{2}}\). Quando n é par é a semissoma (interpolação linear) das observações de ordem \(\rm{\displaystyle\frac{n}{2}}\) e \(\rm{\displaystyle\frac{n}{2}}+1\). Para definir o 1º quartil considera-se a “posição” definida por \(\rm{\displaystyle\frac{{posição\quad da\quad mediana}+1}{2}}= \rm{\displaystyle\frac{\displaystyle\frac{n+1}{2}+1}{2}}=\rm{\displaystyle\frac{n+3}{4}}\).

Para obter a “posição” do 3º quartil basta considerar \(\rm{n-\displaystyle\frac{n+3}{4}+1}=\rm{\displaystyle\frac{3n+1}{4}}\). Da mesma forma que se calcula a mediana, se \(\rm{\displaystyle\frac{n+3}{4}}\) e \(\rm{\displaystyle\frac{3n+1}{4}}\) são inteiros, os quartis são as observações que correspondem a essas ordens. Caso contrário faz-se uma interpolação linear entre as observações correspondentes às ordens adjacentes.

Repare-se que estamos aqui a generalizar o conceito de “posição” para valores não necessariamente inteiros.


Ver

Referências

1. DE VEAUX, R., VELLEMAN, P., com contribuição de Boock, D. (2004) Intro Stats. Pearson Education, Inc. I0-201-70910-4.

2. MANN, P. S. (1995) – Introductory Statistics, 2nd edition. John Wiley & Sons, Inc. ISBN: 0-471-31009-3.

3. MOORE, D. (1996) – STATISTICS Concepts and Controversies. W.H. Freeman and Company. ISBN: 0-7167-2863-X (pbk.).

4. MURTEIRA, B., RIBEIRO, C. S., SILVA, J. A., PIMENTA, C. (2002) – Introdução à Estatística. McGraw-Hill de Portugal, Lda. ISBN: 972-773-116-3.




Criada em 22 de Março de 2012
Revista em 03 de Julho de 2013
Aceite pelo editor em 03 de Julho de 2013