Medidas de tendência central e de dispersão
Publicado por 19 de Outubro de 2022 em Estudantes para Melhores Evidências
Introdução
No cenário de pesquisas científicas, é possível apresentar um conjunto de resultados individuais por meio de medidas únicas que sejam representativas deste conjunto. Neste caso, é preciso reduzir um complexo arranjo de dados a poucos números que os descrevam por meio do que conhecemos como estatística descritiva [1].
Uma vez que um valor ou número relativo só tem significado quando comparado a um outro valor, é importante identificar onde uma observação particular se encontra diante de todo o restante das observações. Isto é feito utilizando as medidas de tendência central [1], enquanto as medidas de dispersão são valores que resumem a variabilidade de um conjunto de dados [4].
Este post apresentará a definição e exemplos das seguintes medidas de tendência central: média, mediana e moda. Apresentará ainda o conceito de distribuição normal e desvio-padrão e intervalo interquartil, como medidas de dispersão.
Média
A média aritmética – ou simplesmente média é obtida ao dividirmos os valores obtidos nas observações pelo número total de observações.
Ao considerarmos a média como medida central, podemos perceber que em uma dada população os dados podem se desviar mais ou menos da média – aí temos o que chamamos desvio-padrão. Conhecer o desvio-padrão é importante porque na maioria dos fenômenos biológicos ocorre uma variação natural – como peso e altura, por exemplo – e alguns fenômenos têm valores mais dispersos que outros [1]. Assim, desvio-padrão é a estatística descritiva que nos permite atribuir um número único a dispersão ou aglutinação em torno da média. Geralmente, para muitas distribuições de dados, uma elevada proporção das observações ficará dentro de um desvio-padrão acima ou um desvio-padrão abaixo da média. Muito menos observações se encontrarão a dois desvios-padrões acima ou abaixo e menos ainda estarão a três desvios-padrões e assim por diante.
Mediana
A mediana é o ponto que divide uma distribuição ao meio, ou seja, metade dos valores estão acima e metade estão abaixo da mediana e, portanto, valores extremos que podem distorcer a média não têm impacto na mediana.
Se a mediana divide um conjunto ordenado pela metade, cada metade pode ainda ser dividida em sua metade respectiva – teremos então os quartos (ou quartis) da amostra – o primeiro quarto corresponde às 25% observações inferiores enquanto o último quartil representa as 25% observações superiores, por exemplo. E se podemos dividir em quartos, podemos dividir em cem – aí teremos os percentis. Neste caso, cada percentil representa 1% da distribuição de modo que o primeiro percentil representa a base da distribuição e o percentil 99 representa o 1% superior [1].
É preciso ter cuidado na leitura e interpretação da mediana pois ela não transmite a informação dos valores mínimo, máximo e total da amostra. A mediana também pode levar a uma falsa impressão pois, ao ler que “a mortalidade mediana em um grupo de pacientes é de oito meses” pode-se ter a impressão de que provavelmente o paciente morrerá em oito meses” – e esta conclusão é falsa. Na verdade, a afirmação correta é a de que metade dos pacientes viverá menos, mas metade deles viverá mais que oito meses – o trabalho do médico/pesquisador é descobrir em qual das partes está o paciente à sua frente [2].
Quando a medida de tendência central usada é a mediana, o intervalo interquartil é utilizado como uma medida de dispersão para resumir a variabilidade do conjunto de dados. O intervalo interquartil é a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 – Q1.
Moda
A média e a mediana são utilizadas para descrever dados quantitativos, mas não dados qualitativos. A moda é uma medida de tendência central que permite a descrição de dados qualitativos e identifica a categoria que ocorre com maior frequência. Quando há uma categoria que se repete mais do que qualquer outra, o conjunto de dados é chamado de unimodal. Quando há duas ou três categorias que se repetem um número semelhante de vezes, tais conjuntos de dados são chamados bimodais e trimodais, respectivamente. A moda pode ser bastante informativa quando o conjunto de dados é grande, mas para conjunto de dados for relativamente pequeno, a moda pode até ser obtida, mas na maioria das vezes, ela não terá qualquer sentido prático. Nestes casos, são a média e a mediana que fornecem a melhor descrição da tendência central dos dados [3].
Distribuição normal
De modo geral, dados distribuídos normalmente, são simétricos em torno de sua média e, ao serem transpostos para um gráfico este terá a forma de um sino. Esta distribuição é chamada de distribuição normal e permite saber exatamente a proporção das observações que estarão dentro de um desvio-padrão da média (68,2%), dentro de dois desvios-padrões da média (95,4%), dentro de três desvios-padrões da média (99,7%) e assim por diante – este é o alicerce sobre o qual se fundamenta grande parte da estatística [1]. No entanto, quando há valores extremos, isto é, valores que se situam mais distanciados do centro, a média pode ser distorcida ao tentar sumarizar todas as medidas do conjunto. Nestas situações, outras medidas de tendências central, como a mediana, podem ser mais apropriadas.
Autores: Eduardo Pereira da Silva, Gabriela Troyse Vieira, Marily Maria Azevedo Shimmoto, Pamella Calazans, Sandra Caires Nobre, Sergio Augusto Buzian Brasil, Stenio Prada Mesquita e Thiago Cansanção de Lucena Alves. Alunos do MBA de Gestão e Economia da Saúde, Faculdade Paulista de Ciências da Saúde, ano 2022.
Citar como: Silva EP, Vieira GT, Shimmoto MMA, Calazans P, Nobre SC, Brasil SAB. Medidas de tendência central Estudantes para Melhores Evidências. Cochrane. Disponível em: [adicionar link da página da web]. Acessado em [adicionar dia, mês e ano de acesso].
Referencias
1. Wheelan C. Estatística – o que é para que serve e como funciona 1ª edição – Rio de Janeiro: Editora Zahar, 2016.
2. Gould SJ. The median isn’t the message. AMA Journal of Ethics. 2013;15(1):77-81.
3. Vieira S. Introdução à bioestatística 4ª edição – Rio de Janeiro: Elsevier, 2008
4. Bowalekar SK. Statistics in medical research–II. Measures of central tendency. J Postgrad Med. 1993;39(3):166-73. PMID: