Qual é a melhor maneira de comparar dois conjuntos de dados e por que você precisaria fazer isso?
Selecionar um tamanho de amostra apropriado, calcular a eficácia dos seus resultados e publicar o seu trabalho pode, dependendo precisamente do que você faz, depender de comparações estatísticas de dados. As comparações devem ser justas, representar os dados com precisão e mostrar se o que você acha que elas mostram é estatisticamente significativo.
Neste artigo, detalhamos dois dos testes mais comuns usados para comparar conjuntos de dados (o Pupil’s t-teste e o teste U de Mann-Whitney), suas diferenças e algumas de suas suposições.
Comparando dois conjuntos de dados
Ao comparar dois conjuntos de dados, você deve tomar decisões que ditem como fará a comparação. A primeira decisão é baseada em quantos conjuntos de dados você deseja comparar (Figura 1).
Conforme mencionado, este artigo se concentra na comparação de dois conjuntos de dados. Ler este artigo para saber mais sobre como comparar vários conjuntos de dados.
Ao comparar dois conjuntos de dados, você tem duas opções principais. Estes são:
- Estudante t-teste
- Teste U de Mann-Whitney
Vamos aprender sobre esses testes e quando eles se aplicam.
1. Aluno t-teste
O estudante t-teste (ou t-test, para abreviar) é o teste mais comumente usado para determinar se dois conjuntos de dados são significativamente diferentes um do outro.
Curiosamente, não foi nomeado porque é um teste usado por estudantes (o que acredito há muitos anos). Na verdade, o estudante t-test foi criado por um químico, William Sealy Gossetque trabalhou para a Guinness (sim, a cervejaria).
Gosset usou o pseudônimo “Pupil” para evitar que outras cervejarias descobrissem o uso de estatísticas pelo Guinness para a fabricação de cerveja. Quem poderia imaginar que estatísticas e álcool combinam tão bem?
Para realizar um t-test, seus dados precisam ser contínuos e seguir a distribuição regular (os dados são distribuídos uniformemente em torno da média).
Além disso, a variação dos dois conjuntos de dados precisa ser a mesma. Por que não atualize seus termos estatísticos se você está um pouco enferrujado?
O t-test vem em variedades emparelhadas e não emparelhadas. Em geral, a maioria dos dados em biologia tende a não ser pareada.
Se você não tiver 100% de certeza se seus dados estão emparelhados, seja cauteloso e presuma que não (e leia o artigo sobre termos estatísticos que acabei de inserir).
Você pode usar um não emparelhado t-teste em dados pareados sem consequências negativas. No entanto, se você usar um par t-teste em dados não pareados, você pode obter um resultado significativo quando na verdade não há significância e obter o chamado erro Tipo 1.
2. Teste U de Mann-Whitney
O teste U de Mann-Whitney, também chamado de Mann-Whitney-Wilcoxon (MWW), teste de soma de postos de Wilcoxon ou Wilcoxon-Mann-Whitney, é usado para amostras não pareadas e é um teste não paramétrico (não faz suposições sobre o distribuição ou similaridade de variâncias).
Portanto, é menos poderoso que o não pareado t-test, mas você pode ter mais certeza de que as diferenças encontradas entre os dados são reais.
O Teste U de Mann-Whitney é realizada convertendo seus dados em classificações e analisando a diferença entre os totais das classificações, fornecendo uma estatística, U. Quanto menor o U, menor a probabilidade de diferenças terem ocorrido por acaso.
Determinar se algo é significativo com o teste U de Mann-Whitney envolve o uso de diferentes tabelas que fornecem um valor crítico de U para um determinado nível de significância. O valor crítico varia dependendo do nível de significância escolhido, bem como do número de participantes em cada grupo (que não precisa ser igual para este teste).
Estudante t-teste e teste U de Mann-Whitney comparados
Aqui está uma comparação simples dos dois métodos que acabamos de discutir.
Tabela 1. Comparação do Aluno t-teste e teste U de Mann-Whitney.
Requisitos e propriedades |
||
Ambos. Escolha conforme apropriado |
Os dados devem seguir a distribuição regular. A variação dos dois conjuntos de dados deve ser a mesma. |
|
Os dados podem ser contínuos ou ordinais. Assume que as amostras que estão sendo comparadas são independentes. Supõe que os tamanhos das amostras sejam semelhantes. Os resultados podem ser tendenciosos para uma amostra maior. |
Comparando dois conjuntos de dados resumidos
Aprendemos quais são os dois métodos principais, seus requisitos de dados e algumas de suas suposições.
Use-os para quantificar o quão confiantes as pessoas podem estar de que seus resultados são precisos e confiáveis e transmitem sua importância.
Como alternativa, use-os para otimizar seus experimentos, selecionando o melhor tamanho de amostra e concentrando-se em resultados significativos.
Deixe-nos saber nos comentários se você achou este artigo útil.
Publicado originalmente em fevereiro de 2014. Revisado e atualizado em março de 2023