
Un t-test est un test d'hypothèses statistiques dans lesquelles la statistique de test suit la distribution t de Student, si l'hypothèse nulle est pris en charge. Il est le plus couramment appliqué lorsque la statistique de test serait suivi d'une distribution normale si la valeur d'un terme d'échelle dans la statistique de test ont été connus.Lorsque le terme d'échelle est inconnue et est remplacé par une estimation fondée sur les données, la statistique de test (sous certaines conditions) suit la distribution t de Student.
La statistique t a été introduit en 1908 par William Sealy Gosset, un chimiste travaillant pour la brasserie Guinness à Dublin, en Irlande («étudiant» était son nom de plume). Gosset avait été embauché en raison de la politique de Claude Guinness de recruter les meilleurs diplômés d'Oxford et de Cambridge pour appliquer la biochimie et de statistiques pour Guinness industrielle processes.Gosset conçu le test-t comme un moyen de contrôler la qualité à moindre coût de stout. Il a publié le test dans Biometrika en 1908, mais a été forcé d'utiliser un nom de plume par son employeur, qui considéraient le fait qu'ils ont été en utilisant des statistiques comme un secret commercial. En fait, l'identité Gosset était connu pour ses collègues statisticiens.
Utilise
Parmi les plus fréquemment utilisés tests-t sont:
Un test de localisation d'un échantillon de savoir si la moyenne d'une population distribuée normalement a une valeur spécifiée dans une hypothèse nulle.
Un test à deux échantillons emplacement de l'hypothèse nulle que les moyennes de deux populations normalement distribuées sont égaux. Tous ces tests sont généralement appelés t de Student-tests, bien que strictement parlant que le nom devrait être utilisée que si les variances des deux populations sont également supposés être égaux; le formulaire du test utilisé lors de cette hypothèse est tombé est parfois appelée t de Welch -test. Ces tests sont souvent désignés comme «non appariés" ou "échantillons indépendants" tests-t, car ils sont généralement appliqués lorsque les unités statistiques qui sous-tendent les deux échantillons comparés sont sans chevauchement.
Un test de l'hypothèse nulle que la différence entre deux réponses mesurées sur la même unité statistique a une valeur moyenne de zéro. Par exemple, supposons que nous mesurons la taille de la tumeur d'un patient atteint de cancer, avant et après un traitement. Si le traitement est efficace, nous attendons la taille de la tumeur pour la plupart des patients à être plus petits après le traitement. Ceci est souvent appelé le «jumelé» ou «mesures répétées» T-test: voir le test de différence couplé.
Un test pour savoir si la pente d'une droite de régression diffère significativement de 0.
Hypothèses
La plupart des t-statistiques de test sont de la forme T = Z / s, où Z et s sont des fonctions des données. Typiquement, Z est conçue pour être sensible à l'hypothèse alternative (c'est à dire son ampleur tend à être plus grandes lorsque l'hypothèse alternative est vraie), alors que s est un paramètre d'échelle qui permet la distribution de T à déterminer.
Par exemple, dans le seul échantillon test-t, où est la moyenne de l'échantillon des données, n est la taille de l'échantillon, et σ est l'écart type de la population des données; s dans le seul échantillon test t est, où est l'écart type d'échantillon.
Les hypothèses sous-jacentes un test t sont que
Z suit une distribution normale standard sous l'hypothèse nulle
PS2 suit une distribution de χ2 avec p degrés de liberté sous l'hypothèse nulle, où p est une constante positive
Z et s sont indépendants.
Dans un type spécifique de test-t, ces conditions sont les conséquences de la population étudiée, et de la manière dont les données sont échantillonnées. Par exemple, dans le test t comparant les moyennes de deux échantillons indépendants, les hypothèses suivantes doivent être remplies:
Chacune des deux populations comparées doivent suivre une distribution normale.Cela peut être testé en utilisant un test de normalité, comme le Shapiro-Wilk ou de Kolmogorov-Smirnov, ou il peut être évaluée graphiquement en utilisant une parcelle normale quantile. Cependant, la normalité des tests avant de décider d'utiliser un test statistique n'est pas maintenant généralement recommandée.
Si vous utilisez la définition originale de l'étudiant du test t, les deux populations comparées doivent avoir la même variance (testables en utilisant le test de Levene, test de Bartlett ou le test de Brown-Forsythe; ou évaluables graphiquement en utilisant une parcelle normale quantile). Si la taille des échantillons dans les deux groupes comparés sont à peu près égales, l'étudiant originale t-test est très robuste à la présence de variances inégales. Welch t-test est insensible à l'égalité des variances indépendamment du fait que la taille des échantillons sont similaires.
Les données utilisées pour effectuer le test doit être échantillonné de façon indépendante par les deux populations comparées. Ce n'est en général pas testable à partir des données, mais si les données sont connues pour être dépendante échantillonnés (c'est à dire si elles ont été échantillonnés en grappes), puis les classiques tests t discutés ici peuvent donner des résultats trompeurs.
Impair et appariés à deux échantillons de tests t
Test de différence jumelés
Deux échantillons de tests t pour une différence de moyenne peut être soit impair ou par paires. Tests t jumelés sont une forme de blocage, et ont plus de pouvoir que les tests non appariés lorsque les unités appariées sont similaires à l'égard de «facteurs de bruit" qui sont indépendantes de l'appartenance dans les deux groupes comparés.Dans un contexte différent, des tests t appariés peuvent être utilisés pour réduire les effets des facteurs de confusion dans une étude observationnelle.
Les "échantillons indépendants" impair, ou un t-test est utilisé lorsque deux ensembles distincts d'échantillons indépendants et identiquement distribués sont obtenues, un de chacune des deux populations comparées. Par exemple, supposons que nous évaluons l'effet d'un traitement médical, et nous inscrire 100 sujets dans notre étude, alors aléatoirement 50 sujets du groupe traitement et 50 sujets du groupe contrôle. Dans ce cas, nous avons deux échantillons indépendants et serait d'utiliser le formulaire de l'impair t-test. La randomisation n'est pas essentiel ici, si nous avons contacté 100 personnes par téléphone et obtenu l'âge de chaque personne et le sexe, et a ensuite utilisé un t à deux échantillons-test pour voir si l'âge moyen diffère selon le sexe, ce serait aussi une des échantillons indépendants t -test, même si les données sont observationnelles.
Échantillons dépendants (ou «jumelé») t-tests sont généralement constitués d'un échantillon de paires appariées d'unités semblables, ou d'un groupe d'unités qui a été testé à deux reprises (une «mesures répétées» t-test). Un exemple typique des mesures répétées de t-test serait où les sujets sont testés avant un traitement, par exemple pour la haute pression sanguine, et les mêmes sujets sont testés à nouveau après le traitement avec un médicament abaissant la pression artérielle.
Une personne à charge t-test basé sur un «échantillon appariées" des résultats d'un échantillon non appariés qui est ensuite utilisée pour former un échantillon apparié, en utilisant des variables supplémentaires qui ont été mesurés avec la variable d'intérêt.L'appariement est effectué en identifiant les paires de valeurs composée d'une observation à partir de chacun des deux échantillons, où le couple est similaire en termes d'autres variables mesurées. Cette approche est souvent utilisée dans les études observationnelles pour réduire ou éliminer les effets des facteurs confondants.
Des alternatives à la t-test pour les problèmes de localisation
Le test-t fournit un test exact de l'égalité des moyennes de deux populations normales avec des inconnus, mais égales, les écarts. (Le Welch t-test est un test quasi-exacte pour le cas où les données sont normales, mais les écarts peuvent varier.) Pour les échantillons moyennement grandes et un test de Virginie, le t est relativement robuste à modérer les violations de l'hypothèse de normalité.
Pour l'exactitude, le t-test et test Z requièrent la normalité de l'échantillon moyen, et le t-test exige en outre que la variance de l'échantillon suit une échelle de distribution χ2, et que la moyenne de l'échantillon et la variance de l'échantillon soit statistiquement indépendantes. La normalité des valeurs de données individuelles n'est pas nécessaire si ces conditions sont remplies. Par le théorème central limite, l'échantillon au moyen d'échantillons moyennement gros sont souvent bien approchée par une distribution normale, même si les données ne sont pas normalement distribuées. Pour les non-normale des données, la distribution de la variance de l'échantillon peut s'écarter sensiblement de la distribution χ2. Cependant, si la taille de l'échantillon est grand, le théorème de Slutsky implique que la distribution de la variance de l'échantillon a peu d'effet sur la distribution de la statistique de test. Si les données sont sensiblement non normal et la taille de l'échantillon est petit, le t-test peut donner des résultats trompeurs.Voir le test Localisation des distributions gaussiennes mélange d'échelle pour une théorie liée à une famille particulière de distributions non normales.
Lorsque l'hypothèse de normalité ne tient pas, une alternative non paramétrique au test t peut souvent avoir une meilleure puissance statistique. Par exemple, pour deux échantillons indépendants lorsque les distributions de données sont asymétriques (qui est, les distributions sont asymétriques) ou les distributions ont des queues grande, alors le test de Wilcoxon (aussi connu comme le test de Mann-Whitney U) peut avoir de trois à la puissance quatre fois plus élevé que le t-test.
La contrepartie non paramétrique à l'épreuve des paires d'échantillons T est le Wilcoxon test pour échantillons appariés. Pour une discussion sur le choix entre les alternatives et non paramétriques t, voir Sawilowsky.
Un simple analyse de variance généralise l'échantillon en deux test-t lorsque les données appartiennent à plus de deux groupes.
Les tests multivariés
Une généralisation de la statistique t de Student, appelé Hotelling T-carré statistique, permet de tester des hypothèses sur les multiples (souvent corrélés) des mesures dans le même échantillon. Par exemple, un chercheur pourrait présenter un certain nombre de sujets à un test de personnalité comprenant des échelles de personnalité multiple (par exemple, les Big Five). Parce que les mesures de ce type sont généralement fortement corrélées, il n'est pas souhaitable de procéder à une variable séparée t-tests pour tester des hypothèses, car ceux-ci négligent la covariance entre les mesures et gonfler la chance de rejeter à tort au moins une hypothèse (erreur de type I). Dans ce cas, un seul test multivarié est préférable pour les tests d'hypothèses. Hotelling T 2 statistique suit une distribution de T 2. Toutefois, en pratique, la distribution est rarement utilisé, et au lieu transformé en une distribution F.
No comments:
Post a Comment