Ré-analyse de l’étude d’adoption de Capron & Duyme (1989)

La célèbre étude d’adoption de Capron & Duyme, (1989, Table 2; 1996, Table 3), avait autrefois démontré que le QI pouvait être stimulé en plaçant des enfants de familles extrêmement pauvres vers des familles de classes très aisées. Leurs chiffres indiquèrent des gains allant de 15 à 20 points. Néanmoins, Arthur Jensen (1997) avait analysé ces données. En utilisant une variété de techniques (analyse en composantes, méthode des vecteurs corrélés, g-scores), il a montré que ces gains de QI n’étaient pas liés à la dimension “g” des tests QI. Autrement dit, ces gains ne reflètent pas une amélioration des capacités générales. Ils sont donc “vides” en ce qui concerne g. Comme je l’avais noté autrefois :

In Adoption Data and Two g-Related Hypotheses, Jensen shows that IQ difference owing to the adoption of children from low-SES parents by high-SES families is not g-loaded while at the same time the IQ difference owing to low-SES versus high-SES biological families loaded in fact on the g factor or PC1. Plus, the SES-difference of adopted families correlated at only 0.099 with SES-difference of biological families.

Nisbett, par la suite, dans Intelligence and How to Get It (2009, pp. 240-241, footnote 33), a critiqué l’étude de Jensen. Ni même Rushton & Jensen (2010, p. 19) ou James J. Lee (2009, p. 250) n’ont commenté à ce propos. Dans tous les cas, la discussion de Nisbett vaut la peine d’être citée en entier :

Many things can be said about this. (1) The difference in factor loadings on g across WISC subtests is relatively slight, so the reanalysis does not much affect conclusions about the impact of adoption on intelligence. (2) More importantly, there is no difference at all in average g loadings between the subtests that show a big difference between high- and low-SES adoptive parents and their offspring and those that show little difference. Both loadings are .71 on average. (3) The fact that the subtests that most differentiate between biological parents and their offspring have higher g loadings than the subtests that differentiate least is almost entirely due to the fact that the Coding subtest, which has by far the lowest g loading, is one of the tests that does not differentiate much between high- and low-SES biological parents and their offspring. If Coding is left out, the g loadings for the former average .79 and for the latter average .69 – not much of a difference. (4) The WISC is a heavily verbally oriented test – that is, it measures mostly crystallized intelligence, and the g loadings differ primarily to the extent that they measure verbal ability as opposed to performance or fluid skills. (5) Jensen himself (1998) said that the purest measure of fluid g is the Raven Progressive Matrices test. If we examine fluid g as defined by subtest correlations with the Raven scores, we find that the correlation for biological parents and their offspring flips direction. It is now the test with the highest g loadings that differentiate least between high- and low-SES biological parents and their siblings. So the question as to whether the genetic effect is more reflective of differences in g than the environmental effect is entirely a matter of deciding which is the real g – fluid or crystallized. See Flynn (2000a) for a more detailed explanation of these points in the context of race differences in IQ. More important than any of these points is that the adopted children of upper-middle-class parents did far better in terms of academic achievement than did the adopted children of lower-class parents. The results of their school achievement tests were substantially better and they were far less likely to be put back a grade. And Jensen has in other contexts expressed the view that academic achievement is highly reflective of g. In any case, we care more about school achievement than about IQ.

Concernant 1), si Nisbett fait référence à la restriction de la distribution des saturations en g, Jensen a pourtant indiqué que cette restriction affaiblit artificiellement la corrélation, au lieu de l’augmenter. Concernant 2), Nisbett a raison, mais la viabilité de la méthode des vecteurs corrélés s’affaiblit lorsque le nombre de sous-tests considéré diminue. Le fait de considérer individuellement les sous-tests n’a aucun sens. 3) Nisbett ne donne pas de raison notable pour enlever ce sous-test particulier. 5) Le problème avec les matrices de Raven, comme Kaufman l’avait souligné, est le fait d’être malgré tout suspect de biais culturels envers les cohortes plus éloignées dans le temps. Les gains séculaires sur Raven ne sont certainement pas mesure invariant. La méthode de Flynn (2000) lève quelques doutes, et ne semble pas concorder avec celle de Rushton (1999) de toute évidence, comme je l’avais noté. Enfin, concernant la dernière phrase, elle est évidemment fausse. La performance académique est certes réflecteur du niveau de g, mais l’amélioration de celle-ci n’implique pas nécessairement une hausse de g, dans la mesure où ils ne sont pas parfaitement corrélés. Les tests scolaires sont plus malléables que les tests QI. Voir, The Inequality Taboo (Murray, 2005) et Implications of Cognitive Differences for Schooling Within Diverse Societies (Gottfredon, 2003).

Nous testons maintenant la 3ème proposition de Nisbett :

Adoption Data and Two g-Related Hypotheses - Table 2

Ci-dessus est la matrice montrée dans l’analyse de Jensen (1997), en composantes principales, que j’ai recopié dans ma fenêtre de données sur SPSS; pour les détails, voir Table 2 de Jensen (1997). En utilisant ces variables, j’ai conduit une analyse en composantes principales, comme Jensen l’avait fait, en produisant la table ci-dessous :

Re-analysis of Jensen's study of Capron and Duyme adoption data - PC analysis with Coding subtest

Ces chiffres sont parfaitement identiques à ceux montrés dans la table 3 de Jensen (1997). Mais puisque Nisbett considère le sous-test Coding comme étant un problème, je l’ai retiré, et reconduit une analyse en composantes principales.

Re-analysis of Jensen's study of Capron and Duyme adoption data - PC analysis without Coding subtest

Cette fois, SESdiff_Adopt possède des charges équivalentes sur PC1 et PC2, suggérant que les gains de QI dûs au fait d’être élevé dans des familles aisés peuvent être expliqués à la fois par des variances en g et des variances non-g. L’autre différence est que les différences de QI entre les noirs et les blancs ont des charges à peu près équivalentes sur les deux facteurs, PC1 et PC2. Pour précision, le test KMO & Bartlett indique une valeur de 0.55, avec un niveau de signification de 0.164 après que Coding soit retiré. Dans le cas contraire, la valeur KMO/Bartlett était de 0.747 avec un niveau de signification de 0.003. Un fort coefficent, ou valeur, signifie que les modèles de corrélations sont relativement compacts et que l’analyse en facteur permet de produire des facteurs distincts et solides. Les coefficients de congruence sont disponibles dans mon ficher Excel (ici).

Les saturations de g pour le sous-test Coding sont faibles. Si l’on retire ce sous-test, comme suggère Nisbett, alors le genre d’analyses (MCV, PCA, …) que nous exécutons n’ont plus le moindre sens. Selon Jensen (1998, p. 382), entre autres conditions, il est nécessaire que les charges en g soient largement variables, c’est-à-dire, plus ou moins normalement distribuées. Voici un scatter plot, avec et sans Coding, de la corrélation entre SESdiff_Adopt et g_French, l’item Coding étant désigné par le point noir :

Jensen's MCV - g-French vs SESdiff-Bio with Coding

Jensen's MCV - g-French vs SESdiff-Adopt with Coding

Jensen's MCV - g-French vs SESdiff-Adopt without Coding

Coding est en quelque sorte responsable de l’absence de corrélation entre SESdiff_Adopt et g_French. Mais nous voyons aussi que la présence de Coding n’est certainement pas responsable de la corrélation entre SESdiff_Bio et g_French. Dans tous les cas, ces données ne supportent pas la théorie purement culturelle des différences de QI.

Une autre étude de Duyme et al. (1999) qui n’est pas infréquemment cité, démontre des gains de QI substantiels (WISC-R=58, WAIS=7) dans un échantillon de 65 enfants abusés, allant de 7 à 19 points dépendant du niveau du statut social des parents adoptifs, avec une moyenne de 14 points. Les auteurs, évidemment, concluent que le QI est extrêmement malléable. Mais cette conclusion est comme qui dirait douteuse. La corrélation des QIs avant et après adoption n’est pas différente des autres données sur les enfants n’ayant pas bénéficié d’une amélioration de l’environnement. Pire encore, la corrélation rapportée par Duyme et al. (1999) est même supérieure, (0.67 contre 0.60), ce qui signifie qu’il y a eu moins de changements de QI chez les enfants adoptés que chez les enfants non-adoptés.

The correlation of 0.67 between IQs before and after adoption is moderate and indicates a degree of stability close to the stability found in longitudinal studies of biological children who have not undergone an environmental change (r = 0.60 between 4 and 5 or 14 and 15 years of age) (41, 42).

Ceci, bien sûr, n’est pas cohérent avec la théorie environnementale, et il n’est pas impossible que les auteurs eux-mêmes ne croient pas à ce qu’ils déclarent. Dans tous les cas, même si ces gains de QI se trouvèrent être des gains véritables (g gains), un large gain même par une magnitude de 20 points n’est pas incohérent avec le modèle héréditariste. Voici ce que Herrnstein & Murray, dans The Bell Curve, pages 764 (fn.1) et 771 (fn.86) ont affirmé :

1. A brief refresher (see Chapter 4): A heritability of 60 percent (a mid-range estimate) says that 40 percent of the observed variation in intelligence would disappear if a magic wand wiped out the differences in those aspects of the environment that bear on intelligence. Given that variance is the standard deviation squared and that the standard deviation of IQ is 15, this means that 40 percent of 15² is due to environmental variation, which is to say that the variance would drop from 225 to 135 and the standard deviation would contract to 11.6 instead of 15 if all the environmental sources of variation disappeared.

86. A twenty-point swing is easily reconciled with a heritability of .6 for IQ. Suppose the high- and low-SES homes in the French studies represent the 90th and 10th centile of environmental quality, as the text says. A twenty-point swing in IQ from the 2d to the 98th centile of environmental quality would then imply that the standard deviation of home environment effects on IQ is 4.69. Squared, this means a variance of 22 attributable to home environment. But as we noted in note 1, a heritability of .6 implies that there is a variance of 225 – 135, or 90, attributable to environmental sources. The French adoption studies, in short, are consistent with the conclusion that about a quarter of environmental variance is the variance across homes (if our guesses about the adopting and biological home environments are not way off). Three-quarters of the environmental influence on intelligence must be uncorrelated with the family SES, according to the present analysis. Note again that the balance tips toward environmental factors outside families as being the more relevant than those provided by families in affecting IQ, as mentioned in Chapter 4.

Il faut garder à l’esprit néanmoins, que ces gains de QI extraordinaires ont pu être possible sans doute parce que ces enfants abusés avaient vécu dans des conditions extrêmement rudes. Mais ces conditions de nos jours, sont extrêmement rares. Autrement dit, l’affirmation qui veut que le QI soit extrêmement malléable n’est vraie que si l’on examine une petite frange exceptionnelle de la population qui n’est pas représentative de l’ensemble même de ladite population. Ce sont des conditions qui ne s’appliquent pas à la population dans sa globalité.

Une autre lecture recommandée est celle de Charles Locurto (1990, pp. 287-289). Dans l’ensemble, néanmoins, étant donné la taille exceptionnellement faible des échantillons étudiées, il serait imprudent de sauter à des conclusions rapides.

SPSS syntax :

FACTOR
/VARIABLES g_French g_White g_Black SESdiff_Bio SESdiff_Adopt WB_diff
/MISSING LISTWISE
/ANALYSIS g_French g_White g_Black SESdiff_Bio SESdiff_Adopt WB_diff
/PRINT UNIVARIATE INITIAL CORRELATION SIG DET KMO INV REPR AIC EXTRACTION
/PLOT EIGEN
/CRITERIA FACTORS(2) ITERATE(25)
/EXTRACTION PC
/ROTATION NOROTATE
/METHOD=CORRELATION.