Une étude publiée dans la prestigieuse revue Nature, met en lumière un biais de représentation numérique à la fois discriminant et largement méconnu.
L’analyse révèle que, sur internet, y compris dans les systèmes d’intelligence artificielle, les femmes sont invariablement perçues et représentées comme étant plus jeunes que les hommes, contredisant pourtant les données démographiques de la vie réelle.
Cette distorsion massive a été documentée à travers l’analyse de près de 1,4 million d’images et de vidéos provenant de plateformes majeures (Google, Wikipedia, YouTube, Flickr), ainsi que l’examen de neuf grands modèles de langage. L’équipe de Yiaho s’est intéressée à ce sujet et nous vous transmettons les données les plus importantes de l’étude :
Un écart d’âge artificiel dans les images et vidéos
Les chercheurs ont analysé plus de 1,3 million d’images liées à 3 495 catégories sociales (métiers, rôles). Quel que soit la plateforme ou la méthode d’évaluation (jugement humain, algorithmes ou données biographiques vérifiées), le constat est le même : les femmes apparaissent toujours plus jeunes.
Sur Google Images, l’écart atteint en moyenne 0,37 catégorie d’âge pour les recherches neutres. L’écart monte à 0,71 catégorie d’âge sur Wikipedia.
NDLR : Clarification : L’unité « catégorie d’âge » est une mesure relative basée sur des tranches d’âge classifiées par des codeurs. Un écart de 0,37 signifie que l’âge moyen attribué aux hommes est significativement plus élevé.
L’étude montre que cet écart est particulièrement marqué pour les métiers à haut statut et hauts revenus. Les professions jugées plus prestigieuses ou associées à des salaires médians plus élevés ont une probabilité significativement plus grande de voir les hommes y être représentés comme plus âgés que les femmes.
Lire également : Est-ce que ChatGPT peut mentir ?
Un contre-sens démographique
Le recensement américain indique qu’il n’existe aucune différence systématique d’âge entre hommes et femmes au sein de la population active. Depuis une décennie, la proportion de femmes dans un métier n’est pas corrélée à l’âge médian de ce métier.
Pourtant, les images en ligne inversent parfois cette réalité : dans les secteurs de la vente ou des ressources humaines, Google Images montre les hommes plus âgés que les femmes, alors que les données officielles américaines indiquent l’inverse.
Les modèles de langage reproduisent la distorsion
L’analyse de neuf grands modèles de langage (dont GPT) confirme cette association : plus une catégorie sociale est masculine, plus elle est liée à un âge avancé. Ce biais se retrouve dans des milliards de mots, quelles que soient les sources de données textuelles (Reddit, Google News, Wikipedia, Twitter).
Le cas spécifique de ChatGPT
Lors de la simulation de processus de recrutement : En générant près de 40 000 CV, ChatGPT attribuait automatiquement aux candidates féminines un âge inférieur de 1,6 an et 0,92 an d’expérience en moins par rapport aux candidats masculins.
Pire, lors de l’évaluation des CV, ChatGPT attribuait les meilleures notes aux hommes les plus âgés. Les femmes restaient largement désavantagées face aux hommes seniors.
L’algorithme amplifie le biais et impacte l’embauche
L’étude montre que les algorithmes grand public ne font pas que refléter ce biais, ils l’amplifient activement.
Impact sur la perception (Google Images) : Une expérience a montré que voir l’image d’une femme pour un métier sur Google Images entraînait les participants à estimer l’âge moyen de ce métier 5,46 ans plus jeune que s’ils avaient vu un homme. Cet effet dépasse les préjugés initiaux des participants.
Impact sur les décisions (Embauche) : Les participants ont également rapporté une préférence pour embaucher plus jeune dans les métiers qu’ils associaient aux femmes, et plus âgé dans ceux qu’ils associaient aux hommes. Ce biais âge-genre influence directement les jugements d’aptitude.
Un biais inter-sectionnel à corriger
Cette étude documente un biais inter-sectionnel âge-genre qui traverse tous les formats numériques. L’amplification de ce biais par les algorithmes risque d’aggraver les inégalités : les femmes sont cantonnées à des rôles perçus comme « jeunes » et moins expérimentés, tandis que les postes d’autorité restent associés à des hommes plus âgés et expérimentés.
Les auteurs appellent à développer des méthodes pour détecter et corriger activement ces distorsions multidimensionnelles, qui sont plus difficiles à repérer que les discriminations isolées.
Source : Nature.com

