Réflexions sur l’amorçage sémantique et les tests psychologiques

Connaissez-vous l’amorçage sémantique ? De nombreuses études ont été publiées sur ce sujet.

Le principe en est très simple, il repose sur le fait que la répétition de X mots du même domaine sémantique a une influence non-négligeable sur la psychologie du sujet pour un temps Y.

Par exemple, il a été démontré que si on demande à une personne de nous trouver le plus de mots possible autour des notions de « vérité » et « honnêteté », elle est, par la suite, significativement plus prompte à dire la vérité sur d’autres questions qui n’ont rien à voir.

Dans un autre domaine, il a été montré que le vocabulaire des personnes est moins étendu après avoir vu un film d’horreur qu’une comédie.

Bref, vous l’aurez compris, l’amorçage sémantique c’est un vecteur d’influence.

Quel rapport avec les tests psychologiques ?

Simple : Dans les tests de type « boite à chaussure » les personnes lisent avec attention un rapport listant tous les traits de sa personnalité sur le ton lyrique des discours horoscopiques, c’est-à-dire de la paraphrase en veux-tu en voilà.

Pour avoir fait l’exercice de résumer toutes les interprétations possibles des typologies MBTI et autres Socionique, une chose apparaît avec évidence: toutes ces descriptions ont été construites de la même façon : broder autour de 2 ou 3 notions en les déclinant à toutes les sauces, en amour, en travail, en santé, à la tienne Etienne.

Et voilà donc la situation : on a une personne qui lit X paragraphes, utilisant en plus le « vous êtes »,  c’est-à-dire, a priori, le présupposé accepté que les adjectifs des paragraphes s’appliquent à elle !

Les conséquences logiques

Les descriptions de types de personnalité sont de fabuleux amorçages sémantiques !

Si le type donné correspond à l’image que la personne a d’elle-même, il s’agira d’un merveilleux exercice de renforcement. Dans le cas contraire, si les résultats sont à côté de la plaque, il s’agira d’une sorte de remise en question par reprogrammation.

Le plus rigolo dans tout ça, c’est que les personnes font des tests pour essayer de faire le point et avancer.

Or, si on considère l’amorçage sémantique, de toute évidence, ce sont les tests les moins performants et perspicaces qui ont le plus de chance d’amener et d’aider la personne à remettre en question certains de ses traits !

Aussi, si  une personne autour de vous a fait un test psychologique pertinent, sachez qu’a priori elle devrait être particulièrement elle-même pendant 2 ou 3 jours !

Finalement, les personnes devraient répondre aux questions des tests selon ce qu’elles voudraient être et non ce qu’elle pense qu’elles sont…

Amusant non ?

Le pire, c’est que cela nous a donné une idée … qui passera par une commission d’éthique sur le thème  » la fin justifie-t-elle les moyens? « . Y a de l’expérience dans l’air !

A suivre !

FACEBOOK et FIVE LABS : la BigFaille

Et voilà que ce matin tous les médias du web en parlent : Facebook met en place une application qui donne une évaluation de votre personnalité sur les 5 axes des big5, non pas en demandant de répondre à des questions, mais en se basant sur une analyse sémantique des textes des utilisateurs.

Il y a tellement de choses à dire sur cet événement !

Une méthodologie certainement valide : L’université de Pennsylvanie annonce que l’analyse est basée sur 75 000 utilisateurs. La méthode a certainement consisté à faire passer le test des Big5 à ces personnes, puis corréler leurs résultats avec les mots utilisés par chacun sur leur compte Facebook. Puis, une fois les corrélations trouvées, faire une vérification prédictive en sortant les analyses des textes d’utilisateurs puis en leur faisant passer les test des big5.

Des analyses de ce type ont déjà été faites, avec d’autres objectifs évidement, dans le cadre de l’évaluation des sentiments et émotions contenus dans un texte (comprenez littéraire) (« Évaluations automatiques des émotions et sentiments, mémoire sémantique et compréhension de texte : expérimentations et simulations  » – N.LEAVEAU 2011)

Sous des aspects sympathiques, cette première application va devenir redoutable dans tous les sens du terme.

1. Cela devait arriver : C’est la suite logique et la nature profonde des réseaux sociaux que de connaître au mieux ses utilisateurs pour pouvoir leur proposer des services adaptés.

2. Peu importe la pertinence des résultats proposés visuellement à l’utilisateur! Ce qui est important est que ce gadget donne une bonne raison de faire passer des vrais tests à l’utilisateur. Par exemple « Pour améliorer notre application, merci de répondre à ces questions complémentaires »

3. L’application ne peut que s’améliorer. Ce n’est que le début. Elle va devenir de plus en plus fine et efficace, car elle peut être corrélée à beaucoup d’autres aspects non-sémantiques (taux de clic sur des pubs, jeux etc. )

Les failles du début ne sont pas très compliquées à comprendre, ce sont les mêmes que pour tous les tests de personnalité (y compris le notre) : l’universalité.
Autrement dit, l’appli Five Labs a été étalonnée sur des américains, avec le langage anglais. Cet étalonnage n’est pas valable pour d’autres cultures/langue. C’est une des critiques qui est faite à l’encontre du test originel des Big5, et nous avons rencontré le même problème : la culture et la langue sont un facteur non-négligeable d’une évaluation de la personnalité. Plus que cela, nos chiffres indiquent même, pour ce qui est de la France, des différences notables entre les départements du Nord et ceux du Sud (certainement à cause de la chaleur moyenne).

Ce qu’il va se passer :

Pour tous les non-américains, le test va être rigolo à faire, mais décevant. N’en doutez pas, ce qui est important du point de vue de Facebook, c’est que les données s’accumulent. Ensuite, le test sera certainement ré-étalonné par pays/culture, ce qui donnera certainement lieu à des publications sur de nouvelles grilles de notation des Big5 par pays.

Viendra ensuite la BigBascule : La recherche de corrélations entre les traits des BigFive et les comportements d’achat. Et là… là ça ne va plus rigoler. En effet, à terme, le but est de pouvoir déduire la stratégie marketing la plus adaptée à partir d’une simple analyse sémantique des propos tenus par l’utilisateur sans avoir à lui demander quoi que ce soit.

Le vrai problème de fond est sur l’anonyma, et non sur la pertinence qui ne peut que s’améliorer. Comprenez bien que la seule intention sous-jacente est de pouvoir se passer de questionnaire et donc d’un acte volontaire du sujet.

C’est un magnifique coup en bande.

Ajoutons que pour peu qu’un nombre non négligeable de cabinets de recrutement prennent les résultats de cette application comme un indicateur… et alors là… même les cadres le feront, ce qui permettra aux données de ne pas être cantonnées aux CSP(-)  . Jackpot Epic win !

 

 

 

Différence entre les hommes et les femmes

Travaux préliminaires

Base 640 000 observations sur 12 ans – fichedepersonnalite.com – LAINE Pierre-jean

 

Introduction

Soyons clair, sur le sujet, tout a été dit. Tout ou presque. Notre propos est ici d’aborder cette question de la différence ou de la similarité des genres par le biais de notre base de données.

Autrement dit, comment s’expriment les différences entre les hommes et les femmes sur 12 ans de collecte de donnée (640 000 observations) et 131 questions (item) ?

Le système de notation : les valeurs vont de 1 (oui) à 4 (non), la moyenne neutre est donc de 2.5

Première passe :

Nous avons simplement, pour chacune des questions, regardé la valeur absolue de la différence de score entre les hommes et les femmes, tous âges, toutes CSP, et ce, par année et mois, de 2001 à 2014

Résultats :

  • 62 questions ont un écart moyen négligeable inférieur à 0.10 points
  • 28 questions ont un écart moyen supérieur à 0.20 points
  • 9 questions (sur les 28) ont un écart moyen supérieur à 0.30 points

Nous pourrions penser, d’emblée, qu’il y a donc une différence notable entre les genres. Pour autant, ce n’est pas aussi simple que cela.

Il a déjà été prouvé et rabâché que certaines fonctions (motrices par exemples) sont différentes entre les sexes. Ce qui nous intéresse est plutôt de l’ordre des différences psychologiques.

Est-ce à dire que nous allons étudier les questions une par une pour analyser et évaluer leur pertinence sur le sujet qui nous préoccupe ? Non. Il y a plus simple à faire.

Nous allons tester une hypothèse :

S’il est vrai que petit à petit, dans nos pays francophones, culturellement, la différence entre les hommes et les femmes s’amenuise, alors, sur 12 ans, nous devrions retrouver l’amenuisement de cet écart. Plus que cela, nous devrions être en mesure, théoriquement, de définir un indicateur d’égalité.

Autrement dit, nous devrions être en mesure d’identifier :

  • GROUPE 1 : Les questions qui ont un écart faible et invariant, c’est-à-dire les sujets sur lesquels ni la culture, ni la physiologie n’a d’incidence.
  • GROUPE 2 : Les questions qui ont un écart important, mais une faible variation. Ces questions seront donc directement liées aux différences physiologiques entre les sexes
  • GROUPE 3 : Les questions qui ont un écart important, et qui ont des variations importantes dans le temps. Ces questions seront donc les sujets sur lesquels les différences entre hommes et femmes sont imputables à la culture et au contexte

 

Observations

Groupe 1 : Faible écart (NEC), faibles variations (NV)

NEC NV

2001

   0.01

2002

             0.01

2003

             0.02

2004

             0.01

2005

             0.02

2006

             0.02

2007

             0.02

2008

             0.02

2009

             0.02

2010

             0.02

2011

             0.01

2012

             0.01

2013

             0.02

2014

             0.01

clip_image002

Ce groupe est indexé sur la moyenne de 23 questions avec variation d’écart moyen (écart type) inférieur à 0.02 par mois, et écart moyen total inférieur à 0.10

Analyse :  Nous constatons que, même si l’indice change sensiblement pour les femmes et les hommes, l’écart lui, reste stable.

Nous pouvons donc en déduire 2 conclusions a priori :

  • Les 23 questions représentent un indice qui subit des variations chez les femmes et chez les hommes séparément depuis 2012 /2013. Nous ne pouvons rien dire de la cause de ses variations.
  • Les variations de cet indice n’ont aucun impact sur l’écart entre les hommes et les femmes. Les deux sexes varient avec la même amplitude.

Donc, cet ensemble de 23 questions semble être un bon indicateur de la similarité invariante entre les genres.

 

Groupe 2 : Grand écart (GDEC), faibles variations (NV)

GDEC NV

2001

             0.06

2002

             0.04

2003

             0.06

2004

             0.05

2005

             0.06

2006

             0.06

2007

             0.06

2008

             0.05

2009

             0.04

2010

             0.05

2011

             0.05

2012

             0.04

2013

             0.05

2014

             0.05

clip_image004

Ce groupe est indexé sur la moyenne de 11 questions avec variation d’écart moyen inférieur ou égal à 0.02 par mois, et écart moyen total supérieur à 0.20

Analyse :  Nous constatons que cet indice change sensiblement pour les femmes et les hommes en 2012/2013. Cette variation n’a pas d’impact sur les variations d’écarts.

Cet indicateur est censé représenter les différences irréductibles (donc physiologiques) entre les hommes et les femmes, et être invariant.

Groupe 3 : Grand écart (GDEC), Grandes variations (GDV)

GDEC GDV

2001

             0.05

2002

             0.08

2003

             0.09

2004

             0.07

2005

             0.11

2006

             0.13

2007

             0.13

2008

             0.15

2009

             0.13

2010

             0.14

2011

             0.14

2012

             0.12

2013

             0.13

2014

             0.11

 

clip_image006

Ce groupe est indexé sur la moyenne de 8 questions avec variation d’écart moyen supérieur ou égal à 0.03 par mois, et écart moyen total supérieur à 0.20

Analyse :  Nous constatons que :

  • L’écart se réduit depuis 2011, après 10 ans de hausse.
  • Les indices séparés Hommes/Femmes ne sont pas du tout synchronisés.

 

Interprétation :

C’est évidement le groupe 3 qui nous intéresse. Autrement dit, l’indice de ce qui est clairement différent entre les genres et variable dans le temps.

L’indice d’écart en lui-même :

Contrairement à ce que l’on aurait pu penser, l’écart entre les hommes et les femmes se creusait depuis les années 2004. Ce n’est que depuis 2011 qu’il semble se réduire.

La courbe des indices par genre nous indique que :

En 2004 , ce sont les hommes qui ont changés de façon non-négligeable, alors que les femmes, elles, ont continué une évolution stable à la baisse.

Autrement dit, si à cette époque les hommes n’avaient pas changé, l’écart culturel/contextuel entre les hommes et les femmes se serait amoindri. Au lieu de cela les hommes, en changeant plus vite, ont augmenté cet écart.

En 2011, il semble que ce soit le contraire qui se passe. Ce sont les femmes qui viennent de changer de façon notable, alors que les hommes, eux, restent stables. L’écart se réduit donc vers les valeurs des hommes, alors qu’avant 2004, c’étaient les hommes qui rejoignaient les valeurs des femmes.

En d’autres termes, sur la question de l’égalité des sexes :

Notre approche nous permet de dire qu’il s’est passé quelque chose en 2003/2004 qui a amené un changement soudain des hommes sur l’ensemble des questions de cet indice. Les femmes n’ont pas réagit à cet événement avec la même amplitude.

De plus, en 2012/2014, les femmes s’approchent de plus en plus de l’indice que les hommes avaient en 2004. Alors que l’indice de ces derniers apparaît stable. Ce qui explique une baisse d’écart.

Il nous semble important de noter que, selon cet indice, de toute évidence :

  • Les hommes et les femmes n’évoluent pas de la même façon
  • Les femmes semblent, sur 12 ans, se rapprocher de l’indice des hommes et non le contraire. Ou tout du moins, plus vite que ces derniers.

Ce qui nous permet de conclure qu’a priori :

  • Globalement, les hommes et les femmes sont plus similaires que divergents
  • Sur les questions de divergences, la tendance est au mouvement des femmes vers les valeurs des hommes et non le contraire.

 

Conclusion

Depuis 12 ans l’indice des femmes se rapproche de celui des hommes (femmes 2014 : 2.26 pts, hommes 2004 : 2.23 pts)

Or l’indice des hommes lui aussi varie à la baisse dans les années 2004, à la hausse faible depuis 2008.

Donc, les femmes vont vers plus d’égalité en s’approchant des valeurs des hommes.

Mais les valeurs des hommes ont changé et changent plus rapidement, ce qui fait varier l’écart final.
Donc, par rapport à notre hypothèse de départ, nous pouvons dire que :

  • Oui, nous allons vers plus d’égalité du fait que les femmes prennent petit à petit les valeurs des hommes.
  • Oui, il y a plus de similarités invariantes que de divergences.
  • Non, dans les chiffres, nous n’allons vers plus d’égalité que depuis peu d’années. Nous nous en sommes largement éloignés depuis le début des années 2000 du fait d’un durcissement soudain des valeurs des hommes vers 2004.

 

Note : nous laissons le soin au lecteur de faire sa propre enquête sur les événements qui pourraient expliquer les variations de l’indice des hommes, car cela n’est pas notre propos.

 

NEC NV : 3, 259, 266, 268, 269, 271, 272, 276, 277, 278, 279, 280, 281, 282, 287, 289, 298, 297, 302, 311, 321, 347, 59

GDEC NV : 245, 250, 253, 254, 264, 284, 306, 323, 340, 349, 97

GDEC GDV : 1 , 291, 305, 318, 319, 330, 336, 82

 

Jeux vidéo et psychologie

Un article intéressant « l’École de psychologie s’associe à Ubisoft Québec » :

http://www.lefil.ulaval.ca/articles/interaction-intelligente-36091.html

Autant il nous semble que ce genre de partenariat ne peut qu’être particulièrement riche, autant se pose une question de fond : Quand les jeux s’adapteront à l’émotion du joueur, n’allons-nous pas perdre justement l’intérêt de confronter le joueur à des situations qui ne lui sont pas forcément agréables ?

La réponse est simple : oui, certainement pour les jeux commerciaux, non pour tout le reste, comme les Serious Game par exemple.

En effet, en partant du présupposé que cette expérience permettra de modéliser au moins un axe modifiable dynamiquement pour augmenter ou diminuer le plaisir de l’utilisateur (joueur en l’occurence), et en partant de l’autre présupposé que les capteurs de signes de plaisirs ou déplaisirs ne seront pas contraignants, de toute évidence, les jeux et programmes basés sur « la vente de divertissement » utiliseront au maximum ces systèmes.

D’autre part, dans un objectif d’apprentissage, il suffira de dynamiquement faire réagir le programme à l’opposé, c’est-à-dire mettre l’utilisateur dans des conditions désagréables et le forcer à persévérer.

Enfin il manque un aspect : Dans beaucoup de situations, le fait de vivre des moments désagréables, de les surmonter (ou pas), amène certaines personnalités à conclure que c’était « bien » quand même… Or, si le système s’adapte pour éviter les situations désagréables…

Ce sont donc de vraies questions qui s’avancent avec toutes les recherches basées sur la captations des émotions en fonctions de stimuli complexes parfaitement maîtrisés et reproductibles.

 

 

Un afflux soudain

Hier soir, 29 mai 2014, il y a eu un gros afflux de tests fait par des 16-25 ans.

Nous surveillons de près ce genre de pic et avons cherché l’origine. Assez rapidement nous avons identifié un article sur un forum de jeux vidéo.

Le message original est un jeune homme qui s’inquiétait d’avoir été positif sur le test de trace de troubles schizoïde. Finalement, il donne dans son billet l’adresse du site (ce qui explique le pic), et, une discussion s’engage avec d’autres jeunes personnes du forum en question.

La suite de l’échange se fait sur 3 pages et nous en retenons deux aspects intéressants:

  • Le premier est que le jeune homme décrit comment il voit régulièrement un psy professionnel, comment il sait qu’il a des réactions « étranges », comment ses parents s’inquiètent etc.
  • Le deuxième est que le discours des intervenants est de dire que « les tests de personnalité sur internet sont nuls » et amoindrir la pertinence (et donc l’inquiétude).

Et c’est là où nous sommes plutôt satisfait. En effet, nous avions hésité à mettre en place les tests de troubles et avions décidé que cela pouvait permettre un déclic. De toute évidence, c’est le cas et aux vues de la description du jeune homme, les résultats du test sont plutôt pertinents. Il est déjà dans un contexte de suivi, il sait qu’il a un problème, et pourtant, ce sont les résultats du test qui l’amène à en parler sur un forum !

Quant à l’image de « Les tests c’est nul », cela nous convient aussi parfaitement pour ce segment dans le sens où il est justement très important pour la « fraicheur » des réponses que ces dernières soient considérées comme dépourvues d’incidence.

Troubles de la personnalité

Après beaucoup d’hésitation, nous rendons disponibles 3 marqueurs de traces de trouble de la personnalité : Traces de dépression , de troubles paranoïaques et de troubles schizoïdes.

Nous désactivons ces indicateurs pour les sujets de moins de 18 ans. Cela nous semble plus prudent étant donné la propension des « jeunes » à se faire des idées…

Notre décision est fondée sur une réflexion :

– l’utilisateur est seul devant son écran.
– la prise de conscience d’un trouble générateur de souffrance est parfois difficile à admettre.
=> S’il y a une possibilité pour que, le fait qu’un test de personnalité indique un trouble amène le sujet à effectivement se poser la question de consulter un professionnel, alors, il faut le faire.