Trouver une methode de profilage automatique

Rappel: 640 000 observations sur 131 items sur 12 ans , tous âges, sexe, CSP

Il s’agit ici d’une réflexion à voix haute sur une problématique qui nous occupe. Les commentaires sont donc bienvenus.

Les données du problème

L’objectif est qu’à l’issue du test, les résultats permettent de dire si le profil de la personne correspond à une catégorie professionnelle. Autrement dit, de pouvoir dire à un employé qu’il a le profil d’un cadre, ou à un cadre qu’il a le profil d’un chômeur. (un peu d’humour noir …. 🙂 )

Le plus simple étant de prendre un exemple, nous nous baserons sur les « cadres du secteur informatique ».

La première étape est donc de repérer si les « cadres du secteur informatique » répondent différemment des autres catégories professionnelles et, en les rassemblant, générer un indicateur.

Empirique

Nous avons généré toutes les moyennes des 131 questions par catégorie professionnelle. Pour des raisons de confidentialité, nous ne pouvons les rendre public.

Pour autant, nous pouvons sortir quelques chiffres, pour le moins, étonnants.

Pour l’exemple qui nous préoccupe, la Q1 « Je fais attention à ma façon de m’habiller «  marque une différence !

Les cadres du secteur informatique ont une moyenne de 1.93 pts (de 1 à 4. oui =1 , non =4, neutre =2.5)

et les cadres « autres secteurs » ont une moyenne de 1.73 pts.

C’est une différence énorme ! Elle s’interprète facilement : Les cadres du secteur informatique font moins attention à leur façon de s’habiller que les autres. (En cela… pas de commentaires 🙂 )

Oui, mais comment le repérer ? :

– Avec une moyenne de 1.93 pt, nous sommes sur une réponse de type « plutôt oui » , mais avec 1.73 pts aussi ! Nous ne pouvons donc pas repérer sur cette simple question la différence entre les personnes.

Passer outre la méthode classique

La méthode classique la plus simple (que nous utilisons sur d’autres types de résultats au test) consiste à attribuer des points suivant la réponse. L’incrément est linéaire, par exemple : oui = 10pts, plutôt oui=6.5pts, plutôt non=2.5 pts et non=0pts.

Puis de créer un indicateur en moyenne de différentes questions suivant leur importance. Par exemple ( Q1 x 2 + Q123 x5 + Q321 x1 ) / 8 = résultat

Mais dans notre problème, cette méthode sera difficile à mettre en place car elle ne reflète pas « les tendances » par profils. Elle nous oblige à tout faire reposer sur l’importance des questions.
Autrement dit, il y a une sorte de perte d’information dans l’équation que nous serons condamné à essayer de recréer.

La conclusion s’impose : Nous devons trouver un moyen de refléter les différences de profils dans la cotation des réponses.

Autrement dit, nous devons trouver une méthode d’attribution des points non-linéaire et fonction des différences de moyennes.

La nouvelle méthode que nous allons tester

Soit les cadres du secteur informatique avec une moyenne à la Q1 de 1.93 pts , soit 0.25 > à moyenne générale (1.68)

Soit les cadres autres secteurs avec une moyenne à la Q1 de 1.73 pts, soit 0.05 > à moyenne générale

Nous partirons du principe que pour un cadre informatique, le fait de « ne pas faire attention à la façon de s’habiller » est plus courant que pour les autres (sauf les retraités qui montent à 2.09…)

aussi, au lieu d’attribuer la Q1 de la forme 10->6.5->2.5->0, nous coterons la Q1 de la forme 0->10->10->10 , et nous donnerons à cette question un facteur de 25 (écart x 100)

En d’autres termes, nous devons, dans le score final, prendre en compte que pour un cadre informatique, il n’est pas « normal » de faire très attention à la façon de s’habiller, alors que cela peut l’être dans toutes les autres catégories professionnelles.

Autrement dit, la formule finale, appliquée aux 131 questions du test de personnalité, sera composée de ( Ecart_moyenne_totale x 100) x poids + etc.

TODO (à faire)

  1. Ecrire un programme qui établis automatiquement l’équation
  2. vérifier que l’équation donne bien un score nettement différent que les autres CSP
  3. vérifier le taux de positifs sur 100 000 fiches

A suivre …

 

 

 

 

 

A la recherche de ce qui ne varie pas – Partie 2

Suite de notre recherche de ce qui ne varie pas sur 12 ans de données et 640 000 observations

Article précédent : La question « j’aime manger »

 

Nous allons à présent regarder de plus près

la Question 326 : »Les formes sensibles ne sont qu’un renseignement »

D’emblée, nous avons parfaitement conscience que cette question est difficile. Il est donc probable que beaucoup de sujets aient répondu au hasard, ce qui expliquerait sa constance proche de la moyenne neutre à 2.50 pts.

Pour autant, cette question pose aussi 2 paradigmes de la perception :

1. Ce que je perçois est de la pure information.

2. Ce que je perçois contient du sens en plus de la simple information.

De plus, et c’est là une bonne surprise, les variations de moyennes font passer de oui à non et inversement !

Variations par années et par mois

Aucune variation notable de 2001 à 2013, la moyenne reste à 2.56 (Ecart moyen de 0.02), c’est-à-dire, plutôt non.

 

Par genre, entre les hommes et les femmes

Si les personnes ont répondu au hasard, alors les hommes et les femmes n’ont pas le même hasard …

B_Q326
B_genre Moyenne N Ecart type
1 2.48 243812 .919
2 2.61 398668 .956
Total 2.56 642480 .945

 

Là c’est vraiment intéressant. Non seulement il y a un écart non-négligeable entre les hommes et les femmes sur cette question, mais en plus il s’agit d’une réponse opposée !

Pour les hommes, OUI, les formes sensibles ne sont qu’un renseignement.
Pour les femmes, NON, les formes sensibles ne sont pas qu’un renseignement.

Et pour le coup, ce résultat nous a tellement surpris que nous vous donnons aussi le comptage pour bien mesurer l’impossibilité d’une erreur.

Il semble donc qu’en cherchant ce qui ne varie pas, nous ayons trouvé une des différences fondamentales entre les hommes et les femmes (sans dire pour autant sa cause, culturelle, biologique etc.) . Autrement dit, l’un et l’autre perçoivent le réel différemment. Les hommes perçoivent de l’information, les femmes perçoivent du sens.

Mais nous ne sommes pas au bout de nos surprises…

Variations par âge

B_Q326
B_age Moyenne Ecart type
0-16 2.56 .969
16-18 2.59 .928
18-25 2.59 .926
25-35 2.54 .949
35-45 2.46 .994
45-55 2.39 .997
55+ 2.30 .975
Total 2.56 .945

Ces chiffres sont particulièrement importants. Avec l’âge la réponse passe de NON (jusqu’à 35 ans) à OUI (au-delà)

Résumé vulgairement, quand on est jeune on croit que tout à du sens, à 40 ans, on y croit plus ! C’est la crise de la quarantaine !

Par métier

B_Q326
B_cspintra Moyenne Ecart type
Cadres (informatique, télécoms) 2.50 .882
Cadres autres secteurs 2.50 .907
Chefs d’entreprises 2.44 .947
Professions libérales 2.46 .991
Professions intellectuelles, artistiques 2.60 .992
Chercheurs ou médecins des hopitaux 2.48 .968
Enseignants ou personnels de la santé 2.55 .967
Etudiants 2.60 .912
Collégiens-Lycéens 2.59 .942
Agriculteurs exploitants 2.52 .967
Ouvriers spécialises ou agricoles 2.48 .988
Artisans 2.50 1.008
Commercants et assimilés 2.49 .992
Employés (informatique, télécoms) 2.56 .926
Employés de la fonction publique 2.53 .977
Employés des entreprises 2.55 .960
Retraités, pré-retraités 2.25 .957
Chomeurs et inactifs 2.55 .996

Pour les retraités, oui, les formes sensibles ne sont qu’un renseignement, et cela confirme la courbe descendante selon l’âge

Et pour les intellectuels et les artistes, non, il y a plus dans les formes sensibles.

Voilà les 2 opposés.

Conclusion

Mine de rien, par cette simple analyse de surface, 2 observations importantes :

Alors que cette question semble indépendante de l’époque (invariante sur 12 ans), elle a la particularité d’opposer 2 visions du réel. Nous aurions pu penser, qu’étant donné la difficulté de la question, les réponses seraient pour le moins toutes orientées selon la même tendance. Et c’est là la surprise : Les variations sont de l’ordre de la réponse opposée.

Ainsi, hommes et femmes sont plus que différents, il sont opposés sur cette question.

De même, l’âge fait changer d’avis sur la question .

Nous regrettons de ne pas avoir demandé des 1999 l’âge exact des sujets, ce qui nous aurait permis de définir exactement l’âge de « bascule ».

Nous pouvons donc dire que cette question est invariante, a priori culturellement, mais qu’elle reste particulièrement dépendante de l’expérience du réel, au sens du vécu.

Plus que cela, nous pouvons plus philosophiquement affirmer que la prise de position de « percevoir du sens », ou « il y a du sens », est durement mise à l’épreuve au fil des années vécues… au point même d’être abandonnée autour de 40 ans…

Prophétie hypothétique : Il nous paraîtrait étonnant qu’un tel changement de paradigme ne s’accompagne pas de changement physiologique, en cause ou en effet.

To be continued

A la recherche de ce qui ne varie pas – Partie 1

Rappel: Nous nous intéressons à la recherche de ce qui ne varie pas dans le temps, ni par âge, ni par genre sur les 131 questions du test psychologique que nous maintenons (640 000 testés sur 12 ans).

Note : Oui=1 , Non =4

La Q3 : « J’aime manger »

Interprétation de la question : Difficile d’imaginer qu’il y ait un biais sur cette question. Le seul qui nous paraît possible est celui de l’horaire de passation. En effet, dans les magasins, il a été observé une augmentation des achats sur les horaires qui précèdent les repas. Nous pouvons donc émettre l’hypothèse que cette variation se retrouve ici.

Par heures

Le graphique parle de lui-même :

tab002

A 4 heure du matin, l’homme à faim ! Certainement ceux qui ont un travail de nuit.

A 10 H , l’homme à faim ! Milieu de matinée, les ventres grognent.

A 16/17 H, l’homme à faim ! C’est l’heure du goûter.

reste le pic de 3h qui est étrange.

Entre les hommes et les femmes

B_genre Moyenne Ecart type
Homme 1.60 .791
Femme 1.59 .841
Total 1.59 .823

 

0.01 point (sur 4) de différence sur 640 000 observations, et donc plus de 250 000 pour chaque sexe.

si 0.01 est négligeable: Le fait d’aimer manger n’est pas différent que l’on soit un homme ou une femme.
si 0.01 n’est pas négligeable : Les homme aiment un tout petit peu moins manger que les femmes.

Par âge

B_age Moyenne Ecart type
0-16 1.66 .863
16-18 1.59 .826
18-25 1.55 .796
25-35 1.59 .804
35-45 1.68 .863
45-55 1.75 .896
55+ 1.79 .936
Total 1.59 .823

 

L’appétit vient en étudiant ! L’âge est donc une variable importante de cette question. Qu’il s’effrite avec les années grandissantes est une chose qui nous semble logique en terme de gestion et besoin en énergie. Par contre, la différence entre les adolescents et les jeunes adultes nous apparaît étonnante.

Par mois

B_mois Moyenne Ecart type
1        1.5968 .824
2         1.5817 .814
3         1.5868 .819
4         1.5861 .815
5         1.5932 .825
6         1.6027 .826
7         1.6033 .826
8         1.6060 .828
9         1.6037 .824
10         1.5903 .823
11         1.5885 .821
12         1.5993 .827
Total 1.59 .823

tab001

Là il y a quelque chose d’étrange. Que l’appétit baisse en période estivale, cela nous paraît tout à fait normal. Par contre, le mois de décembre devient singulier… La période des fêtes serait-elle trop riche ?

 Par taille

B_taillenum Moyenne Ecart type
Petit 1.63 .867
Moyen 1.60 .827
Grand 1.56 .791
Tres grand 1.54 .807
Total 1.59 .823

Rien d’étonnant: plus on est grand, plus on a besoin d’énergie, plus on aime manger.

Par métier

B_cspintra Moyenne Ecart type
Cadres (informatique, télécoms) 1.67 .807
Cadres autres secteurs 1.62 .787
Chefs d’entreprises 1.60 .811
Professions libérales 1.64 .840
Professions intellectuelles, artistiques 1.60 .833
Chercheurs ou médecins des hopitaux 1.68 .861
Enseignants ou personnels de la santé 1.61 .838
Etudiants 1.56 .799
Collégiens-Lycéens 1.62 .840
Agriculteurs exploitants 1.57 .808
Ouvriers spécialises ou agricoles 1.56 .806
Artisans 1.56 .824
Commercants et assimilés 1.55 .820
Employés (informatique, télécoms) 1.61 .816
Employés de la fonction publique 1.60 .831
Employés des entreprises 1.57 .817
Retraités, pré-retraités 1.83 .966
Chomeurs et inactifs 1.61 .857
Total 1.59 .823

Voilà qui est intéressant !

Au top de ceux qui ont le moins d’appétit : Les retraités. Cela corrobore les chiffres liés à l’âge. Puis les chercheurs et médecins des hôpitaux.

Mais au top de ceux qui ont le plus d’appétit… on retrouve les commerçants !

Conclusion

Nous avons étudié brièvement cette question parce qu’elle varie peu dans le temps avec un écart moyen de 0.02 pts sur 12 ans. Dans le détail, les choses deviennent vite plus complexes, notamment avec les chiffres par métier.

En effet, nous nous sommes permis de d’interpréter cette question comme un indicateur de l’appétit et/ou de la satiété.

Que cet indicateur varie avec les besoins en énergie (heure, âge, taille), cela est tout à fait normal et la dépendance n’est pas à discuter.

Par contre, dés que l’on s’intéresse aux métiers, les variations entre CSP deviennent trop importantes pour être expliquée superficiellement. Cela dit, il y a fort à parier que le fait de particulièrement « aimer manger » soit lié à une sorte « d’avidité » (commerçants). Mais comment expliquer la différence de 0.05 pt entre les cadres du secteur informatique et des autres ?
Ou comment expliquer  le score des chercheurs (1.68) ?

Cela reste des questions en suspend.

 

 

 

 

A la recherche de ce qui ne varie pas – repérage

Toutes ces données accumulées sont un peu comme une boite de pandore. Il y a tout à comprendre, à analyser, sur tous les axes, dans toutes les dimensions.

Mais en écrivant les travaux préliminaires sur la différence entre les hommes et les femmes, nous nous sommes aperçu qu’au milieu de toutes ces chiffres qui varient, ce qui est vraiment intéressant du coup est ce qui ne varie pas.

Quelles sont donc ces questions sur lesquelles les moyennes ne changent pas dans le temps, ni par âge, ni par genre ?

Autrement dit, quels sont ces sujets qui sont indépendants de l’époque, de l’expérience ou des hormones ?

Voilà une belle quête.

Ni une ni deux, nous avons fait tourner nos logiciels de statistique sur cette recherche. Et la réponse est incroyable :

Les 2 questions dont les réponses moyennes ont un écart moyen de 0.02 (sur 4pt) sur 12 ans et 605 000 observations :

 

Il s’agit de la Q3 : « J’aime manger »

et de la Q326 : « Les formes sensibles ne sont qu’un renseignement  »

2 belles analyses en perspectives ! Car si ces deux questions ne varient pas sur 12 ans, reste tout de même à vérifier que c’est vrai aussi avec l’âge et avec le genre.

Pendant que nous y sommes, il y a aussi LA question qui varie le plus sur 12 ans, avec un écart moyen de 0.19 (presque 10 fois plus).

Il s’agit de la question Q353 : « Je récompense facilement les efforts des autres » …

To be continued

 

Différence entre les hommes et les femmes

Travaux préliminaires

Base 640 000 observations sur 12 ans – fichedepersonnalite.com – LAINE Pierre-jean

 

Introduction

Soyons clair, sur le sujet, tout a été dit. Tout ou presque. Notre propos est ici d’aborder cette question de la différence ou de la similarité des genres par le biais de notre base de données.

Autrement dit, comment s’expriment les différences entre les hommes et les femmes sur 12 ans de collecte de donnée (640 000 observations) et 131 questions (item) ?

Le système de notation : les valeurs vont de 1 (oui) à 4 (non), la moyenne neutre est donc de 2.5

Première passe :

Nous avons simplement, pour chacune des questions, regardé la valeur absolue de la différence de score entre les hommes et les femmes, tous âges, toutes CSP, et ce, par année et mois, de 2001 à 2014

Résultats :

  • 62 questions ont un écart moyen négligeable inférieur à 0.10 points
  • 28 questions ont un écart moyen supérieur à 0.20 points
  • 9 questions (sur les 28) ont un écart moyen supérieur à 0.30 points

Nous pourrions penser, d’emblée, qu’il y a donc une différence notable entre les genres. Pour autant, ce n’est pas aussi simple que cela.

Il a déjà été prouvé et rabâché que certaines fonctions (motrices par exemples) sont différentes entre les sexes. Ce qui nous intéresse est plutôt de l’ordre des différences psychologiques.

Est-ce à dire que nous allons étudier les questions une par une pour analyser et évaluer leur pertinence sur le sujet qui nous préoccupe ? Non. Il y a plus simple à faire.

Nous allons tester une hypothèse :

S’il est vrai que petit à petit, dans nos pays francophones, culturellement, la différence entre les hommes et les femmes s’amenuise, alors, sur 12 ans, nous devrions retrouver l’amenuisement de cet écart. Plus que cela, nous devrions être en mesure, théoriquement, de définir un indicateur d’égalité.

Autrement dit, nous devrions être en mesure d’identifier :

  • GROUPE 1 : Les questions qui ont un écart faible et invariant, c’est-à-dire les sujets sur lesquels ni la culture, ni la physiologie n’a d’incidence.
  • GROUPE 2 : Les questions qui ont un écart important, mais une faible variation. Ces questions seront donc directement liées aux différences physiologiques entre les sexes
  • GROUPE 3 : Les questions qui ont un écart important, et qui ont des variations importantes dans le temps. Ces questions seront donc les sujets sur lesquels les différences entre hommes et femmes sont imputables à la culture et au contexte

 

Observations

Groupe 1 : Faible écart (NEC), faibles variations (NV)

NEC NV

2001

   0.01

2002

             0.01

2003

             0.02

2004

             0.01

2005

             0.02

2006

             0.02

2007

             0.02

2008

             0.02

2009

             0.02

2010

             0.02

2011

             0.01

2012

             0.01

2013

             0.02

2014

             0.01

clip_image002

Ce groupe est indexé sur la moyenne de 23 questions avec variation d’écart moyen (écart type) inférieur à 0.02 par mois, et écart moyen total inférieur à 0.10

Analyse :  Nous constatons que, même si l’indice change sensiblement pour les femmes et les hommes, l’écart lui, reste stable.

Nous pouvons donc en déduire 2 conclusions a priori :

  • Les 23 questions représentent un indice qui subit des variations chez les femmes et chez les hommes séparément depuis 2012 /2013. Nous ne pouvons rien dire de la cause de ses variations.
  • Les variations de cet indice n’ont aucun impact sur l’écart entre les hommes et les femmes. Les deux sexes varient avec la même amplitude.

Donc, cet ensemble de 23 questions semble être un bon indicateur de la similarité invariante entre les genres.

 

Groupe 2 : Grand écart (GDEC), faibles variations (NV)

GDEC NV

2001

             0.06

2002

             0.04

2003

             0.06

2004

             0.05

2005

             0.06

2006

             0.06

2007

             0.06

2008

             0.05

2009

             0.04

2010

             0.05

2011

             0.05

2012

             0.04

2013

             0.05

2014

             0.05

clip_image004

Ce groupe est indexé sur la moyenne de 11 questions avec variation d’écart moyen inférieur ou égal à 0.02 par mois, et écart moyen total supérieur à 0.20

Analyse :  Nous constatons que cet indice change sensiblement pour les femmes et les hommes en 2012/2013. Cette variation n’a pas d’impact sur les variations d’écarts.

Cet indicateur est censé représenter les différences irréductibles (donc physiologiques) entre les hommes et les femmes, et être invariant.

Groupe 3 : Grand écart (GDEC), Grandes variations (GDV)

GDEC GDV

2001

             0.05

2002

             0.08

2003

             0.09

2004

             0.07

2005

             0.11

2006

             0.13

2007

             0.13

2008

             0.15

2009

             0.13

2010

             0.14

2011

             0.14

2012

             0.12

2013

             0.13

2014

             0.11

 

clip_image006

Ce groupe est indexé sur la moyenne de 8 questions avec variation d’écart moyen supérieur ou égal à 0.03 par mois, et écart moyen total supérieur à 0.20

Analyse :  Nous constatons que :

  • L’écart se réduit depuis 2011, après 10 ans de hausse.
  • Les indices séparés Hommes/Femmes ne sont pas du tout synchronisés.

 

Interprétation :

C’est évidement le groupe 3 qui nous intéresse. Autrement dit, l’indice de ce qui est clairement différent entre les genres et variable dans le temps.

L’indice d’écart en lui-même :

Contrairement à ce que l’on aurait pu penser, l’écart entre les hommes et les femmes se creusait depuis les années 2004. Ce n’est que depuis 2011 qu’il semble se réduire.

La courbe des indices par genre nous indique que :

En 2004 , ce sont les hommes qui ont changés de façon non-négligeable, alors que les femmes, elles, ont continué une évolution stable à la baisse.

Autrement dit, si à cette époque les hommes n’avaient pas changé, l’écart culturel/contextuel entre les hommes et les femmes se serait amoindri. Au lieu de cela les hommes, en changeant plus vite, ont augmenté cet écart.

En 2011, il semble que ce soit le contraire qui se passe. Ce sont les femmes qui viennent de changer de façon notable, alors que les hommes, eux, restent stables. L’écart se réduit donc vers les valeurs des hommes, alors qu’avant 2004, c’étaient les hommes qui rejoignaient les valeurs des femmes.

En d’autres termes, sur la question de l’égalité des sexes :

Notre approche nous permet de dire qu’il s’est passé quelque chose en 2003/2004 qui a amené un changement soudain des hommes sur l’ensemble des questions de cet indice. Les femmes n’ont pas réagit à cet événement avec la même amplitude.

De plus, en 2012/2014, les femmes s’approchent de plus en plus de l’indice que les hommes avaient en 2004. Alors que l’indice de ces derniers apparaît stable. Ce qui explique une baisse d’écart.

Il nous semble important de noter que, selon cet indice, de toute évidence :

  • Les hommes et les femmes n’évoluent pas de la même façon
  • Les femmes semblent, sur 12 ans, se rapprocher de l’indice des hommes et non le contraire. Ou tout du moins, plus vite que ces derniers.

Ce qui nous permet de conclure qu’a priori :

  • Globalement, les hommes et les femmes sont plus similaires que divergents
  • Sur les questions de divergences, la tendance est au mouvement des femmes vers les valeurs des hommes et non le contraire.

 

Conclusion

Depuis 12 ans l’indice des femmes se rapproche de celui des hommes (femmes 2014 : 2.26 pts, hommes 2004 : 2.23 pts)

Or l’indice des hommes lui aussi varie à la baisse dans les années 2004, à la hausse faible depuis 2008.

Donc, les femmes vont vers plus d’égalité en s’approchant des valeurs des hommes.

Mais les valeurs des hommes ont changé et changent plus rapidement, ce qui fait varier l’écart final.
Donc, par rapport à notre hypothèse de départ, nous pouvons dire que :

  • Oui, nous allons vers plus d’égalité du fait que les femmes prennent petit à petit les valeurs des hommes.
  • Oui, il y a plus de similarités invariantes que de divergences.
  • Non, dans les chiffres, nous n’allons vers plus d’égalité que depuis peu d’années. Nous nous en sommes largement éloignés depuis le début des années 2000 du fait d’un durcissement soudain des valeurs des hommes vers 2004.

 

Note : nous laissons le soin au lecteur de faire sa propre enquête sur les événements qui pourraient expliquer les variations de l’indice des hommes, car cela n’est pas notre propos.

 

NEC NV : 3, 259, 266, 268, 269, 271, 272, 276, 277, 278, 279, 280, 281, 282, 287, 289, 298, 297, 302, 311, 321, 347, 59

GDEC NV : 245, 250, 253, 254, 264, 284, 306, 323, 340, 349, 97

GDEC GDV : 1 , 291, 305, 318, 319, 330, 336, 82

 

Comptage de la base de donnée exploitable

Un petit aperçu des données disponibles

Sur 647 141 observations (FR,CH,BE,QC) et plus de 130 questions par observation :

Par année : 

  • 2001   : – de 20000
  • 2002 : + de 20000
  • 2003 : + de 20000
  • 2004 : + de 20000
  • 2005 : + de 20000
  • 2006 : + de 20000
  • 2007 : + de 20000
  • 2008 : + de 20000
  • 2009 : + de 20000
  • 2010 : + de 20000
  • 2011 : + de 20000
  • 2012 : + de 20000
  • 2013 : – de 20000 (pénalité google)
  • 2014 : + de 20000 probalement

Par genre :

  • Femme : 404181   soit  62,5 %
  • Homme : 242960   soit  37,5%

Par âge :

0-16 88304 13.6
16-18 109005 16.8
18-25 282886 43.7
25-35 95491 14.8
35-45 43710 6.8
45-55 21212 3.3
55+ 6533 1.0

Par CSP :

NS 31086
Cadres informatiques 11810
Cadres autres secteurs 30841
Chefs d’entreprise 6329
Professions liberales 9805
Professions intellectuelles, artistiques 11485
Chercheurs ou medecins des hopitaux 3132
Enseignants ou personnels de la sante 18195
Etudiants 195691
Collegiens Lyceens 162600
Agriculteurs exploitants 2876
Ouvriers spe ou agricoles 9649
Artisans 4863
Commercants et assimiles 9251
Employes (informatique, telecoms) 11966
Employes de la fonction publique 27450
Employes des entreprises 57167
Retraites et pre-retraites 2117
Chomeurs et inactifs 40828

De l’importance du referentiel

Ref. Cerveau et psycho n°60.
Sur A.Humphreys et al. In journal of consumer research

L’etude porte sur les messages publicitaires des jeux d’argent en ligne. Plus exactement, comment en transformant le mot Gambling (parier) par Gaming (sens ludique) pour exactement le même contenu, le référentiel sémantique étant radicalement différent, les degrés de culpabilité et d’inquiétude le sont aussi.

Une fois de plus, chaque mot compte donc …

Un afflux soudain

Hier soir, 29 mai 2014, il y a eu un gros afflux de tests fait par des 16-25 ans.

Nous surveillons de près ce genre de pic et avons cherché l’origine. Assez rapidement nous avons identifié un article sur un forum de jeux vidéo.

Le message original est un jeune homme qui s’inquiétait d’avoir été positif sur le test de trace de troubles schizoïde. Finalement, il donne dans son billet l’adresse du site (ce qui explique le pic), et, une discussion s’engage avec d’autres jeunes personnes du forum en question.

La suite de l’échange se fait sur 3 pages et nous en retenons deux aspects intéressants:

  • Le premier est que le jeune homme décrit comment il voit régulièrement un psy professionnel, comment il sait qu’il a des réactions « étranges », comment ses parents s’inquiètent etc.
  • Le deuxième est que le discours des intervenants est de dire que « les tests de personnalité sur internet sont nuls » et amoindrir la pertinence (et donc l’inquiétude).

Et c’est là où nous sommes plutôt satisfait. En effet, nous avions hésité à mettre en place les tests de troubles et avions décidé que cela pouvait permettre un déclic. De toute évidence, c’est le cas et aux vues de la description du jeune homme, les résultats du test sont plutôt pertinents. Il est déjà dans un contexte de suivi, il sait qu’il a un problème, et pourtant, ce sont les résultats du test qui l’amène à en parler sur un forum !

Quant à l’image de « Les tests c’est nul », cela nous convient aussi parfaitement pour ce segment dans le sens où il est justement très important pour la « fraicheur » des réponses que ces dernières soient considérées comme dépourvues d’incidence.

Leader ou pas

Et voilà de quoi réfléchir…

Le facteur le plus corrélé, quelles que soient les méthodes de l’analyse factorielle, est un groupe de questions qui reflètent le leadership dans le sens « obéir/commander », comme les animaux.

Il est assez incroyable que l’analyse mathématique, hors théorie, nous sorte ce facteur comme étant le premier.

Une deuxième passe nous a permis de segmenter 4 variations/angles. Les résultats sont étonnants !

Nous avons mis en place cette dimension, que nous appelons « Alpha » et ces 4 variations. D’emblée, il y a d’énormes différences quand on sort les moyennes par CSP.

L’évident se vérifie en chiffres : Les CSP+ ont des moyennes largement supérieures au CSP- ,
Les hommes par rapport aux femmes, les 35-45 par rapport aux autres âges. etc.

De quoi faire de jolies publications.

Analyse factorielle

Après 14 ans d’accumulation de données, nous avons décidé d’épurer la base en enlevant tous les non-francophones, tous les résultats au temps impossible, etc.

Le résultat est une base de donnée propre et exploitable de plus de 650 000 observations.

La boite de pandore !

Nous commençons un long travail d’analyse de données avec cet angle particulier : Lancer des analyses factorielles géantes impliquant toutes les observations et toutes les questions…

Les résultats sont prometteurs.