Une autre perspective sur le big data : les assureurs ont statistiquement raison, ils ont socialement tort

Je ne parlerai pas ici du Big Data comme on a l’habitude de le faire en ce moment. Je ne le ferai pas dans la mesure où les articles sur le sujet sont nombreux. J’aborderai plutôt le sujet à la lumière de la décision récente de la Cour de Justice de l’Union Européenne sur la discrimination en matière de « genre ».

Le coup de tonnerre de la décision de la CJUE

La décision de la Cour de Justice de l’Union Européenne du 1er mars 2012 à propos de la « gender directive » a été vue par de nombreux assureurs comme une décision dangereuse pour l’avenir de la profession, l’association Belge des assureurs (pays d’origine de la question préjudicielle) y a vu « La recherche aveugle d’une égalité absolue », le CEA y voit « une mauvaise nouvelle pour les assurés », l’assureur RSA une « décision contraire au bon sens ». Ces réactions sont peut être légitimes, nous avons largement débattu de cette décision dans un article précédent[1], je n’y reviendrai pas.

Je voudrais plutôt voir dans cette décision la transcription en termes légaux d’un sentiment peut être répandu dans le public, dont la Cour se serait contentée de faire l’interprète et qui nous amènera sans doute à parler des données, de l’augmentation de leur volume disponible et de l’utilisation que nous pourrions en faire.

Les assureurs ont statistiquement raison

Les assureurs ont pour fonction d’organiser des mutualisations entre les risques. Ils avaient choisi depuis de nombreuses années de le faire sur la base de variables sociodémographiques, simples et facilement identifiables au rang desquelles, entre autres et pour l’assurance automobile, le sexe, mais aussi le lieu d’habitation ou l’ancienneté du permis[2].

Le choix de tarifer par sexe offre de nombreux avantages : simplicité de recueil de l’information, existence de corrélation entre risque et variable choisie. Mais il ne faut jamais oublier que ces critères ne sont que des indicateurs de l’exposition de l’assureur aux risques. Il ne s’agit pas de facteurs de causalité : on n’a pas moins d’accident parce qu’on est une femme. Le critère « femme » rend compte d’un comportement moyen en matière de conduite qui conduit à moins d’accident que les hommes. Aucun assureur ou constructeur automobile ne garantira que toute femme soit meilleur conductrice qu’un homme choisit au hasard. De la même manière tout jeune n’est pas, du seul fait de son âge, un plus mauvais conducteur qu’un sénior.

Le problème n’est pas si différent dans les assurances de personnes. Si l’âge reste un facteur qui rend évidemment bien compte de l’évolution moyenne de la sinistralité, il n’en est pas un prédicteur unique et absolu : une femme fumeuse invétérée sera plus à risque qu’un homme non fumeur du même âge, un jeune à « obésité morbide »[3] aura une sinistralité élevé.

Les assureurs ont politiquement tort

L’opinion attachée à la décision de la Cour de Justice[4] ne dit pas autre chose quand elle mentionne à l’attendu 61 que les assureurs font « tout au plus… une supposition générale » que la différence dans les modes de conduite automobile ou l’utilisation des services médicaux est liée au sexe ; ou encore à l’attendu 62 où l’avocat général mentionne de nombreux autres critères qui influencent la sinistralité (la profession, l’alimentation, la consommation de stimulants, la pratique du sport, les loisirs).

Le sexe, s’il est un indicateur efficace de la sinistralité, n’en reste pas moins un indicateur, et c’est bien là que le bât blesse. L’avocat général parle à l’attendu 61, d’une « différence (de sinistralité) qui n’apparaît que sur le plan statistique » sans que les assureurs prouvent que « leur inclination (des femmes ou des hommes) inégale à prendre des risques dans le trafic ou à recourir à des prestations médicales trouveraient leur origine dans leur sexe de manière déterminante. »

Dans leur défense du droit à utiliser des variables générales, les assureurs ne cessent d’invoquer des concepts complexes, peu accessibles au grand public. Dans un document publié en novembre 2012, le CRO Forum[5] oppose la « discrimination », de connotation négative, à la « différentiation ». Les arguments utilisés sont solides mais ils ne semblent pas réaliser qu’un des postulats « the underwriting process results in risks being allocated to an appropriate, pre-determined pool of standard risks » est peut être source des problèmes actuels. L’ensemble du document du CRO repose sur la nécessité technique de créer des groupes « standards », il fait peu de cas de l’acceptabilité par les consommateurs de ces groupes et de l’affectation de chaque individu à ces groupes.

Or ce regroupement par classe peut être ressenti comme non légitime par les intéressés et en contradiction avec les comportements qu’ils observent[6]. Dans ce cas, cette classification devient socialement inacceptable. Cette idée transparait dans l’attendu 63 qui note que les changements dans les rôles sociaux traditionnels entre les sexes ne permet plus de lier mécaniquement sexe et comportement : « aussi bien les femmes que les hommes exercent de nos jours des activités professionnelles de haut niveau qui sont parfois extrêmement stressantes[7] … Le type de sport pratiqué et l’intensité de cette pratique ne peuvent plus, eux non plus, être d’emblée rattachés à l’appartenance à l’un ou à l’autre sexe ». L’individualisation des attentes des clients et de leurs besoins, leur plus grande difficulté à s’insérer dans des cadres « institutionnels », ne font que renforcer ce refus de rattachement.

Ce que les assureurs avaient sans doute oublié dans les « belles années » de la tarification sélection « libre » c’est que la classification des individus repose sur une acceptation de cette classification.

Comment, par quelle magie crée t on cette acceptation ? C’est une question sans vraie réponse. ? Mais aujourd’hui les raisons de refuser les classifications « traditionnelles » sont nombreuses :

le doute concernant les « institutions »

Le refus des grandes fidélités institutionnelles et traditionnelles grandit. Les réseaux sociaux ont substitué aux groupes « verticaux » des groupes « horizontaux ». Même si on peut discuter la réalité des solidarités « horizontales » leur solidité (veut on faire beaucoup plus sur Facebook que mettre ses photos de vacances ?), il n’empêche que les catégorisations « institutionnelles » ont été « entamées » par l’émergence des nouvelles technologies. Et les assureurs ne seront pas les derniers à subir le refus des groupes « verticaux » qu’ils ont organisés. Pourquoi dois je me sentir solidaire du mauvais conducteur ? du fumeur invétéré ? du buveur ? du mauvais propriétaire ? On mesure mieux aujourd’hui la nécessité d’un appareil idéologique puissant pour faire accepter ce genre de solidarité.

l’individualisation des offres marketing

L’homme de marketing ne cesse de poursuivre son rêve de toujours : une segmentation pour laquelle « chaque client est un segment ». il est servi dans de nombreux domaines par la flexibilité accrue des outils de production et la publicité ne cesse de lui dire qu’il est unique et qu’il va donc avoir un produit unique. C’est un discours qu’il comprend et qui correspond au refus d’être mis dans une case à laquelle il n’adhère pas.

le refus des exclusions

La fin de l’acceptation des solidarités traditionnelles s’accompagne paradoxalement d’un refus de l’exclusion. Si l’assuré n’accepte plus aussi aisément de voir son sort lié à celui d’un individu moyen dans lequel il ne se reconnait pas, il refuse de la même façon l’exclusion de tout un chacun.

La grande perdante de cette bataille, c’est la moyenne. On l’a souvent dit dans ces colonnes, la philosophie de la variance a remplacé la philosophie de la moyenne[8]. Voire plus, la moyenne est devenue une chose quasi inacceptable.

Mais cette philosophie de la moyenne était fille de la pauvreté des données. Sans donnée, il faut faire avec des concepts simples, il faut favoriser la moyenne. L’utilisation de la variance, la prise en compte des variations autour de la moyenne supposent d’avoir à disposition des données nombreuses et précises.

Ainsi, à l’instant même où les assureurs voient leurs méthodes traditionnelles de classification mises en cause, la nature, les marchés, l’évolution leur offrent la possibilité de re construire leur modèle d’une manière plus adaptée à la donnes actuelle.

Le Big Data au secours des assureurs

Ainsi le client d’assurance ne ressent-il plus comme légitime d’être intégré dans un groupe dont il ne pense pas partager les comportements[9]. L’affaiblissement du lien affinitaire, qui permettait d’accepter une prime déterminée par de grandes catégories socio économiques, laisse la place à une volonté de tarification plus liée à « mon » comportement personnel.

il faut donc pour les assureurs abandonner progressivement les variables socio économiques pour recourir aux variables de comportement. Car la tarification au comportement échappe naturellement aux critiques précédentes. Je ne suis pas sur tarifé parce que je suis un homme, je le suis parce que je conduis la nuit. Il est difficile de refuser une telle classification.

La solution pour les assureurs c’est la tarification à base comportementale : primes liés aux nombres de kilomètres parcourus, tarif « fumeurs /non fumeurs », tarif liés à un mode de vie[10]. C’est bien ici qu’intervient le « Big Data ». Il met à disposition des assureurs une grande quantité de variables à même de prendre la place des variables socio économiques utilisées pendant tant d’années.

Ces variables sont devenus abondantes grâce aux évolutions de la technologie, qui rendent le suivi du kilométrage ou des habitudes de vie plus simples et permettent un recueil sans biais. Ainsi, le comportement, aujourd’hui souvent pris en compte dans les critères de sélection du risque, pourrait être progressivement « remonté » dans la tarification.

Grace au Big Data (ou à cause de lui ?), l’assureur a à disposition les moyens de soritr d’un monde où sa relation avec l’assuré se caractérise par le sentiment « affinitaire » institutionnel, et le calcul basé sur des variables socio économiques. Il peut créer un monde fondé sur une relation plus individualisée avec des calculs liés directement aux comportements.

Toutefois ce passage ne sera possible qu’à la condition que les clients acceptent que les données individuelles les concernant soient à disposition des assureurs. Pour l’obtenir les assureurs doivent dès aujourd’hui investir en pédagogie, rendre plus lisibles les mécanismes de leur industrie et inventer d’autres mécanismes de tarification et de transparence.

[1] article de R Durand dans la revue Risques :  »

[2] On notera toutefois avec intérêt que le critère de comportement le plus important en assurance automobile (la sinistralité) a été imposé aux assureurs par la loi : il s’agit du coefficient de réduction majoration… qui a été largement distordu ces dernières années par ces mêmes assureurs.

[3] Avec un indice de masse corporelle supérieur à 40.

[4] Case C 236/09

[5] « the right to underwrite » novembre 2012

[6] Sentiment renforcé par la « loi des petits nombres » mentionnée par Tversky et Kahneman (1972)

[7] en français dans le texte…

[8] Dans un autre domaine de l’assurance, l’évaluation de la solvabilité on assiste au meme phénomène qui crée lui aussi des incompréhensions profondes.

[9] On pourrait dire sous forme de boutade : Pourquoi payer une prime d’assurance supérieure alors quand on pense mieux conduire que sa femme ?

[10] voir les produits de Discovery en Afrique du Sud.