Le rôle de l’IA dans l’industrie PEO vers 2019 – Deuxième partie

Frank Huang, chef des solutions actuarielles en dommages corporels

22 octobre 2019

Dans la première partie de cet article, nous avons discuté du paysage des PEO pour voir si l’IA était vraiment aussi répandue que les départements marketing et ventes le laissent croire. Bien que nous ne puissions pas voir tout ce qui se passe sur le marché, l’IA semble être utilisée de façon confuse pour désigner d’autres formes d’analytique, et généralement vers l’extrémité la plus fondamentale du spectre analytique.

Cela soulève quelques autres questions que j’aimerais aborder dans la deuxième partie de cet article. À savoir :

Quelles différences est-ce que je remarque même dans la même catégorie d’analytique, par exemple prédictive ou prescriptive?
Quel est le potentiel de l’analytique dans l’industrie des PEO?
Quel est l’état actuel et futur potentiel de la réglementation dans l’industrie?

Plus de clarifications sur la confusion

Pour un petit rappel, voici comment nous avons décrit les différents types d’analytique dans la première partie de l’article :

Description – « Il s’est passé quelque chose? »
Diagnostic – « Ah, oui. Il s’est passé quelque chose... qu’est-ce qui s’est passé? »
Prédictif – « Ça va se reproduire. Je suppose que ça va arriver... tiens. »
Prescriptif – « Si ça doit arriver ici, faisons quelque chose! »

Avant de passer à la suite de l’article, il faut ajouter quelques définitions supplémentaires :

L’intelligence artificielle (IA) est généralement définie comme un ordinateur capable d’accomplir des tâches semblables à celles des humains, par exemple la perception, le raisonnement, l’apprentissage, etc.
L’apprentissage automatique (ML) est un sous-ensemble de l’IA et représente comment les ordinateurs peuvent apprendre à faire quelque chose sans instructions explicites. En apprentissage automatique, il existe à la fois un apprentissage supervisé et non supervisé.
L’apprentissage supervisé couvre la construction de modèles basés sur un ensemble de données qui contient à la fois des entrées et une sortie désirée. Le modélisateur donne une certaine direction, mais c’est l’ordinateur qui fait la majeure partie du travail de calcul. Les modèles de classification et de régression entrent dans cette catégorie.
L’apprentissage non supervisé couvre la construction de modèles basés sur un ensemble de données qui ne contient que des entrées et aucune sortie identifiée. L’ordinateur étudie et découvre des motifs et des regroupements par lui-même. Des exemples d’apprentissage non supervisé incluent le regroupement, la détection d’anomalies, les techniques de réduction de dimension, les réseaux de neurones, et plus encore.

L’IA, en bref, couvre beaucoup de domaines et de techniques différentes. Et parce que l’IA et l’apprentissage automatique sont utilisés de façon interchangeable, il est facile pour les gens de se tromper sur ce qui constitue une « vraie » IA. Pour les besoins de cet article – et peut-être pour mieux clarifier ma conclusion de la première partie – je définis l’IA comme des modèles principalement pilotés^{par un} apprentissage non supervisé.

Moteurs de la performance du modèle

Maintenant que nous sommes mieux informés sur les différents types d’analytique et ce qu’est réellement l’IA, on s’attendrait à une homogénéité de performance et de résultats dans cette seule catégorie d’analytique. Mais ce n’est pas tout à fait vrai. Il peut y avoir de grandes différences entre deux modèles pour trois raisons principales.

Qu’est-ce qu’il y a sous le capot. Il est important de comprendre quel type de moteur fonctionne sous le capot. Le marketing pourrait vouloir vous faire croire que vous avez un moteur Tesla S P100D entièrement électrique qui va de 0 à 60 en 2,3 secondes alors qu’en réalité, vous avez un moteur Toyota Corolla qui roule à 60 mi/h en un très patient 9,9 secondes.

En langage nerd, il s’agit de demander quelle est la méthode statistique sous-jacente. Puisque nous sommes d’accord que l’IA – plus précisément les techniques non supervisées – n’est pas largement utilisée dans l’industrie des PEO, cela nous laisse avec des modèles de régression et de classification plus courants. Les moteurs utilisés ici sont principalement linéaires ou un modèle linéaire généralisé (GLM).

Une comparaison complète des deux dépasse le cadre de cet article, mais vous pouvez considérer un modèle linéaire comme un carré et un GLM comme un rectangle. Tout comme un rectangle ne se limite pas à avoir les quatre côtés de la même longueur, un GLM n’est pas limité de la même façon qu’un modèle linéaire. En pratique, cela permet au GLM de traiter des données plus réalistes et réelles que celles qu’un modèle linéaire serait mal équipé pour gérer. Nous voyons cela se manifester dans divers problèmes^{d’assurance 2}, où ils sont utilisés pour prédire la fréquence, la gravité et la prime pure. Nous observons cela aussi à travers tout le spectre des risques auxquels le PEO est impliqué, comme l’indemnisation des travailleurs, les prestations de santé, l’EPLI, etc.

À quel point la mécanique est-elle bonne. Un autre facteur majeur déterminant l’efficacité d’un modèle est l’expérience et la créativité du modélisateur. Toutes choses égales par contre, un modélisateur avec plus d’expérience (et bien formé) devrait pouvoir construire un meilleur modèle qu’un modélisateur avec moins d’expérience.

Alors que l’expérience et la formation parlent du modélisme comme une science, la créativité en tant que caractéristique signifie que le modélisme est un art. Même avec le même type de données (par exemple, l’indemnisation des travailleurs), il peut y avoir des imprévus dans l’ensemble de données actuel qui nécessitent une approche complètement nouvelle pour le modélisateur. Un modélisateur créatif sera capable d’identifier et de tirer parti de ces nuances pour assurer un modèle solide et efficace.

Qui conduit. Le dernier facteur qui pourrait entraîner une différence significative dans l’efficacité d’un modèle est l’utilisateur du modèle lui-même.

Les utilisateurs n’ont pas besoin de comprendre toutes les mathématiques et statistiques derrière le développement du modèle, mais ils doivent comprendre les résultats du modèle, où il y a certitude et où il y a ambiguïté. Une grande partie de cela devrait être communiquée du côté du modélisateur, mais des tiers peuvent aider dans ce domaine.

Au final, mettre un conducteur inexpérimenté au volant d’un véhicule avec un moteur sous-puissant monté à la hâte peut mener à une expérience de conduite moins fluide et peut-être même empêcher le conducteur d’arriver à sa destination finale. En réalité, une telle situation pourrait entraîner des décisions non rentables. En raison des conséquences potentielles, les PEO devraient examiner soigneusement toute analyse développée ou acquise et s’assurer que tous les utilisateurs finaux sont correctement formés.

Le potentiel de l’analytique (et de la réglementation) dans l’industrie du PEO

Comme je l’ai mentionné dans mon premier billet de blogue, les données disponibles au sein d’un PEO – et dans l’industrie des PEO – sont uniques. Aucune autre industrie ne possède la même étendue ou profondeur de données que l’industrie PEO. Alors que les économistes doivent s’appuyer sur des sondages et des ensembles d’échantillons de données sur l’emploi et les salaires, les PEO disposent de données réelles qui pourraient éclipser les tailles d’échantillon gouvernementales³. Ajoutez à cela le fait qu’ils disposent aussi de données liées aux RH, aux avantages sociaux, au 401k et à d’autres choix personnels, et que la possibilité de construire des solutions analytiques vraiment robustes et novatrices est pratiquement illimitée.

L’occasion de faire le bien vient aussi avec l’occasion de faire moins bien. Malgré les règlements provinciaux et fédéraux existants qui régissent l’utilisation des données et leur utilisation dans la modélisation, il existe de nombreux autres pièges potentiels pour l’industrie du PEO. Par exemple, un modélisateur pourrait utiliser des informations qu’il/elle pourrait ne pas être autorisé à utiliser, il peut y avoir des problèmes moraux à utiliser certaines variables, et il peut y avoir une discrimination intentionnelle ou non basée sur la conception du^{modèle 4}.

En raison des nombreux problèmes potentiels qui peuvent survenir, je suis surpris qu’il y ait relativement peu de réglementation et de surveillance. Les industries de l’assurance et des hypothèques ont de nombreuses fonctions similaires à celles de l’industrie du PEO – comme la souscription et la fixation des taux – et pourtant, tant les assureurs que les prêteurs sont plus scrutés, tant au niveau provincial^{qu’au niveau fédéral 5}. À mesure que l’industrie des PEO évolue et utilise mieux ses programmes de données et de risques, je prévois qu’une réglementation accrue suivra^{la suite 6}.

Conclusion

Il y a tellement d’opportunités pour l’analytique d’améliorer le mode de vie des PEO tels qu’ils le connaissent, il est donc impératif que la direction comprenne ce pour quoi est développé et vendu. Nous avons trouvé de la valeur dans chaque modèle que nous avons vu dans l’industrie PEO, qui est la plupart, mais peut-être pas tous, utilisés dans l’industrie. Nos recommandations lors de l’examen de vos nombreuses options sont de vous assurer que vous savez quels sont les produits, et quels ne sont pas, afin de prendre la meilleure décision possible pour votre PEO.

Points à retenir

Qu’est-ce qu’il y a sous le capot de l’analytique que vous utilisez actuellement?
Que prévoyez-vous comme prochain produit basé sur les données que les PEO offriront à leurs clients?
Pensez-vous que l’industrie des PEO est surréglementée, sous-réglementée ou correctement réglementée? Où voyez-vous cela dans le futur?
L’industrie du PEO peut-elle être efficacement autorégulée?

[1] Il est courant qu’un seul modèle contienne à la fois des techniques supervisées et non supervisées.
[2] Par exemple, le National Council on Compensation Insurance (NCCI) utilise les GLM dans l’élaboration de leurs tarifs.
[3] Par exemple, ADP seule a des données sur 1 chèque de paie sur 6 aux États-Unis.
[4] Veuillez noter que nous ne sommes pas avocats de métier et ne sommes donc pas au courant de toutes les questions juridiques et des implications liées à cette discussion.
[5] Il est vrai qu’une grande partie de cela est due à la nature involontaire de ces produits, mais on peut soutenir que la collecte plus large de données PEO pourrait mener à des scénarios plus préoccupants.
[6] En aparté, NAPEO a fait un bon travail en étant proactif tant au niveau fédéral qu’étatique pour s’assurer que le PEO croît de manière responsable et continue de réussir.