
Sandrine Vanessa T. a posé une question
dans le live chat KPMG Live Chat Advisory
à KPMG France (Equipe RH)
Bonjour
Nous intervenons dans tous les secteurs, pour répondre à tout type de besoins

Je vous remerci pour votre réponse

Je suis en dernière année à Centrale de Paris Option mathématiques appliquées aux Data Sciences et en alternance depuis 2016 au sien de l'équipe Big Data de AXA Global Direct Franc.
C'est un parcours intéressant !
Sur quel type de projet as-tu travaillé au cours de cette alternance ?

J'ai travaillé principalement sur deux problématiques :

Durant la première partie de mon alternance j'ai travaillé sur la détection de fraude en assurance
Intéressant, donc de la classification. Quelle type d'approche as-tu évalué ?

La deuxième partie concerne l'optimisation de l'orientation des véhicules sinistrés vers les garages partenaires.

¨En ce qui concerne la détection de fraude en assurance : Nous disposons chez axa d'une base des sinistres survenus les 5 dernières années
Quels sont les critères de selection pour un poste de consultant chez KPMG ,?

Dans cette base, très peu de sinistre sont labellisés j'ai développer un premier modèle de classification
Comment as-tu géré le problème de classe minoritaire ?
Car, je suis consultant ERP Oracle financials cloud spécialisé : procurement/ payables and cash management

Dans ce modèle, j'ai fait comme hypothèses que tous les sinistres non labellisés sont considérés comme non frauduleux. et j'ai entrainé un modèle qui est actuellment en productions.
Bonjour Ernst, merci de poster tes messages en dehors des conversations engagées.

Afin d'améliorer les perfomances du modèle, j'ai développé dans un second temps un modèle d'apprentissag semi-supervisé
Avec quel type de modèle ?

Dans le cas supervisé c'est un modèle de random forest
Je vois. Mais les cas de fraude sont très minoritaires, non ?
Comment as-tu résolu ce problème ?
T'es-tu appuyée sur le taux de bonnes classifications ?

Oui nous avons environ 3% de frauduleux dans toute la base.
Donc un modèle qui classe tous les cas comme non frauduleux, aurait 97 % de bonnes prédictions, non ? :)
Comment résoudre ce problème ?

J'évalue mon modèle sur sa capacité à bien classé les frauduleux
Je vois. Et quelle performance finalement ?

J'ai 0.8 de rappel
Pas mal !

Je pourrai vous faire une présentation de mes travaux si vous me donner l'occasion
Et bien de considérer le recall plutôt que l'accuracy.
Si tu nous adresses ton CV, tu auras clairement cette opportunité.

Non non l'accuracy serait biaisé ici pollué par les non frauduleux
Nous avons un certain nombre de postes juniors data scientists ouverts, à partir de septembre.
Les recrutements se déroulent actuellement.

Je suis en recherche d'un poste disponible à partir d'octobre date de la fin de mon stage de fin d'études
Dans ce cas, je te propose de candidater via notre site !!

Comment se déroule le processus de recrutement?
Il y a une première analyse des CVs par notre département RH, puis par moi, personnellement.
Je propose ensuite un premier entretien
Il sera suivi d'un test d'anglais (il faut au moins 3/5), puis d'un 2nd entretien avec un partner.

D'accord grand merci pour les informations
Merci à toi pour cette discussion.

Je me permet de te demander si je peux t'envoyer mon CV par mail?
Non malheureusement, pas directement.
Et de toute façon, je serais obligé de le transmettre aux RH pour qu'un dossier de candidature soit créé.
Mais au vu de ton parcours, aucun doute que ton CV passera les filtres.

D'accord je vais postuler sur le site internet.
No service RH est très attentif !

J'aimerai savoir qu'est ce qui différencie KPMG des autres Big Four?
Quel est ton avis sur la question ? :)

En ce qui concerne la Data Science, des informations que j'ai lu sur internet et des échanges avec des camarades et des amis qui travaillent chez vous, vous êtes assez avacé

Avancé
C'est le cas en effet. Nous avons 3 PhD dans l'équipe (dont moi)

Mais votre point de vu m'éclaircira davantage.
Et nous abordons tout type de sujet, avec tout type d'approche, y compris du NLP avec des nnets
Pas sûr que mon avis t'éclaire. Il risque de ne pas être tout à fait objectif, non ?

Au moins je saurai ce qui est fait chez KPMG.

Avant que la discussion ne se termine je vous remercie pour votre écoute et le temps accordé.
Merci à toi pour ta visite :)

En espérant te rencontrer et te présenter de vive voix mes travaux.

Bonne soirée.
Rapidement sur ce que nous faisons : les problèmes de regression (linéaires, et non linéaires)
Classification, supervisée et non supervisée
Geolocaisation
Natural language processing (NLP)

Il y'a de la diversité. Super intéressant

Encore merci. Bonne soirée