Trouvez les meilleurs freelances techs pour vos équipes dans la semaine

Y. A.
Data Scientist - Formateur Data (Python, R, Machine Learning)
Paris, Île-de-France, France
Pandas
Scikit-learn
SAS
Azure Machine Learning
MySQL
R Shiny
Python
MongoDB
Tableau
BigQuery
Ingénieur de formation, Consultant Data Scientist avec cinq ans d’expérience et formateur data. Je forme des apprenants aux métiers de la data ( Data analyst et Data scientist). Je construis, mets en place et anime ces formations que ce soient en organisme de formation, en entreprise ou en école.
J'ai travaillé récemment chez Orange sur des problématiques de data science et de Machine Learning appliquées au domaine de l’intervention. Passionné par les statistiques et la programmation, je ne ménage pas mes efforts pour expliquer des concepts complexes dans les termes les plus simples. Python et R sont mes armes de prédilections.
D’un naturel avenant, je suis force de proposition, méthodique et rigoureux. Je saurai être à l’écoute de mes interlocuteurs tout en prenant en compte les contraintes du projet afin de construire un accompagnement sur mesure.
Je suis enfin l'auteur d'un blog sur les data sciences et leurs applications.
Je recherche des missions en:
* Python
* Machine learning
* Deep learning
2-5 ans
d'expérience700€
par jour9
expériencesAucun
avis laisséPréférences de missions
Recherche une mission freelance
Préfère travailler dans vos locaux
Sur des missions ≤ 1 semaine, entre 1 et 3 mois, entre 3 et 6 mois, ≥ 6 mois, ≤ 1 mois
Expériences
févr.2020—juil.2021
1 an et 6 mois

data_scientist
IA School
Pandas
Scikit-learn
Python
Tableau
SAS
De Février à fin Mai, j'ai enseigné l'IA à des étudiants ingénieurs (25 étudiants) à l'IA School (Boulogne-Billancourt) de février à Mai à temps partiel
J'ai contruit des cours "axés" pratiques avec projets en Python:
- Cours 1: Analyse des données avec Python (Pandas, Matplotlib, Seaborn, Beautiful Soup: Scrapping de données)
- Cours 2: Apprentissage automatique: Algorithme de régression et de classification (Forêt aléatoire, KNN, Lasso, Ridge, Elastic Net)
- Cours 3: Deep Learning: Algorithme de Deep Learning LSTM, RNN et CNN (Reconnaissance d'image et de Son) et Transfert Learning: VGG16, GoogleNet, ImageNet, et autres
Depuis Juin 2020, je suis Référent IA au sein de l'IA school, une école d'ingénieur située à Boulogne-Bilancourt. J'ai réalisé un certain nombre d'action comme la:
- Construction du programme pédagogique des Bachelor 1, 2 et 3.
- Construction de deux masters Data Analyst et Data Scientist
- Mise en place de partenariat entre l'école et SAS (Certification SAS Base, Advanced, ML, Viya)
- Recrutement des intervenants IA pour la rentrée 2020
juil.2019—juil.2020
1 an et 1 mois
data_scientist
Simplon.co
Python
R Language
Scikit-learn
Pandas
MySQL
MongoDB
RStudio
R Shiny
Simplon est un organisme de formation qui se propose de former des apprenants aux différents métiers du numériques. La particularité de cet organisme est qu'il permet à tous et à toutes de se former sur ces technologies indépendamment de leur niveau d'étude et de leur parcours professionnel.
Je suis, depuis Juillet 2019, formateur chez Simplon.co. Je forme des apprenants aux métiers de la data. Que ce soient les data analyst ou les data scientist, je construis, mets en place et anime ces formations permettant à un public novice, d'acquérir les bases de la programmation R, Python, SQL et Mongo ainsi qu’en analyse de données. (En machine learning pour les promotions data scientist)
Les formations sont basées sur la mise en pratique. Les exercices et projets concret, sur des données réelles, permettent aux apprenants de mieux appréhender la réalité de leur futur métier.
Ma solide expérience en data m'a permis de mener à bien ces 4 promotions de data analyst et de data scientist. La dernière s'est terminée le 16 Juin 2020.
Voici un descriptif des formations que j'ai pu mener :
- Lead Formateur pour une promotion de 24 Data Analyst de Novembre à juin 2020 à Elancourt (78)
- Formateur pour une promotion de 24 Data Scientist d'Août à Janvier 2020 à Ecouen en partenariat avec Microsoft
- Formateur pour une promotion de 24 Data Analyst en Août 2019 à Nanterre
- Formateur pour une promotion de 24 Data Analyst en Juilley 2019 à Elancourt (Premier promotion data à Elancourt)
Description des formations:
Formation de session de 24 apprenants aux métiers de la data analyse et de la data science sur Python, R et SQL (Cursus de 7 mois).
Cursus Data Artisan (Data Analyst):
* Formation R
* Formation SQL
* Formation Python
* Formation Analyse de données
Cursus Data IA (Data Scientist):
* Formation R
* Formation SQL
* Formation Python
* Formation Analyse de données
* Formation Machine Learning
Certification Simplon:
- Mener une formation en Pédagogie Active
mai2019—juin2019
2 mois
data_scientist
celio
Python
SQL Server
J'ai travaillé en tant que Data Scientist au sein de la direction CRM de Celio. J'ai crée et améliorer des scripts permettant le calcul des principaux KPIs hebdomadaires, mensuels et annuels du groupe.
Techno:
- SQL server
- Python
- R
févr.2019—avr.2019
3 mois

data_scientist
Estia
Python
Keras
PyTorch
Exploration des applications inhérentes au Deep Learning dans le cadre d’un besoin interne.
Reconnaissance d'image sur un projet Kaggle « dog vs cat »). (Classification d’image selon deux modalités 'chien' ou 'chat')
Réalisations
• Etat de l'art sur les algorithmes de Deep Learning classiques (Neural Network, CNN, RNN...
• Etat de l'art sur les algorithmes de Transfert Learning (Inception ResNetV2
VGG_16, Inception_V3, ResNet50, MobileNet, Xception)
• Classification à l'aide de CNN classique (Keras)
• Benchmark des algorithmes de transfert Learning sur la base de données dog vs cat (Inception ResNetV2, VGG_16, Inception_V3, ResNet50, MobileNet)
• Rédaction d'un notebook de formation sur les CNN et les algorithmes de Transfert Learning
• Classification de la base MNIST à l'aide de Pytorch (Exploration de la libraire)
• Rédaction d'un notebook de formation sur une librairie de reconnaissance d’image : Open CV (filtre gradient, canny edge, haar cascade...)
• Développement d’un algorithme de reconnaissance faciale en Python
• Rédaction de notebook de formation sur la classification de genre de musique à l’aide du deep learning (Music recognition)
Environnement Technique : Anaconda Python (Pandas, Keras, Sckilearn, Numpy, SciPy), Tensorflow, Jupyter Notebook
nov.2018—nov.2018
1 mois
data_scientist
Milleis Banque
SAS
Python
SQL
La banque Millies est une nouvelle banque crée à la suite du rachat de la filière de Barclays France par un Fond d'investissement. Elle compte plus de 100 000 clients en France et dans le monde. Identification des clients à « haut potentiel » à partir des données clients (revenu, CSP, encours, patrimoine...)
Valeur ajoutée
J'ai réalisé des analyses de données (ACP, ACM...) sur les données bancaires en SAS afin d'établir des profils de clients les plus susceptible de devenir des clients à "Haut potentiel".
Réalisations:
• Exploration des données sous SAS
• Création d'une table de synthèse regroupant les données (Produit, Client, Matricule, Matricule famille, KYC, Patrimoine, Avoir contrôlé...)
• Analyse statistique sur les variables
• Détection des outliers et valeurs aberrantes pour chacune des variables.
• Croisement de données du type Age x Revenu, Revenu x CSP
• Création de nouvelles variables (Ancienneté...)
• Visualisation de données
Environnement Technique : SAS, SQL
avr.2018—oct.2018
7 mois
data_scientist
BNP Paribas
VBA
Création et déploiement d’un outil tactique de saisie des contrôles et des évaluations des risques (RCSA) dans l’ensemble des business unit et entités de BNP en France et dans le monde, suite à une recommandation de la BCE.
Valeur ajoutée
Développement d’application
Réalisations
• Recueil et analyse des besoins des équipes
• Proposition et chiffrage des solutions techniques
• Conception et développement de l'outil tactique en Excel/VBA pour :
- L'évaluation du risque inhérent à partir des incidents historiques, des Near misses, des incidents potentiels, des incidents externes, de la fréquence d'apparition et de la sévérité (Montant)
- La mise en place de control LoD1, LoD2, recommandation, permanent control action pour diminuer le risque inhérent
- Le calcul du risque résiduel qui découle de la mise en place des contrôles
- La synthèse de l'ensemble des RCSA par BU et risque
• Maintenance évolutive des outils et support aux utilisateurs
• Présentation de l'outils aux différentes entités (CIB, ARVAL, Global Market...) en anglais
• Elaboration de la documentation de l'outil
• Construction d'une macro de compilation de l'ensemble des RCSA permettant d'alimenter l'outil cible
Environnement Technique : VBA, Excel
août2017—mars2018
8 mois

data_scientist
Orange
R Language
R
Python
Pandas
Scikit-learn
NumPy
Hadoop
Power BI
Data scientist au sein de la direction des interventions du groupe Orange, j'y ai réalisé divers missions d'analyse de données et de prédictions.
La première consistait à analyser des données liées aux interventions réalisées par les techniciens Orange. (Pose de live box, de cable de fibre optique etc...) pour déterminer les caractéristiques de celle qui ne se terminaient pas correctment. Dans un second temps, j'ai mis en place un algortihme de Machine learning en Python pour prédire ces défauts d'interventions.
La deuxième mission machine learning consistait à créer un outil d'aide à la décision permettant d'anticiper le paiement de pénalités aux opérateurs tiers (non-Orange) en cas de défaillance (anomalie) d'une ligne dégroupée.
Enfin la derniere portait sur la prédiction du nombre de technicien (ETR) à engeger à Orange à l'horizon de 6, 12 et 18 mois (Approche série temporelle).
Réalisations:
Mission à Orange - Direction des interventions :
• Projet 1 : Etude de faisabilité sur la clôture automatique des interventions réalisées par les techniciens Orange à l'aide du Machine Learning (Projet Oneclic)
• Projet 2 : Création d'un outil d'aide à la décision permettant d'anticiper le paiement de pénalités aux opérateurs tiers (non-Orange) en cas de défaillance (anomalie) d'une ligne dégroupée
• Projet 3 : Prévision du nombre d'interventions pour chacune des entités territoriales d'Orange
Exemple de taches réalisées lors de ces projets :
• Recueil des besoins auprès des différents métiers
• Analyse statistique et table de cohérence sur les données de clôture technicien (Code_releve, code_lieu...)
• Requête hebdomadaire et reporting sur le nombre de technicien (ETR) ayant complété le sondage technicien sous HiveQL
• Etat de l'art et documentation sur le moyen de requêter en Python sur Hive
Présentation de ce document à l'ensemble des data miners DERS du groupe Orange (Session interne)
• Prédiction de la variable « volume » : modèles statistiques et économétriques (lissage exponentiel, HoltWinters, ARIMA, BATS) avec HiveQL, Python (Pandas, Scikit-learn), R (prévision) et Excel
• Création d'une table de synthèse des données sous Hive incluant uniquement les interventions dégroupées et les données liées à l'intervention
• Prédiction des variables « Rangs » et « Code de clôture » à l'aide de l'algorithme Random Forest. (HiveQL et Python)
• Formation des équipes Datamining d’Orange (DESS) lors d’un webex mensuel, sur le moyen de requêter en Python sur le DataHub (Le but étant de contourner Hive et Hue)
Environnement Technique : R (tseries, forecast, ggplot2), Anaconda Python (Scikit learn, Pandas, numpy), Hive, Hue, PowerBI, VBA, HiveQL, SQL, Excel
juin2017—juin2017
1 mois
data_scientist
Havas Media Group
SAS
VBA
Mission 1: CSA Data Consulting - HAVAS Group (Un mois)
Projet de marketing:
j'ai travailé au sein de l'entité data du groupe Haves (CSA Data consulting). Il s'agit d'un projet Marketing pour le groupe Carglass ou j'étais chargé de mesurer la contribution (impact) des campagnes publicitaires médias sur les ventes de l'entreprise à l'aide SAS.
SAS, VBA et Excel
févr.2016—juil.2016
6 mois

data_scientist
Lyon Olympique Universitaire
R
Scikit-learn
Python
Dans le cadre d’un POC réalisé par Business et Decision, détermination de la probabilité de blessure d’un joueur en match ou à l’entrainement à l’aide dus Machine Learning.
Réalisations
• Création d'un data hub à partir des données fournies par le club (charge prévue, Training, Monotonie, Contrainte, Indice fitness, Intensité, temps de jeu)
• Création d'une table d'analyse
• Analyse descriptive sur les données (1200 observations et 61 joueurs)
• Détection des outliers
• ACP et correction de la rotation au niveau de l'ACP
• Correction des valeurs manquantes
• Règles de décision et clustering sur la table globale : distinction de 3 groupes « Titulaires », « remplaçant » et « soutien » (Kmeans)
• Application de la transformation Box Cox
• Prédiction de la variable « Blessure » à l'aide de l'algorithme « Logistic Regression »
• Calcul des métriques : courbe de ROC, matrice de confusion, Accuracy, Recall et Précision
Valeur ajoutée
Machine Learning
Apprentissage supervisé (Classification /Régression)
Apprentissage non supervisé (features selection, K-Means)
Environnement Technique : KNIME, R et Excel
Formation
Obtention—sept.2016

Ecole Supérieure D'ingénieurs Léonard De Vinci
Diplôme d'ingénieur