top mobile web builder software download

Damien SOUKHAVONG


MSc Audit, Contrôle de Gestion, et Systèmes d'Information

"If you fail at feature engineering, it is because you did not try enough."

Data Science
Example Projects


Laurae Education : Formation en Data Science et en Intelligence Artificielle
Ubisoft : formation d'un stagiaire, sans voir des données ni être présent physiquement
Performances de la ligne de production Bosch : réduire les pannes de fabrication
Chronologie d'images satellites Draper : pouvez-vous ordonner l'espace et le temps ?

Laurae Education
Formation en Data Science
et en Intelligence Artificielle

Depuis des années mes "clients" voulaient me payer pour mes services. J'ai donc créé mon entreprise.
De manière non officielle, j'enseignanis depuis l'année 2010.


J'ai pour l'instant formé :

  • plus de 3.000 personnes over pour plus de 10.000 heures cumulées pendant les 6 dernières années
  • dans des classes réputées (ENOES, SKEMA Business School...), en one-to-one, ou à distance
  • dans de nombreux domaines (Data Science, Informatique, Fiscalité, Business, Comptabilité...)
  • pour divers backgrounds (Design, Art, Astrophysique, Média, Business, Finance...)
  • pour tout niveau académique (Professionnel, Doctorat, Master, Licence...)
  • pour de nombreuses fins (Trading Haute Fréquence, Recherche, Intelligence Artificielle, Poker, Audit, Gestion des plaintes...)

Principales caractéristiques :

  • Formation à petite échelle
  • Demande forte
  • Gestion de divers backgrounds
  • Adaptabilité à la fin

Réalisations clés :

  • Clients qui souhaitent payer pour un service gratuit (95%+
  • Durabilité de l'enseignement (6 années, plus de 3.000 clients)
  • De plus en plus centré sur la data science (plus de 1.000 formés les deux dernières années)
  • Partager & Recevoir des connaissances de domaines atypiques (Trading Haute Fréquence, Poker...)

Compétences clés utilisées :

  • Enseignement / Formation
  • Communication interpersonelle
  • Gestion du temps
  • Flexibilité
  • Adaptabilité
  • Confiance en soi

Ubisoft
Formation d'un stagiaire, sans voir des données ni être présent physiquement

Traduction de : "Ubisoft: Intern training, without seeing data, without being present physically"


Ubisoft a recruté un stagiaire pendant l'année 2015 pour prédire ses ventes futures de jeux à partir des ventes des années précédentes. Le problème est de trouver un workflow correct pour que, à partir des données, on puisse arriver aux prédictions. C'est un projet de 2 à 3 mois.


Contacté pour aider le stagiaire (sans désaccord du management d'Ubisoft), j'ai pu aider le stagiaire pour analyser les données jusqu'à créer le modèle avec une méthode de validation appropriée.


Le challenge majeur n'était pas d'entrainer le stagiaire pour acquérir des compétences en Data Science: c'était en fait la nécessité de travailler à distance, sans pouvoir ne serait-ce une seconde les données. De fait, je devais utiliser ma capacité de jugement issue de mon expérience, et poser des questions compréhensibles et très ciblées pour pouvoir vérifier si une valeur quantitative/qualitative énoncée par le stagiaire était un résultat attendu ou non.


Le manager de la partie Business Intelligence, et le management d'Ubisoft Allemagne ont été impressionnés par la qualité de la présentation réalisée à la fin du projet, et n'avaient jamais vu une telle chose.

Principales caractéristiques :

  • Challenge de travail à distance
  • Impossibilité de voir quelconque donnée
  • Formation du stagiaire aux bases Data Science
  • Nécessité de devoir s'appuyer sur les interprétations du stagiaire pour contrôler les attentes

Réalisations clés :

  • Entrainé avec succès le stagiaire
  • Fait réaliser par le stagiaire un travail excellent de Data Science
  • Le manager de la partie Business Intelligence, ainsi que le management d'Ubisoft Allemagne, ont été impressionnés
  • La présentation était si excellente que le stagiaire et le program manager de l'école du stagiaire ont été invités à présenter au top management d'Ubisoft (worldwide)

Compétences clés utilisées :

  • R
  • Formation / Enseignement
  • Transfer de connaissances
  • Data Science
  • Machine Learning
  • Validation de modèles
  • Tests statistiques
  • Inférences statistiques
  • Présentation
  • Confiance en soi

Performances de la ligne de production Bosch
Réduire les pannes de fabrication

Traduction de : "Bosch Production Line Performance: Reduce manufacturing failures"

Le texte est en anglais pour conserver son authenticité.


A good chocolate soufflé is decadent, delicious, and delicate. But, it is a challenge to prepare. When you pull a disappointingly deflated dessert out of the oven, you instinctively retrace your steps to identify at what point you went wrong. Bosch, one of the world's leading manufacturing companies, has an imperative to ensure that the recipes for the production of its advanced mechanical components are of the highest quality and safety standards. Part of doing so is closely monitoring its parts as they progress through the manufacturing processes.


Because Bosch records data at every step along its assembly lines, they have the ability to apply advanced analytics to improve these manufacturing processes. However, the intricacies of the data and complexities of the production line pose problems for current methods.


In this competition, Bosch challenge is to predict internal failures using thousands of measurements and tests made for each component along the assembly line. This would enable Bosch to bring quality products at lower costs to the end user.

Principales caractéristiques :

  • Classification binaire à classe extrêmement rare (environ 1:200)
  • Big data (500GB en mémoire vive sous Python si chargé entièrement, 10 milliard d'éléments)
  • Itérations de data mining / modélisation très lentes, avec une métrique de performance très peu fiable

Réalisations clés :

  • 8ème (top 1%), médaille d'or
  • Mode projet de Data Science avec une équipe de 8 personnes (de n'importe où dans le monde) qui ont rejoint mon équipe uniquement pour apprendre de moi
  • Screening laborieux des candidats ayant voulu rejoindre mon équipe (trop de candidats)
  • Managé une équipe de 8 personnes vers le succès
  • Obtenu le grade de Master à Kaggle en compétitions / discussions de Data Science, demandé par de nombreuses personnes depuis des mois
  • Créé le premier (le plus rapide, à l'ouverture au public contre Python) package R pour LightGBM


Compétences clés utilisées :

  • R / Python / SQL / JMP / SPSS
  • Cross-validation
  • Management d'équipe
  • Gestion de projet
  • Enseignement / Formation
  • Transfert de connaissances
  • Reporting
  • Boosting d'arbres de decision
  • Forêts aléatoires
  • Réseaux de neurones

Chronologie d'images satellites Draper : pouvez-vous ordonner l'espace et le temps ?

Traduction de : "Draper Satellite Image Chronology: Can you put order to space and time?"

Le texte est en anglais pour conserver son authenticité.


Imagine a world where we can use satellite images to help find better access to clean water, prevent poaching of wildlife, predict storms more efficiently, optimize traffic patterns more readily, and inform human behaviors to mitigate the spread of disease.


Thanks to a marked increase of satellites in orbit, we will be able to capture images – and the information contained within – of nearly every place on Earth, every day by 2017. However, our ability to analyze datasets of these images has not advanced as quickly. Changes from day to day in images of the same location are subtle, can be hard to detect, and are difficult to understand in terms of their significance.


In this competition, Draper provides a unique dataset of images taken at the same locations over 5 days. The challenge is to predict the chronological order of the photos taken at each location. Accurately doing so could uncover approaches that have a global impact on commerce, science, and humanitarian works.

Principales caractéristiques :

  • Ordonnancement des images (ranking)
  • Tout ordre inverse d'images (même si l'ordre est correct) produit le score inverse
  • Très petit échantillon (70 sets to 5 images pour l'entrainement)
  • Définition d'image très élevée prônant à l'overfitting (3200x2400)
  • L'ordonnancement par des humains est autorisé à cause de la difficulté de la tâche

Réalisations clés :

  • 32ème (top 8%) en 2 heures seulement
  • Présenté sur le blog de data science de Kaggle (Interview Draper / Kaggle)
  • Extraction de features d'images
  • Transformation d'une tâche supervisée de ranking à une tâche de régression pour éviter l'overfitting


Compétences clés utilisées (liste non exhaustive) :

  • R / Python / ImageJ / Tableau
  • Cross-validation
  • Recalage d'images
  • Masquage d'images
  • Extraction de features d'images
  • Boosting d'arbres de décisions
  • Deep Learning (réseaux de neurones)
  • Transformation d'une tâche supervisée de ranking à une tâche de régression pour éviter l'overfitting (et inversement pour éviter l'underfitting)

Education

- SKEMA Business School (2013-2016), 6-9è école de commerce en France, 26è mondiale:
   - MSc Audit, Contrôle de Gestion, Systèmes d'Information, obtenu avec Distinctions
   - Major de thèse (1er) utilisant la data science, la data visualisation, les statististiques, et le machine learning

- ENOES (2010-2013), la meilleure école de comptabilité en France depuis des décennies: double diplôme & certification:
   - Diplôme de Comptabilité et de Gestion (DCG)
   - Diplôme Supérieur d'Audit et de Comptabilité, obtenu avec Distinctions
   - Certification: Gestion de la Paie

SKEMA Business School (13-16)

Master: MSc Audit, Contrôle de Gestion, Systèmes d'Information

Même si ce n'est pas directement lié à la data science, certaines matières enseignées étaient (in)directement liées à la data science :
  • Business Intelligence / SQL
  • Statistiques Financières
  • Analyse de Données / VBA / Reporting interactif
  • Thèse


Ma thèse (Reporting visuals in both diagnosing and forecasting and its impact on decision-making in small businesses) couvre des domaines liés à la data science sur 172 pages, comme :

  • Visualisation de données / Business Intelligence
  • Machine Learning
  • Statistiques
  • Intelligence Artificielle


    Une liste non exhaustive des éléments techniques utilisés est présente ci-dessous :
            • Design de recherche : étude aveugle, essai randomisé, essai contrôlé, échantillon non-aléatoire de convenance, design de contre-équilibrage partiel entre sujets, cross-validation
            • Visualiation de données / Valeurs statistiques : statistiques descriptives, coefficient de corrélation de Pearson / Spearman, tau-b de Kendall, statistique Gamma / Chi-Square / Inertie / Communalité, stress de type-1 de Kruskal, diagramme de Shepard, test-value de Lebert, matrice de corrélation / similarité / dissimilarité, Q-Q plot, scree plot, carte/graphique de corrélation, résidus (standardisés) de régression
            • Tests statistiques : simulations de Monte-Carlo / Bootstrapping .632, U-test de Mann-Whitney, test exact de Fisher's, test de Friedman, test de Breusch-Pagan, test de White, test de Shapiro-Wilk, test de Anderson-Darling, test de Lilliefors, test de Jarque-Bera, mesure d'adéquacité de l'échantillonnage de Kaiser-Meyer-Olkin, test de sphéricité de Bartlett, test Lambda de Wilks', rapport de vraisemblance
            • Machine Learning : régression linéaire, partitionnement évolutif par maximisation de l'espérance, arbres de décision, Chi-Square Automatic Interaction Detector, analyse en composantes principales / analyse factorielle, positionnement multidimensionnel, analyse factorielle des correspondances, analyse des correspondantes multiples, classification ascendante hiérarchiques

            Réalisations spécifiques :

            • Major de these (1er)
            • Diplôme avec Distinctions
            • Délégué / Sous-délégué
            • Demandé pour enseigner avec le professeur d'analysis de données / reporting interactif
            • Fini en un jour en autonomie le cours de SAP de 2 jours sans expérience étendue du logiciel

            ENOES (10-13)

            Double diplôme & Certification:
            - Diplôme de Comptabilité et de Gestion (Accounting and Management Degree)
            - Diplôme Supérieur d'Audit et de Comptabilité (Auditing, Finance, and Accounting Higher Degree), obtained with Distinctions
            - Certification: Payroll Management Certification

            Cours et formation, à la fois reçus mais aussi donnés.

            Même si ce n'est pas directement lié à la data science, j'ai eu une place à l'ENOES (la meilleure école de comptabilité de France) pour pouvoir enseigner à des petites classes (lorsque j'étais étudiant) et des grandes classes (lorsque je n'étais plus étudiant).


            Comme l'ENOES est une association à but non lucratif, mes cours sont gratuits (sauf aux étudiants externes).

            Les matières des petites classes pouvaient inclure :

            • Mathématiques Financières
            • Finance d'Enterprise
            • Systèmes d'Information
            • Contrôle de Gestion
            • Droit / Fiscalité
            • Statistiques

            Les matières des grandes classes pouvaient inclure :

            • Mathématiques Financières
            • Systèmes d'Information
            • Contrôle de Gestion
            • Mathématiques pour le Management
            • Machine Learning pour l'Audit / Contrôle de Gestion
            • Data Science pour l'Audit / Contrôle de Gestion

            Réalisations clés :

            • Plus de 50 petites classes enseignées entre 2010 et 2013
            • 6 grandes classes enseignées entre 2014 et 2016
            • 8ème prix en France en Audit, Finance, et Comptabilité (Francis Lefebvre)
            • Major de classe 6 fois sur 3 années (Honors) 
            • Délégué de classe

            Compétences clés utilisées :

            • Formation / Enseignement
            • Transfert de connaissances
            • Compétences métiers
            • Data Science / Machine Learning à compréhensible à petite échelleComme l'ENOES est une association à but non lucratif, les cours enseignés sont gratuits (sauf pour les étudiants externes).

            Expérience Professionnelle

            Lancé ma propre entreprise: Laurae Education
            Cofondé UPECS, le leader dans le domaine Science/Calculatrices
            Sysadmin / Développeur / Formateur à SYPRO Formation
            Reporter / Web Editor à meltygroup
            Assistant SEO Project Manager à Meilleur Mobile

            Laurae Education

            Ma propre entreprise : donner des cours de Data Science, des services en Systèmes d'Information, du Consulting, et des examens.
            Possibilité de poursuivre par la suite un M.Ed in Digital Learning and Leading à l'Université de Lamar.

            J'ai créé cette entreprise personnelle pour recevoir l'argent de mes clients qui veulent me payer pour mes services. Normalement, mes services sont réalisés gratuitement. L'entreprise est dissolue depuis 2016. Mes services existaient depuis 2010..


            Je suis un centre d'examen Certiport, fournissant des examens aux candidats voulant en passer. Je peux fournir des examens Microsoft (Office, Educator, Technology), Adobe (Associate, Expert), Autodesk (User), IC3, et Intuit Quickbooks. De plus, je suis suffisamment reconnu pour pouvoir avoir mon propre centre d'examen mobile, ce qui signifie que n'importe quel candidat peut passer un examen sous ma supervision de n'importe où, tant que le candidat passe les prérequis techniques de sécurité pour passer un examen.

            Je fournis également une assistance technique et un support pour certains centres d'examen Certiport.


            De plus, j'enseigne des cours et je réalise des formations dans de nombreux domaines, comme :


            • Data science / Intelligence artificielle / Statistiques
            • Systèmes d'information
            • Droit
            • Business Intelligence / Reporting
            • Recherche
            • Mathématiques
            • Finance
            • Créativité / Design


            Presque tous mes cours sont gratuits et durent une semaine, sauf pour les enseignement one-to-one qui peuvent durer d'une heure à plusieurs jours. J'ai enseigné à plus de 2000 étudiants / lycéens.

            J'enseigne dans des organismes de formation, mais parfois aussi dans les meilleures écoles de France (comptabilité / commerce).

            • Créé ma propre entreprise
            • Fait suffisamment confiance pour avoir mon propre centre d'examen mobile
            • Enseigné des cours dans des domaines divers
            • Enseigné des cours dans les meilleurs écoles de France
            • Capacité à fournir des certifications
            • Capacité à fournir un pré-examen pour suivre un Master américain en éducation
            De plus, j'ai la possibilité de faire un examen à mes candidats leur permettant de poursuivre un Master aux Etats-Unis (M.Ed in Digital Learning and Leading) à l'Université de Lamar.

            UPECS (Union pour la Promotion des Enseignements et Carrières Scientifiques) 

            L'association sans but lucratif que j'ai cofondé, qui est maintenant leader dans le domaine d'expertise Science/Calculatrices.
            Gestion de l'analyse des données et des budgets de l'association.
            Sponsorisé et Financé par Texas Instruments et de nombreux individus.

            J'ai cofondé avec quatre autres membres cette association à but non lucratif pour aider les lycéens à faire leur voie vers les domaines scientifiques (et non scientifiques également) avant, pendant, et après le baccalauréat. C'est maintenant le leader en France dans son domaine, fournissant des connaissances inédites pour les calculatrices Texas Instruments / Casio / Hewlett-Packard.


            Avant que l'association ne se soit formé, j'ai rapidement obtenu le rôle de modérateur (un spot rare, et ça n'a pris que quelques semaines), et j'ai rapidement été promu modérateur global (après une ré-organisation complète) jusqu'à devenir administrateur.


            Nous fournissons un service cloud gratuit, permettant aux membres de créer des fichiers de cours / programmes pré formatés pour leurs calculatrices. Nous fournissons également un espace de discussion ouvert (forum / chat) où les personnes peuvent échanger à propos de tout.


            Nous fournissons également un support juridique aux étudiants lorsque les examinateurs outrepassent leurs droits. Dans ce cas, je gère le cas si j'en ai le temps.

            • Promu modérateur rapidement, poste rare à l'époque
            • Cofondé une association avec quatre autre membres éparpillés à travers la France
            • Devenu la première communauté française dans le domaine scientifique/calculatrice
            • Fourni des services cloud gratuitement
            • Fourni du support juridique si nécessaire (gratuitement)
            • Supporté les étudiants à travers des programmes à utilisation simple, des corrections d'examens (baccalauréat, etc.), et des articles (très) techniques (pour ceux intéressés à aller très loin dans leurs calculatrices – comme par exemple l'ASM / langage assembleur)
            Cette association à but non lucratif est similaire à une autre (à une plus petite échelle, dans le domaine Educatif général) à laquelle j'ai été membre, Perspectiv' Paris, où j'étais le manager des sessions de tutorat.

            SYPRO Formation

            Le Sysadmin / Développeur / Formateur qui a géré la société.
            90% de temps human gagné en IT, et 80% de réduction des coûts fixes IT inclus.

            C'est ici que j'ai travaillé et dédié du temps de travail pendant mes temps libres. C'était également la raison qui m'a fait quitter meltygroup, même si j'aurais pu interviewer Ronaldo, Taylor Swift, ou encore plein d'autres stars mondiales - ou encore même avoir ma propre chronique.


            C'est un organisme de formation, où j'ai repensé tout le système IT de zéro :


            • Amélioreé tous les processus IT pour gagner jusqu'à 90% du temps perdu dans des tâches répétitives
            • Acheté et mis en place un serveur de déploiement (Windows Deployment Services)
            • Réduit les coûts d'investissements IT de plus de 80%
            • Formé le Manager pour réduire les coûts fixes IT
            • Développé le site web de la société tout en fixant les problèmes comptables qui y sont liées


            De plus, j'étais un formateur qui fournissait 100% de succès aux examens :

            • Microsoft Office Specialist
            • Adobe Certified Associate
            • PCIE


            Je détiens le record de vitesse aux examens PCIE et Microsoft Office Specialist en France, en finissant les examens en 5 à 20 minutes seuelement, lorsqu'ils sont supposés tenir facilement 40 à 45 minutes.


            J'ai également géré l'entreprise pendant 2 semaines, pour remplacer le Manager.

            meltygroup

            Reporter / Web Editor dans la technologie, les périphériques, la mode/fashion, le design et l'architecture. Mieux vaut être prêt à être un spécialiste.
            Des lunettes "swag" incluses au recrutement.

            C'est l'endroit où si vous voulez des interactions sociales avec d'autres reporters et des stars, vous devez être ici.


            J'ai pu écrire des articles dans quatre domaines où j'avais des connaissances étendues :

            • Technologie : ordinateurs, processeurs Intel,...
            • Périphériques : téléphones portables, tablettes....
            • Fashion/Mode : vêtements, robes...
            • Design / Architecture: bâtiments, art...


            Si vous pouvez convaincre avec de la data, non seulement vous gagnerez du temps mais des opportunités.


            C'est une endroit idéal pour travail, si vous le pouvez. Vous pourrez voyager souvent. Vous voulez voir vos conventions favorites Manga/Anime? Alors allez-y!


            On m'a donné une chronique dédiée à lancer, qui a malheureusement été annullée puisque je suis allé travailler à SYPRO Formation, une autre entreprise avec des grandes opportunités. Je ne suis pas resté très longtemps même si j'ai pu adorer les moments passés à melty, un lieu fantastique.


            Avant de partir, on m'a demandé si je voulais prendre un poste de développeur à meltygroup, puisque j'excellais dans le diagnostic des anomalies et fournissais des corrections pour le backend de l'interface de reporting des rédacteurs. Et ce n'est pourtant qu'en deux semaines : un travail de développeur et une offre de chronique dédiée.


            J'ai demandé avec audace à un reporter de demander une interview avec Ronaldo. En réalité, non seulement il a eu son interview avec Ronaldo, mais tous les frais de voyage, de logement, et tout frais externes ont été payés par melty, tout comme les billets d'avion réservés pour dans 7 jours.

            Meilleur Mobile

            Assistant SEO Project Manager. Un mix de SEO et d'optimisation d'analyse de données.

            Le reporting journalier est un bon moyen de commencer une journée, afin de pouvoir cibler spécifiquement ce qu'il y a à faire dynamiquement et flexiblement, lorsqu'on voit les résultats de la semaine. Mais que faire si le processus pour les générer est lent ?


            En fournissant la capacité à améliorer la vitesse de reporting, travailler 200% plus rapidement le matin signifie plus de temps à dédier à des tâches peu répétitives :


            • Consolidation des bases de données
            • Jointure de multiples bases de données
            • Nettoyage des données
            • Analyse de bon sens les observations
            • Ne pas se faire prendre par les valeurs aberrantes signifiantes


            J'ai également pris des initiatives : résolu des bugs sur le site web, repéré à l'oeil des erreurs quantitatives parmi des milliers de pages dynamiques, fourni un nouveau framework pour comparer des téléphones...

            Réussites

            Kaggle Data Science : classe Maître dans les Compétitions et les Discussions
            Adobe Education : HEC Paris & Speaker à Adobe UK
            Business Game - SKEMA 2013 : 3ème sous-univers, 1er en créativité
            Certifications : plus de 40 obtenues
            Kaggle : Détails

            Kaggle Data Science

            The Home of Data Science.

            Les scores parlent d'eux-mêmes (as of 21/11/2016):
            - 2nd mondial dans les Discussions (Maître)
            - Maître en Compétitions en moins de 9 mois dans un environnement très compétitif

            Je suis une lumière à chaque fois que j'écris. Recommendé par le #1 Disucssion Walter Reade (aka inversion).

            Adobe Education

            Certificat: Adobe Education Trainer
            Travail: Instructeur Créatif
            Education: 2x 75 hours

            Même si ce n'est pas directement lié à la data science, la créativité nécessite une grande place lorsque le travail sur les processus et le feature engineering se réalise. J'ai pris une grande place durant l'Adobe Education Train the Trainer, un événement qui survient deux fois par an. C'est une formation de 75 heures pour les éducateurs/formateurs afin d'être apte à former d'autres éducateurs dans le domaine de la créativité.

            J'ai passé avec succès tous les examens de 2014 et de 2016. J'ai réalisé également deux livres, un pour 2014 (391 pages) et un pour l'hiver 2015 (361 pages) (copyright Adobe). Ils sont disponibles uniquement sur demande.


            Pendant la formation de 2014, j'ai pu être remarqué par la Worldwide Education Program Manager (Melissa Jones) à Adobe qui a été impressionnée par mon livre, et m'a en conséquence fourni l'opportunité de visiter une classe d'entrepreneuriat à HEC Paris.


            J'ai pu être remarqué également par Phil Badham (Educational and Creative Technologies Consultancy), un leader dans l'éducation et formateur reconnu pour ses cours et interventions "Outstanding Teaching" pendant ces dernières années. Il m'a fourni l'opportunité d'être un speaker dans un événement futur Adobe au Royaume-Uni.


            Mon travail final en 2014 a été mis en avant par Adobe Education en tant que travail exemplaire (1%).

            Réalisations clés :

            • Remarqué par la Worldwide Education Program Manager à Adobe et proposé l'opportunité de visiter une classe à HEC Paris
            • Remarqué par un Education Leader connu au Royaume-Uni et offert la possibilité d'être un speaker à un prochain événement Adobe
            • Travail final mis en avant par Adobe Education en tant qu'exemplaire
            • Obtenu la certification Adobe Education Trainer deux fois
            • Travaillé pour Adobe Education

            Compétences clés utilisées :

            • Expertise dans les théories de l'apprentissage pour les adultes et les best practices pour former sur les produits Adobe
            • Haut niveau d'expertise avec Adobe Education Exchange et Adobe Connect
            • Haut niveau de communication écrite et orale
            • Capacité à représenter Adobe Education professionnellement et consciencieusement

            Business Game – SKEMA Business School 2013

            Même si ce n'est pas directement lié à la data science, ce business game nécessite le management d'équipe, la prise de décision en environnement incertain, et la prédiction. Avec plus de 400 variables à prendre en compte et une quarantaine de variables à saisir manuellement lors de chaque cycle, ce n'est pas une tâche simple à accomplir. Cela nécessite également d'exploiter les connaissances de la gestion d'entreprise (satisfaction des employés, qualité…).

            Rôles joués :

            • Directeur général (CEO)
            • Directeur financier
            • Assistant de production

            Réalisations clés :

            • 3ème meilleure équipe dans le sous-univers joués
            • 1ère meilleure équipe globale en créativité, tout campus confondus
            • Lorsque 2 heures sont allouées à la prise de décision, l'analyse automatisée que j'ai mise en place peut prendre une décision sans danger, en fournissant les raisons du choix en moins 2 minutes (ce n'est néanmoins qu'un outil d'aide à la décision)
            • Revu individuellement comme un outil impressionnant par des superviseurs du business game pour la qualité de l'outil d'aide à la décision
            • Inversé les prédictions avec une erreur absolue de 5% (à cause des fluctuations des choix des autres équipes)

            Compétences clés utilisées :

            • Management d'équipe
            • Analyse de données
            • Prédiction multivariée
            • Ingénierie inverse
            • Créativité

            Certifications

            Je détiens tellement de certifications (Software de bureau, Serveurs, Management IT, Innovation, Education) qu'il m'est difficile d'y garder une liste complète en un unique lieu. Je vais néanmoins lister les plus importantes, ordonnées par type.


            Pour preuve, veuillez utiliser le lien ci-contre et les logins suivants pour les certifications Microsoft : 

            Logins: 1140043 / LauraeEdu


            Pour les certifications n'apparaissant pas dans la liste, elles ne sont disponibles que sur demande.

            Lié Bureau


            Microsoft – Information Office Worker – Office Desktop


            Master :

            • Microsoft Office 2013 Master Specialist
            • Microsoft Office 2010 Master Specialist


            Word :

            • Microsoft Word 2016 Expert
            • Microsoft Word 2013
            • Microsoft Word 2010 Expert


            Excel :

            • Microsoft Excel 2016
            • Microsoft Excel 2013 Expert
            • Microsoft Excel 2010


            PowerPoint :

            • Microsoft PowerPoint 2016
            • Microsoft PowerPoint 2013
            • Microsoft PowerPoint 2010


            Outlook :

            • Microsoft Outlook 2013
            • Microsoft Outlook 2010


            Adobe :

            • Adobe Certified Associate (Visual Communication)



            Lié IT technique


            Windows Desktop :

            • Windows 8
            • Windows 7
            • Windows 7, Configuring
            • Windows 7 and Office 2010, Deployment
            • Windows 7, Enterprise Desktop Support Technician
            • Windows 7, Enterprise Desktop Administrator


            Windows Server :

            • Solutions Expert: Desktop Infrastructure
            • Server Virtualization with Windows Server Hyper-V and System Center
            • Windows Server 2012
            • Virtualization Administrator on Windows Server 2008 R2 
            • Windows Server 2008 R2, Server Virtualization
            • Windows Server 2008 R2, Desktop Virtualization
            • Networking Fundamentals


            Office 365 :

            • Office 365
            • Administering Office 365 for Small Business


            SQL Server :

            • SQL Server 2012/2014


            Dynamics CRM :

            • Microsoft Dynamics CRM 2013 Applications
            • Microsoft Dynamics CRM 2013 Deployment
            • Microsoft Dynamics Customization and Configuration in CRM 2013


            Autres :

            • Microsoft Certified Professional

            Lié Management / Education


            Management IT :

            • Managing Projects and Portfolios with Project Server 2013
            • Managing Projects with Microsoft Project 2013
            • Designing, Assessing, and Optimizing Software Asset Management (SAM)
            • Volume Licensing Specialist, Large Organizations
            • Volume Licensing Specialist, Small and Medium Organizations


            Lié à l'Education :

            • Microsoft Certified Trainer (2014-2016 cycles)
            • Microsoft Innovative Educator Trainer
            • Microsoft Innovative Educator
            • Microsoft Certified Educator (UNESCO)
            • Adobe Education Trainer
            • Adobe Certified Educator 
            • Teaching with Technology (TwT)

            Non-Certifications

            Pré-examen d'entrée pour un Diplôme de Master américain (M.Ed in Digital Learning and Leading)


            Je suis autorisé à faire passer un examen (dans le domaine de l'éducation) pour mes étudiants qui a été conçu par Microsoft et l'UNESCO conjointement. Cela ouvre les portes vers un diplôme de Master aux Etats-Unis, supposant qu'ils/elles aient suffisamment de crédits ECTS à transférer dans un curriculum éducatif. L'examen est basé sur l'UNESCO ICT Competency Framework for Teachers, qui est un examen très difficile pour ceux qui n'ont jamais enseigné dans une vraie classe, ou qui n'ont jamais été enseignants/formateurs dans leur vie.


            L'examen nécessite les compétences suivantes :

            • Politique éducative
            • Cursus et évaluation
            • Pédagogie
            • TIC/outils technlogiques
            • Organisation et administration
            • Développement professionnel


            Un second examen, administré par l'université de Lamar aux Etats-Unis, permet d'acquérir jusqu'à 18 crédits jusqu'à pouvoir être enfin officiellement étudiant dans le programme M.Ed in Digital Learning and Leading.


            Livres


            J'ai écrit plusieurs livres pour les examens du Diplôme de Comptabilité et de Gestion :

            • UE1 Introduction au droit (112p)
            • UE2 Droit des sociétés (102p)
            • UE4 Droit fiscal (123p)
            • UE5 Economie (39+50p)
            • UE7 Management (181+180p)
            • UE8 Systèmes d'Information (484p)
            • UE11 Contrôle de Gestion (111p)
            • UE11 Mathématiques pour le management (72p)


            Logiciels et Hobbies

            Je suis capable d'utiliser de nombreux logiciels statistiques / de data visualisation, comme :

            • R / Microsoft R Open / Markdown
            • Python
            • H2O Flow
            • Weka
            • Amelia / Amelia II
            • Tableau
            • SPSS
            • JMP
            • Stata
            • SAS
            • GraphPad Prism
            • XLSTAT
            • Excel Data Mining for SQL Server
            • SQL Server Data Tools for Visual Studio
            • Oracle Crystal Ball
            • RExcel
            • Power BI


            Je suis capable également de créer des environnement virtualisés, comme :

            • Windows Server (Desktop Deployment Servers)
            • Hyper-V
            • Virtualbox
            • VMWare
            • Bluestacks (Android)
            • … both on Windows & Linux

            De plus, je fais un peu de design (graphique), de e-Learning, de storytelling, et de photographie, qui sont mes passions :

            • Adobe Photoshop (design graphique) 
            • Adobe Captivate (e-Learning)
            • Adobe Presenter (e-Learning / storytellling)
            • iSpring Suite (e-Learning)
            • DAZ Studio (design graphique / 3D)
            • onOne Perfect Photo Suite (design graphique)
            • Nik Software (design graphique)
            • SimpleDiagrams (storytelling)
            • Microsoft Word
            • Microsoft Excel / VBA
            • Microsoft PowerPoint
            • Microsoft OneNote
            • Microsoft Visio
            • Microsoft Project

            Kaggle : Détails

            Satisfaction de la clientèle Santander : Quels clients sont des clients satisfaits ?
            Prédire la valeur business pour Red Hat : classifier le potentiel client
            Démographie mobile des utilisateurs TalkingData : apprenez à connaître des millions d'utilisateurs de périphériques mobiles
            Recommandations d'hôtels Expedia : Quel type d'hôtel un client d'Expedia réservera ?
            Gestion des réclamations de BNP Paribas Cardif : Pouvez-vous accélérer le processus de gestion de réclamations ?
            Pertinence des recherches de produits sur Home Depot : Prévoyez la pertinence des résultats de recherche sur homedepot.com

            Satisfaction de la clientèle Santander
            Quels clients sont des clients satisfaits ?

            Traduction de : "Santander Customer Satisfaction: Which customers are happy customers?"

            Le texte est en anglais pour conserver son authenticité.


            From frontline support teams to C-suites, customer satisfaction is a key measure of success. Unhappy customers do not stick around. What's more, unhappy customers rarely voice their dissatisfaction before leaving.


            Santander Bank is asking help to identify dissatisfied customers early in their relationship. Doing so would allow Santander to take proactive steps to improve a customer's happiness before it is too late.


            In this competition, you will work with hundreds of anonymized features to predict if a customer is satisfied or dissatisfied with their banking experience.

            Principales caractéristiques :

            • Classification binaire avec classe rare (1:20)
            • Variables anonymisées
            • Petit échantillon de données (environ 100,000 observations d'entrainement)
            • Echantillon très susceptible au bruit (très facile de overfit)

            Réalisations clés :

            • 82ème (top 2%) lorsque le 1er est passé à la 2670ème place
            • Travail d'équipe (équipe de 3 personnes voulant apprendre de moi)
            • Une des dix équipes du top 100 restés top 100 lorsque l'overfit a été révélé
            • Théorisé un nouveau ensemble de modèles qui se relève puissant dans les classifications avec classe rare
            • Théorisé deux modèles supervises : chercheur de règles d'association univariée par aberrance, chercheur de règles d'association bivariée par aberrance (par distance de Mahalanobis)

            Compétences clés utilisées (liste non exhaustive) :

            • R / Python / JMP / SPSS
            • Cross-validation 
            • Connaissance approfondie de l'overfitting
            • Bagging de sous-échantillonnage
            • Ensemble de puissance
            • Boosting d'arbres de décisions 
            • Réseaux neuronaux
            • Forêts aléatoires
            • k-voisins les plus proches
            • Application de la régression à la classification
            • Gestion d'équipe
            • Reporting automatisé

            Prédire la valeur business pour Red Hat
            Classifier le potentiel client

            Traduction : "Predicting Red Hat Business Value: Classify customer potential"

            Le texte est en anglais pour conserver son authenticité.


            Like most companies, Red Hat is able to gather a great deal of information over time about the behavior of individuals who interact with them. They are in search of better methods of using this behavioral data to predict which individuals they should approach—and even when and how to approach them.


            In this competition, the challenge is to create a classification algorithm that accurately identifies which customers have the most potential business value for Red Hat based on their characteristics and activities.


            With an improved prediction model in place, Red Hat will be able to more efficiently prioritize resources to generate more business and better serve their customers.

            Principales caractéristiques :

            • Classification binaire
            • Classification basée sur une structure de variables catégorielles à 50,000+ valeurs pour 2 millions d'observations
            • Dépendence temporelle des labels

            Réalisations clés :

            • 87ème (top 4%)
            • Travail d'équipe (équipe de 3 personnes)
            • Créé un fork du package sparsity pour R afin qu'il puisse fonctionner avec les versions récentes de R, Rcpp, et Rtools de Windows (Input/Output du format LightSVM, jusqu'à 100-1,000,000x plus rapide que les packages similaires)

            Compétences clés utilisées (liste non exhaustive) :

            • R / Python / JMP / SPSS
            • Cross-validation
            • Analyse des series temporelles
            • Matrices sparses
            • Régression linéaire sur des matrices sparses très larges (2,000,000 x 1,000,000)
            • Optimization globale par evolution différentielle
            • Optimization L-BFGS-B (algorithme borné de Broyden–Fletcher–Goldfarb–Shanno à mémoire limitée)
            • Reporting automatisé
            • Boosting d'arbres de decision
            • Réseaux de neurones
            • k-voisins les plus proches
            • Machines de factorisation

            Démographie mobile des utilisateurs TalkingData
            Apprenez à connaître des millions d'utilisateurs de périphériques mobiles

            Traduction de : "TalkingData Mobile User Demographics: Get to know millions of mobile device users"

            Le texte est en anglais pour conserver son authenticité.


            Nothing is more comforting than being greeted by your favorite drink just as you walk through the door of the corner café. While a thoughtful barista knows you take a macchiato every Wednesday morning at 8:15, it is much more difficult in a digital space for your preferred brands to personalize your experience.


            TalkingData, China’s largest third-party mobile data platform, understands that everyday choices and behaviors paint a picture of who we are and what we value. Currently, TalkingData is seeking to leverage behavioral data from more than 70% of the 500 million mobile devices active daily in China to help its clients better understand and interact with their audiences.


            In this competition, the challenge is to build a model predicting users’ demographic characteristics based on their app usage, geolocation, and mobile device properties. Doing so will help millions of developers and brand advertisers around the world pursue data-driven marketing efforts, which are relevant to their users and catered to their preferences.

            Principales caractéristiques :

            • Classification hiérarchique 6x2 (12 classes)
            • Nombreux petits échantillons (jusqu'à 1 million d'observations) avec très haute cardinalité
            • Nécessité de nettoyer les données, énormément de variables inutiles
            • Variables textuelles (en langage non-natif), numériques, et catégorielles
            • Tâche extrêmement difficile (le meilleur modèle ne fait que 10% meilleur qu'un générateur de nombres aléatoires)

            Réalisations clés :

            • 83ème (top 5%) contre le benchmark de Turi's (Apple) étant 1475ème
            • Travail avec des variables à haute cardinalité
            • Extraction de features basées sur du texte

            Compétences clés utilisées (liste non exhaustive) :

            • R / Python / SQL / JMP / SPSS
            • Cross-validation
            • Aggrégation de données
            • Partitionnement k-means
            • Matrices sparses
            • Boosting d'arbres de decisions
            • Réseaux de neurons
            • Modèles linéaires générailsés

            Recommandations d'hôtels Expedia
            Quel type d'hôtel un client d'Expedia réservera

            Traduction de : "Expedia Hotel Recommendations: Which hotel type will an Expedia customer book?"

            Le texte est en anglais pour conserver son authenticité.


            Planning your dream vacation, or even a weekend escape, can be an overwhelming affair. With hundreds, even thousands, of hotels to choose from at every destination, it is difficult to know which will suit your personal preferences. Should you go with an old standby with those pillow mints you like, or risk a new hotel with a trendy pool bar?


            Expedia wants to take the proverbial rabbit hole out of hotel search by providing personalized hotel recommendations to their users. This is no small task for a site with hundreds of millions of visitors every month!


            Currently, Expedia uses search parameters to adjust their hotel recommendations, but there are not enough customer specific data to personalize them for each user. In this competition, Expedia is challenging competitors to contextualize customer data and predict the likelihood a user will stay at 100 different hotel groups.


            The data in this competition is a random selection from Expedia and is not representative of the overall statistics.

            Principales caractéristiques :

            • Classification à 100 classes non statiques (les classes peuvent changer au cours du temps)
            • Big data set (un modèle boosté d'arbres de decision sur toutes les données nécessite plus de 3TB de mémoire vive)
            • Dépendence temporelle forte

            Réalisations clés :

            • 122ème (top 7%) contre le benchmark de Expedia étant 1794ème
            • Extraction de features temporelles
            • Machine Learning sur du big data en ayant uniquement 16GB de mémoire vive

            Compétences clés utilisées (liste non exhaustive) :

            • R / Python / JMP / SPSS
            • Cross-validation
            • Partitionnement et Scoring temporel
            • Autoencodeur
            • Optimization par gradient descent
            • Sous-échantillonnage
            • Matrices sparses
            • Machines de factorisation
            • Optimization L-BFGS (algorithme de Broyden–Fletcher–Goldfarb–Shanno à mémoire limitée)
            • Perceptron à plusieurs niveaux avec une activation Softmax par batch/paquet

            Gestion des réclamations de BNP Paribas Cardif
            Pouvez-vous accélérer le processus de gestion de réclamations de BNP Paribas Cardif ?

            Traduction de : "BNP Paribas Cardif Claims Management: Can you accelerate BNP Paribas Cardif's claims management process?"

            Le texte est en anglais pour conserver son authenticité.


            As a global specialist in personal insurance, BNP Paribas Cardif serves 90 million clients in 36 countries across Europe, Asia, and Latin America.


            In a world shaped by the emergence of new uses and lifestyles, everything is going faster and faster. When facing unexpected events, customers expect their insurer to support them as soon as possible. However, claims management may require different levels of check before a claim can be approved and a payment can be made. With the new practices and behaviors generated by the digital economy, this process needs adaptation thanks to data science to meet the new needs and expectations of customers.


            In this challenge, BNP Paribas Cardif is providing an anonymized database with two categories of claims:

            • Claims for which approval could be accelerated leading to faster payments
            • Claims for which additional information is required before approval

            Principales caractéristiques :

            • Classification binaire
            • Variables anonymisées
            • Petit échantillon de données (environ 100,000 observations d'entrainement)

            Réalisations clés :

            • 112ème (top 4%) contre le benchmark de BNP Paribas étant 2456ème
            • Première apparence dans une compétition de data science
            • Devenu rapidement l'une des personnes les plus respectables
            • Travail seul

            Compétences clés utilisées (liste non exhaustive) :

            • R / Python / JMP / SPSS
            • Automatisation du credit scoring et du reporting
            • Boosting d'arbres de décisions
            • Forêts aléatoires
            • Ensemble d'arbres extrêmement aléatoires
            • Tableplots
            • Matrices sparses
            • t-Stochastic Neighbor Embedding
            • Dépdendence partielle
            • Sélection de variables par l'importance des variables explicatives dans un modèle


            Pertinence des recherches de produits sur Home Depot
            Prévoyez la pertinence des résultats de recherche sur homedepot.com

            Traduction de : "Home Depot Product Search Relevance: Predict the relevance of search results on homedepot.com"

            Le texte est en anglais pour conserver son authenticité.


            Shoppers rely on Home Depot’s product authority to find and buy the latest products and to get timely solutions to their home improvement needs. From installing a new ceiling fan to remodeling an entire kitchen, with the click of a mouse or tap of the screen, customers expect the correct results to their queries – quickly. Speed, accuracy, and delivering a frictionless customer experience are essential.


            In this competition, Home Depot is asking help to improve their customers' shopping experience by developing a model that can accurately predict the relevance of search results.


            Search relevancy is an implicit measure Home Depot uses to gauge how quickly they can get customers to the right products. Currently, human raters evaluate the impact of potential changes to their search algorithms, which is a slow and subjective process. By removing or minimizing human input in search relevance evaluation, Home Depot hopes to increase the number of iterations their team can perform on the current search algorithms.

            Principales caractéristiques :

            • Régression textuelle basée sur un contexte
            • Petit échantillon de données (environ 100,000 observations d'entrainement)
            • Les modèles doivent généraliser à des contextes inconnus (facile d'overfit)
            • Echantillon de test contaminé pour décourager les tricheurs

            Réalisations clés :

            • 213ème (top 11%) contre le benchmark de Home Depot étant 1680ème
            • Création de features basées sur du texte
            • Création de features basées sur du contexte

            Compétences clés utilisées (liste non exhaustive) :

            • R / Python / JMP / SPSS
            • Cross-validation
            • Stemming
            • Segmentation 
            • Term Frequency – Inverse Document Frequency (TF-IDF)
            • Décomposition en valeurs singulières
            • Matrices sparses
            • Boosting d'arbres de décisions 
            • Forêts aléatoires
            • Réseaux neuronaux