Je m'appelle Warith Harchaoui et je suis passionné par l'intelligence artificielle (IA) avec un doctorat en mathématiques appliquées.
Je bâtis ma carrière sur l'IA tant dans la recherche que dans les entreprises.
En 2008, j'ai commencé mon apprentissage avec les meilleurs chercheurs en IA grâce à l'École Normale Supérieure de Cachan (MVA M.Sc.). Après plusieurs expériences dans le domaine de la Computer Vision dans des startups et des entreprises internationales, je poursuis mes recherches à l'École Normale Supérieure de Paris aux laboratoires Willow / Sierra qu'on compte parmi les meilleurs au monde.
Plus tard, j'ai renforcé le volet entreprise de ma carrière en Data Science au sein du leader mondial Oscaro.com du e-commerce en pièces automobiles de 2014 à 2020. Tout en gardant mes responsabilités opérationnelles, j'accomplis mon doctorat en mathématiques appliquées de 2016 à 2020 grâce à Charles Bouveyron au laboratoire MAP5 de l'Université de Paris. Aujourd'hui, j'exprime mon expertise en matière de traitements de l'image, du son, de la vidéo et du texte au sein de Jellysmack en tant que Research Fellow avec toujours le même désir de concrétiser des idées d'intelligence artificielle dans le monde réel.
Tout au long de mon expérience professionnelle, j'ai compris l'importance de favoriser un environnement de travail collaboratif où toutes les voix et les idées sont entendues. Un projet avec une équipe qui ne s'entend pas bien finit toujours par en payer le prix. C'est pourquoi je recueille les retours de mes collaborateurs et de mes collègues pour améliorer mon travail et celui de mes équipes.
“On sent ta personalité.”
— Erwann Le Pennec, professeur à École polytechnique et rapporteur pour mon jury de doctorat
“Cette collaboration avec l'université a apporté beaucoup de valeur à l'entreprise que j'ai fondée, Oscaro, avec le produit Cerbero.”
— Pierre-Noël Luiggi, fondateur d'Oscaro.com
“L'expertise de Warith en matière d'intelligence artificielle et de vision par ordinateur a joué un rôle clé dans la constitution de l'équipe de R&D.”
— Maxime Schacht, foundateur de VizioSense
“Merci pour ce super boulot.”
— Nathalie Birocheau, fondatrice de Ircam Amplify
“Un duo improbable mais incroyable!”
— Élève de l'Executive MBA de la Rennes School of Business pour notre cours avec Laurent Pantanacce
“Warith est une Bible en IA”
— Évaluation annuelle des performances chez Jellysmack
Dans le domaine de l'intelligence artificielle (IA) qui avance rapidement, il est courant de voir un volume et un rythme très élevés de publications tant scientifiques que non scientifiques. Cependant, il est heureux que des scientifiques expérimentés prennent le temps d'écrire des livres complets qui fournissent un recul précieux avec des vues d'ensembles rétrospectives sur le domaine. Outre le format concis des publications lors des grandes conférences en IA, il est pertinent de se pencher sur les subtilités mathématiques et algorithmiques de ces livres afin de comprendre les travaux plus courts et d'utiliser efficacement les diverses boîtes à outils disponibles en ligne. C'est dans ce contexte que je présente une liste de livres que je trouve particulièrement dignes d'intérêt, ainsi que quelques commentaires, pour les lecteurs désireux de s'engager dans la passionnante "aventure de l'IA".
À notre époque, la langue internationale de l'intelligence artificielle est l'anglais. De la même façon, au temps du britannique Newton au XIXe siècle, ses travaux pionniers en calculs différentiels pour la trajectoire des astres ont été publiés en latin. Al-Khwârizmî au XVIIIe et XIXe siècle, de langue maternelle perse s'est exprimé scientifiquement en arabe et a laissé son nom à l'algorithme qui est l'un des concepts qu'il a su développé avec aussi l'algèbre dont on considère qu'il est le père. C'est pourquoi, je me permets à mon époque en 2022 de me concentrer sur les livres en anglais en recommandant aux jeunes de maîtriser cette langue.
Je n'ai pas encore commenté tous les livres que j'aime jusqu'à présent. En effet, il m'est difficile de commenter les livres de personnes que j'admire d'une manière qui soit utile aux lecteurs, et cela me prend du temps.
Le Machine Learning est la science qui apprend à partir des données qui constitue une expérience acquise en analysant les données au lieu d'une programmation explicite. Pour ce faire, on utilise des algorithmes sur ordinateur qui analysent les données d'entrée, identifient des modèles à l'aide de techniques statistiques et prennent des décisions ou font des prédictions. En conséquence, la machine peut s'adapter à des données nouvelles et inédites et faire des prédictions plus précises.
Pattern Recognition and Machine Learning
Christopher M. Bishop, 2006,
Machine Learning: A Probabilistic Perspective
Kevin Murphy, 2012,
Bayesian Reasoning and Machine Learning
David Barber, 2012,
La vision par ordinateur est un domaine de l'intelligence artificielle qui vise à reproduire les capacités de la vision humaine en apprenant aux ordinateurs à interpréter et à comprendre l'environnement visuel d'une manière similaire à celle des humains. Ce domaine est appliqué à une variété de tâches, par exemple telles que la reconnaissance faciale, la détection d'objets, la conduite autonome et l'imagerie médicale.
Computer Vision: Algorithms and Applications, 2nd Edition
Richard Szeliski, 2022,
Computer Vision: A Modern Approach, 2nd Edition
David Forsyth and Jean Ponce, 2011,
Multiple View Geometry in Computer Vision
Richard Hartley and Andrew Zisserman, 2004,
Le traitement du langage naturel (TAL ou NLP en anglais) permet aux machines d'interpréter et de comprendre le langage humain de texte. Pour ce faire, on utilise des algorithmes qui analysent de grandes quantités de données de texte et le but est d'en extraire son sens. Idéalement, on voudrait ainsi comprendre automatiquement le langage d'une manière similaire à celle des humains. Le NLP est appliqué dans divers contextes, notamment l'optimisation des moteurs de recherche, le résumé automatique, l'analyse des sentiments et la génération de langage naturel.
Neural Network Methods in Natural Language Processing
Yoav Goldberg, 2017,
Foundations of Statistical Natural Language Processing
Chris Manning and Hinrich Schütze, 1999,
Le traitement du signal est la manipulation, l'analyse et la transformation des signaux. Ces signaux peuvent être par exemple des ondes sonores, des ondes radio, des images ou des données provenant d'instruments médicaux. Le traitement du signal est appliqué dans de nombreux contextes, notamment pour son amélioration. Souvent, le traitement du signal consiste à extraire des informations utiles des signaux, comme la fréquence, l'amplitude ou la couleur, et à les modifier pour les rendre plus nets.
A Wavelet Tour of Signal Processing, 3rd Edition
Stéphane Mallat, 2008,
L'apprentissage par renforcement (Reinforcement Learning, RL) consiste à faire apprendre aux machines de leur environnement et à faire des actions qui maximisent les récompenses. Pour ce faire, on donne à l'ordinateur un but ou un objectif numérique, puis on lui fournit un retour d'information après chaque action qu'il effectue sous la forme de punition et de récompense elles aussi numériques. L'ordinateur ajuste alors ses actions en fonction de ce retour d'information, apprenant de ses erreurs et optimisant son comportement au fil du temps. L'apprentissage par renforcement est appliqué dans divers domaines, notamment les jeux, la robotique et les véhicules autonomes. En termes généraux, l'apprentissage par renforcement est le processus qui consiste à apprendre à un ordinateur à effectuer les actions les plus efficaces dans un environnement donné afin de maximiser les récompenses.
Reinforcement Learning, 2nd Edition
Richard S. Sutton and Andrew G. Barto, 2018,
Les algorithmes sont des ensembles d'instructions permettant de résoudre des problèmes de manière systématique. L'optimisation est le processus qui consiste à identifier la manière la plus efficace de résoudre un problème. Essentiellement, les algorithmes et l'optimisation peuvent être considérés comme des techniques soeurs permettant d'améliorer l'efficacité leurs efficacités. Les algorithmes et l'optimisation sont les pierres angulaires de l'intelligence artificielle pour ajuster les paramètres des modèles pour épouser les données. La maîtrise des algorithmes et des techniques d'optimisation fournit les outils théoriques, mais surtout pratiques, permettant d'en créer de nouveaux et d'adapter les anciens pour répondre à la spécificité de vos problèmes du monde réel.
Introduction to Algorithms
Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest and Clifford Stein, 2009,
Convex Optimization
Stephen Boyd and Lieven Vandenberghe, 2004,
Numerical Optimization, 2nd Edition
J. Frédéric Bonnans, J. Charles Gilbert, Claude Lemaréchal and Claudia A. Sagastizábal, 2006,
Numerical Recipes, 3rd Edition
William H. Press, Saul A. Teukolsky, William T. Vetterling and Brian P. Flannery, 2007,
Computational Optimal Transport
Gabriel Peyré and Marco Cuturi, 2019,
Le fait de garder des liens à la fois le monde de l'entreprise et le monde universitaire en intelligence artificielle est probablement le meilleur choix conscient de ma carrière jusqu'à présent. L'industrie et le monde universitaire sont deux mondes très différents, mais ils sont aussi complémentaires selon mon expérience. Parfois, la frontière est floue dans des institutions comme OpenAI ou des entreprises de valorisation dépassant le millier de milliards de dollars comme Microsoft Research, Baidu Research, Amazon Research ou Google Research (liste non exhaustive et dans un ordre aléatoire) qui contribuent avec des articles époustouflants et des boîtes à outils OpenSource comme le feraient d'excellents chercheurs dans des universités au meilleur niveau.
Pour être honnête, partir d'un problème industriel me permet de limiter certaines divagations scientifiques (que j'aime tant car elles sont une source de créativité déguisée !) au profit d'un plus grand impact sur le monde réel... ce qui justifie les efforts. Finalement, je suis récompensé par la satisfaction de faciliter la vie de quelqu'un d'autre, soulagé(e) de son problème initial. Ainsi, à ma façon, j'essaie de contribuer avec ce que je peux à ce rêve millénaire qu'est l'intelligence artificielle. Heureusement, j'ai eu la chance de continuer à travailler dans des environnements tant académiques que corporatifs avec des publications, des enseignements et des prototypes/moteurs en production.
Artificial Intelligence for Business — 2nd Edition
Warith Harchaoui, Laurent Pantanacce and Nicolas Renard, December 2022, Rennes School of Business
Generalised Mutual Information for Discriminative Clustering
Louis Ohl, Pierre-Alexandre Mattei, Charles Bouveyron, Warith Harchaoui, Arnaud Droit, Mickaël Leclercq and Frédéric Precioso, 2022, NEURIPS (ex-NIPS)
Artificial Intelligence for Business — 1st Edition
Warith Harchaoui, Laurent Pantanacce, March 2022, Rennes School of Business
Thoughts in 2021 about Hardware in Artificial Intelligence
Warith Harchaoui, November 2021,
Optimal transport-based machine learning to match specific expression patterns in omics data
Thi Thanh Yen Nguyen, Olivier Bouaziz, Warith Harchaoui, Christian Neri, Antoine Chambaz, July 2021,
La valeur de la donnée — Livre blanc pour l'intelligence artificielle
Warith Harchaoui et Laurent Pantanacce, Juin 2021, Closerie des Lilas à Paris pour 4ème Révolution
Invitation à l'intelligence artificielle du texte
Warith Harchaoui, May 2021, IUT de l'université de Paris
True Story for a Rare Punctuation Mark
Warith Harchaoui, March 2021,
Learning Representations using Neural Networks and Optimal Transport (Ph.D.)
Warith Harchaoui, September 2016 to October 2020, MAP5 — Université Paris Descartes
Mon travail de thèse a été sur l'intelligence artificielle pour:
Rencontre avec Luc Julia, l’IA n’existe pas !⎜ORLM-363
Luc Julia et Warith Harchaoui, February 2020, IUT de l'université de Paris
Une introduction aux réseaux de neurones
Warith Harchaoui, December 2018, MAP5 — Université Paris Descartes, Institut Henri Poincaré, École 42
Wasserstein Adversarial Mixture Clustering (WAMiC) — Poster
Warith Harchaoui, Pierre-Alexandre Mattei, Andrés Almansa and Charles Bouveyron, Summer 2018, Data Science Summer School — École Polytechnique
Artificial Intelligence, Machine Learning, Computer Vision and Natural Language Processing with Python
Warith Harchaoui, Mohamed Chelali, Matias Tassano, Pierre-Louis Antonsanti and Azedine Mani, Last updated in December 2022 (since December 2018), MAP5 — Université Paris Descartes
L'intelligence artificielle a besoin de calculs lourds. Pendant les années 2010, la communauté Deep Learning a ouvert la voie de l'accélération matérielle en utilisant historiquement les Unités de Traitement Graphiques (GPU) dédiées à la recherche en Mathématiques Appliquées au-delà du domaine des calculs graphiques.
Le but de cette page est de présenter un cheat sheet pour la programmation en Machine Learning
(c'est-à-dire l'Apprentissage Statistique, la Reconnaissance de Formes, l'Intelligence Artificielle, la Science des Données) pour de nombreuses applications telles que la Vision par Ordinateur, le Traitement du Signal et le Traitement du Langage Naturel.
Cette page a été utilisée de manière intensive au moins dans le MAP5, Oscaro.com, Jellysmack pour les Mathématiques Appliquées pour conduire des recherches en Apprentissage Machine (ML), Vision par Ordinateur (CV) et Traitement du Langage Naturel (NLP) en Python. N'hésitez pas à me contacter (Warith Harchaoui, ) pour des améliorations et des suggestions.