Startups françaises

Une analyse des technologies utilisées par les entreprises françaises et les industries qui ont levé le plus de fonds ces dernières années.

Même pour moi qui travaille dans la tech il est difficile de se faire une idée des technologies utilisées par les startups françaises. Quels sont les langages d'avenir ?  Pour quoi faire ? Les informations sont éparpillées, fragmentaires et souvent obsolètes. L'année dernière j'ai eu envie de me faire ma propre idée sur la question.

Durant l'été 2020 j'ai eu l'occasion de fabriquer des bots qui agrègent et corrigent chaque chaque jour des données provenant de Crunchbase, Dealroom et Welcome to the Jungle. Il s'agit essentiellement d'informations telles que le suivi des nouvelles levées de fonds en France, et des détails structurels sur chacune des entreprises concernées comme la taille de leurs équipes, le secteur d'activité, les technologies utilisées, le nombre d'offres d'emplois, etc.

Elles sont consultables publiquement ci dessous :

StartupNation | Les startups françaises qui recrutent
À la recherche d’une startup française à rejoindre ? Explorez notre base de données mise à jour quotidiennement.

Couplées à des données empiriques sur des levées de fonds des années passées, on peut déterminer grossièrement si une levée récente est au dessus ou en dessous de la moyenne des levées du même type. Cet article technique condense et synthétise ces prospections.

Mon tableau de bord de suivi des levées de fonds en France - https://startupnation.love

Les données utilisées dans cet article datent de Mai 2021. L'analyse des technologies employées provenant des profils Welcome to the Jungle des entreprises, il s'agit essentiellement de structures de moins de 10 ans d'ancienneté - à quelques exceptions près puisqu'on y trouve aussi Europcar (1949), SeLoger (1992), Veepee (ex Ventes Privées) (2001), Meetic (2001), BlaBlaCar (2006), Deezer (2006), LaFourchette (2007), Betclic (2007), PrestaShop (2007), Webedia (2007), Withings (2008), Dashlane (2009) et quelques autres -.

À l'heure où j'écris ces lignes, sur 3099 entreprises enregistrées sur Welcome to the Jungle seules 1931 ont déclaré au moins une technologie utilisée chez elles. Les conclusions techniques ci dessous reposent sur cette section, on ignorera les autres. La répartition approximative des types d'usage des technologies (et des types d'entreprises qui en découlent) est la suivante:

  1. Web (SaaS et service en ligne) - environ deux tiers des entreprises
  2. Machine (système embarqué, hardware, sécurité et multimédia)
  3. Data (analyse de données et intelligence artificielle)

À savoir :

  • Une entreprise peut renseigner plusieurs technologies de la même catégorie et cumuler plusieurs frameworks du même langage
  • Chaque catégorie ci dessous est accompagnée d'un graphique indiquant le pourcentage de questions portant sur chaque technologie sur StackOverflow, on peut y voir une courbe de tendances (plus un langage ou framework est utilisé plus on pose de questions à son sujet) mais il faut la prendre avec des pincettes
  • Un langage peut faire beaucoup parler de lui s'il est très utilisé, ou s'il est complexe, ou encore s'il est appliqué dans plusieurs domaines à la fois, rendant la comparaison des courbes entre elles sur un même graphique peu pertinente ; seule la tendance à la hausse ou à la baisse l'est.

Frontend

test alt
Les frameworks utilisés par moins de 15 entreprises sont écartés

Environ 1500 entreprises (soit 80%) utilisent un framework web frontend. La vaste majorité repose sur des frameworks de moins de 6 ans d'ancienneté. En 2015 Angular passait en version 2 (le premier "vrai" framework JS front) et React commençait à peine à émerger.

Les deux frameworks les plus couramment choisis par les nouvelles entreprises sont React en majorité et Vue en 2e position.

Backend

Les frameworks utilisés par moins de 50 entreprises sont écartés

Environ 1400 entreprises (soit 70%) utilisent un framework web backend. On note que presqu'aucune entreprise n'indique précisément de framework pour Node.js (type Express ou Nest) et se contente d'afficher "Node.js".

Node.js est de loin la technologie back la plus utilisée, et encore privilégiée par les nouvelles entreprises.

Bases de données

Les bases de données utilisés par moins de 50 entreprises sont écartées

Il y a assez peu d'écarts d'utilisation entre PostgreSQL, MySQL et MongoDB. Les stacks basées sur Node.js pâtissent d'ORM assez mauvais pour le SQL, comme Sequelize ou Knex, les poussant à utiliser très couramment MongoDB, d'où son succès.

PostgreSQL prend cependant le pas sur MySQL dans la catégorie SQL ces dernières années.

Un grand nombre d'entreprises indiquent utiliser ElasticSearch ou Redis pour leur cache ou search engine.

Langages

Le graphique ci dessous se base sur les auto déclarations de langages utilisés par les entreprises. Il donne des indications sur ce que les entreprises considèrent utiliser comme langages "natifs" (excluant les frameworks) et nécessitant des connaissances approfondies.

Les langages utilisés par moins de 100 entreprises sont écartés

Le Python est le langage privilégié. Le Java et le .NET sont généralement des reliquats issus d'entreprises plus anciennes et sont sous représentés chez les entreprises plus récentes.

⚠️ Cependant cette synthèse est trompeuse pour plusieurs raisons:

  • Les langages web sont sous représentés. Généralement on trouve la liste des frameworks web sur les profils d'entreprises plutôt que les langages associés. Comme vu précédemment Node.js est assigné sur près de 900 entreprises mais la vaste majorité n'a pas spécifié Javascript sur leur profil
  • Le Javascript et le Typescript sont considérés comme des langages différents mais on pourrait les regrouper

Voyons plus bas un découpage dédié uniquement au web.

Langages et frameworks web

Pour se donner une meilleure idée de l'usage comparatif des langages web, le graphique ci dessous classe les langages utilisés déduits des framework renseignés par les entreprises (Node.js donne Javascript, Laravel donne PHP et ainsi de suite).

On ne compte pas plus d'une fois chaque langage par entreprise (React JS + Node JS ne comptent que pour 1 Javascript). L'usage du Python pour la Data Science ne compte pas dans le total. Javascript et Typescript sont fusionnés en Javascript. Seuls les frameworks web sont pris en compte.

Les langages utilisés par moins de 100 entreprises sont écartés

90% des entreprises de Welcome to the Jungle utilisent du Javascript au moins en front ou en back. L'usage du Javascript équivaut à plus de 2 fois l'usage du Python tout usage confondu (web, machine et data science) qu'on considère plus haut comme langage le plus utilisé hors web.

Plus d'1 entreprise web sur 3 utilise du PHP ou du Python, et la plupart de celles ci utilise au moins React JS ou Vue.js pour leurs pages en ligne.

Secteurs

En se basant sur les données de Welcome to the Jungle on peut établir une répartition par secteur. On peut avoir ici aussi plusieurs secteurs par entreprise.

Malheureusement Welcome to the Jungle mélange "catégorie de service" (type "Application" ou "Consulting") et "industrie" (type "Santé" ou "Immobilier") dans ses secteurs ce qui complique l'interprétation.

Parmi ces catégories on trouve la mention Tech / Logiciel qui indique qu'1 entreprise sur 2 sur Welcome to the Jungle vend un service SaaS, un logiciel, une appli mobile ou du traitement de données. On trouve aussi en 2e position le consulting, en 3e position les agences de communication ainsi que le e-commerce dans la partie Distribution.

Si on écarte ces catégories on trouve les industries dans l'ordre:

  • banque, finance et assurance
  • éducation, formation et recrutement
  • santé, social et environnement
  • industrie, énergie, bâtiments et télécom
  • culture, média, jeu vidéo et sport
  • transport et mobilité
  • puis d'autres industries moins représentées

Investissements par industrie

Le graphique ci dessous condense les levées de fonds réalisées par les entreprises françaises chaque années depuis 2015, et réparties par type d'industrie. Ces données émanant de Dealroom, les catégories ne sont pas les mêmes que celles de Welcome to the Jungle vues précédemment.

Intéressant à remarquer:

  • En 2019 et 2020 (début de la crise covid) les industries qui ont levé le plus de fonds sont la santé et le logiciel
  • En 2020 (en pleine période covid), 2 industries ont connu une forte accélération économique: le marketing et le légal
  • En 2021 (premier semestre uniquement et non représenté sur le graphique) à la sortie du covid, 1 industrie a connu une forte accélération économique: l'immobilier
Ces sujets vous intéressent ?
S'abonner à la newsletter

Vous recevrez chaque nouvel article par email dès sa parution.
Garanti sans spam ni publicité.

Votre abonnement à la newsletter est validé !
Félicitations ! Votre abonnement à la newsletter est validé.
Félicitations ! Votre abonnement à la newsletter est validé.