La catégorie des murs d'images a discrètement cessé de tourner autour des écrans en 2025. Les mouvements produits actuels — l'Infinity EdgeAI de Userful (annoncé avec Microsoft et NVIDIA fin 2025), la plateforme Cortex de Visiology sur le marché russe, et une liste discrète mais grandissante de projets internes chez Hiperwall, VuWall et Polywall — redéfinissent le mur comme une couche d'inférence qui se trouve piloter des écrans. La question produit n'est plus « combien de sources peut-il afficher », c'est « que remarque réellement le mur pour l'opérateur ». Cet article expose ce que livrent aujourd'hui les murs dotés d'IA, l'architecture qui tourne en dessous, pourquoi l'inférence sur site est le seul chemin qui survit à l'examen de conformité, et où la plupart de ces déploiements échouent réellement en production.
Ce que « doté d'IA » signifie réellement sur un mur
Retirez le vocabulaire marketing et il reste quatre fonctionnalités concrètes que le terme recouvre. Tout le reste est soit l'une de ces quatre sous un autre nom, soit une promesse de feuille de route qui n'a pas été livrée.
- Détection d'anomalies sur les flux en direct. Un modèle — typiquement quelque chose de la famille YOLO v8 / v9 pour la détection d'objets, ou un détecteur d'anomalies de séries temporelles plus léger pour les sources de tableaux de bord — s'exécute sur chaque flux ingéré et émet un score de confiance. Le contrôleur de mur s'abonne à ces scores et peut réagir lorsqu'ils franchissent un seuil. Courant dans les hubs de transport, la sécurité périmétrique et les tableaux de bord SCADA de l'énergie.
- Promotion de source (bascule de disposition automatique). Lorsqu'une détection se déclenche, la tuile correspondante s'agrandit, se déplace vers une zone centrale du mur et y reste jusqu'à ce qu'un opérateur l'acquitte ou que la détection s'efface. Le moteur de disposition doit prendre en charge à la fois les transitions douces (épinglage / zoom animés) et les coupures franches (réorganisation instantanée) — les opérateurs réagissent différemment à chacune.
- Comptage d'objets et métriques de présence. Comptage de visages pour les salles à forte densité de foule, comptage de véhicules / plaques d'immatriculation pour le trafic, longueur de file pour le commerce. La sortie est généralement un nombre superposé à la tuile source ou poussé vers un tableau de bord voisin rendu par le même mur.
- Corrélation inter-sources. Le palier le plus récent : alimenter plusieurs sources dans un seul pipeline d'inférence et émettre un unique « score de situation » qui pilote la disposition du mur. L'Infinity EdgeAI de Userful en fait la démonstration avec Splunk Enterprise Security + un flux VMS + une source de télémétrie de gestion de bâtiment unifiés dans un seul volet. La maturité reconnaît honnêtement que c'est précoce — la plupart des déploiements réels en restent à la détection d'anomalies mono-source en 2026.
Les références actuelles de la catégorie
Trois produits fixent la barre de la catégorie en 2026, chacun avec un pari différent.
Userful Infinity EdgeAI est le plus visible. Annoncé conjointement avec Microsoft (Azure IoT Edge pour le déploiement de modèles) et NVIDIA (partenariat Inception, inférence optimisée sur l'architecture Blackwell), il a été livré aux premiers clients fin 2025. Le positionnement est celui d'une « plateforme de connaissance des opérations » — Userful éloigne délibérément le produit du cadrage « logiciel de mur d'images » pour le placer dans une catégorie à plus forte marge. Les intégrations portent sur Splunk Enterprise Security, Genetec Security Center, Microsoft Sentinel, Everbridge CEM. La tarification suit le même modèle d'abonnement Enterprise que le reste de Userful ; les clients rapportent ≈ 500 $ par écran et par an pour le palier plateforme, le module EdgeAI constituant une ligne distincte.
Visiology Cortex est l'homologue russe, construit dans le cadre de la plateforme analytique Visiology plus large. Le pari est différent : plutôt que de s'associer à des hyperscalers, Visiology intègre le stack d'inférence dans la même installation sur site que le reste de la plateforme. Cela correspond à l'environnement de conformité russe (FZ-152, règles d'infrastructure critique FZ-187) mais restreint le menu de modèles — ce qui est livré est ce que Visiology a validé, pas ce que vous pouvez déposer depuis Hugging Face.
Hiperwall, VuWall, Polywall participent à la même conversation mais avec des livraisons actuelles plus restreintes. La version 2026 R1 de Hiperwall a ajouté un « chat opérateur sur site » (un outil de collaboration interne, pas l'inférence elle-même) et une prise en charge GPU Intel élargie. VuWall et Polywall évoquent des intégrations IA via leurs stacks TRx / Polywall compatibles NMOS. Aucun n'a la profondeur que le marketing EdgeAI de Userful revendique actuellement ; savoir si cet écart tiendra jusqu'en 2027 est la vraie question de catégorie.
L'architecture en dessous
Retirez les couches de marque et le stack d'exécution converge vers trois éléments.
- Le modèle. YOLO v8 et v9 (Ultralytics) sont le choix par défaut pour la détection d'objets — ils atteignent un point précision / latence exploitable sur des GPU NVIDIA grand public, et la licence (AGPL-3.0) est acceptable pour le déploiement type d'un contrôleur de mur. Pour des cas d'usage plus spécialisés — comptage de visages, reconnaissance de plaques, détection d'armes — le modèle adopte des têtes spécialisées mais la structure d'inférence reste similaire.
- L'environnement d'exécution. ONNX Runtime est la lingua franca : les fournisseurs exportent leur modèle PyTorch / TensorFlow au format ONNX, puis exécutent l'inférence via l'environnement agnostique au framework. Les deux backends qui comptent pour le matériel de mur : NVIDIA TensorRT pour les GPU de classe RTX (≈ 3-5× d'accélération par rapport à ONNX Runtime seul), et Intel OpenVINO pour les GPU intégrés Iris Xe et discrets Arc. Les deux backends acceptent le même fichier ONNX, si bien que le passage du modèle de production de NVIDIA à Intel est une décision au moment du déploiement, pas un réentraînement.
- L'orchestration. Microsoft Azure IoT Edge est le choix par défaut actuel pour « déployer ce conteneur avec ce modèle vers ce contrôleur de mur depuis un point central ». Pour les déploiements sur site sans orchestrateur externe, Kubernetes (k3s sur l'hôte du mur) couvre le même terrain au prix d'un effort de configuration supérieur. Le schéma consiste à conteneuriser chaque modèle et à laisser l'orchestrateur épingler les conteneurs aux GPU disponibles.
Le dimensionnement suit une règle empirique qui tient pour la plupart des déploiements publiés : un seul GPU de classe RTX A4000 absorbe la détection de classe YOLO sur 8 à 12 flux 1080p simultanés tout en laissant tenir à côté la charge de rendu du mur. Une RTX A5000 / A6000 double à peu près ce chiffre. Au-delà de ~20 flux, la charge IA commence à concurrencer le travail GPU du compositeur, et la bonne architecture est un nœud d'inférence séparé aux côtés du contrôleur de mur, qui renvoie les scores via un bus de messages au lieu de tourner sur le même GPU.
L'exigence du sur site n'est pas négociable
Toute acquisition sérieuse d'un mur doté d'IA aboutit à la même ligne rouge : la vidéo en direct ne peut pas quitter le site. Trois cadres réglementaires l'imposent.
- RGPD (UE). Les caméras enregistrant des personnes identifiables produisent des données personnelles au sens de l'article 4(1). Transmettre ces données à un point d'inférence cloud situé dans un pays tiers exige des garanties de niveau Schrems II que la plupart des sites n'ont pas. La réponse propre est « l'inférence s'exécute sur site, le cloud ne voit que des métadonnées, le cas échéant ».
- FZ-152 et FZ-187 (Russie). Respectivement les règles de localisation des données personnelles et d'infrastructure critique. Les clients étatiques russes et la plupart des sites d'énergie / de transport doivent exécuter l'inférence dans le pays, souvent sur place. Le pari de Visiology sur une inférence sur site intégrée est conçu spécifiquement pour cette contrainte.
- FedRAMP / DoD IL5+ (fédéral américain). L'IA en cloud pour les sites classifiés est une autorisation que l'équipe d'acquisition obtient rarement. L'inférence sur site avec un déploiement de modèle isolé du NIPRNet est l'attente par défaut.
L'enseignement architectural : la partie IA d'un mur doté d'IA n'est pas une fonctionnalité cloud que l'on greffe avec une clé d'API. C'est un fichier de modèle livré au contrôleur de mur et un environnement d'exécution installé à côté du compositeur. Les fournisseurs qui dissimulent une inférence cloud derrière une démo soignée perdent la vente à l'étape de la conformité.
Où ces déploiements se brisent réellement
Le modèle est rarement le point de défaillance. Trois problèmes opérationnels le sont. Quiconque repositionne un fournisseur en entreprise de murs IA doit avoir une réponse à chacun.
- Les faux positifs érodent la confiance de l'opérateur plus vite que le modèle ne s'améliore. Un mur qui promeut la mauvaise tuile au centre trois fois par quart de travail est ignoré à la quatrième promotion — la vraie. La parade standard est un double seuil : un seuil « afficher un petit indicateur sur la tuile » et un second seuil, plus élevé, pour une perturbation réelle de la disposition. Le produit doit offrir à l'opérateur un moyen clair d'ajuster les deux.
- La dérive du modèle est silencieuse jusqu'à ce qu'elle ne le soit plus. Un compteur de personnes calibré sur des données d'entraînement estivales se met à sous-compter les manteaux d'hiver épais dès novembre. Un détecteur de véhicules calibré sur des plaques européennes se dégrade au Moyen-Orient. Le produit a besoin d'une couche de surveillance — taux de faux positifs dans le temps, nombre de dérogations manuelles — qui donne à l'intégrateur un moyen de repérer la dérive avant le client.
- La piste d'audit des tuiles promues n'est pas négociable pour les acheteurs réglementés. Lorsque le mur a promu la caméra 17 au centre pendant 42 secondes à 14:03:17, quel était le score, quelle version de modèle l'a produit, quel acquittement opérateur a suivi ? La plupart des évaluateurs de conformité veulent pouvoir y répondre. Les fournisseurs qui ont une réponse livrent dans les sites réglementés ; ceux qui n'en ont pas restent dans l'AV d'entreprise.
La place de Craft Wall
Craft Wall est aujourd'hui le compositeur, pas le stack d'inférence. Le modèle de déploiement est le même serveur Linux sur site que celui sur lequel tourne le reste du produit, si bien qu'une charge ONNX Runtime aux côtés du compositeur fondé sur Vulkan est architecturalement propre — le même GPU sert les deux charges lorsque le nombre de flux le permet, et le passage à l'échelle consiste à ajouter un nœud d'inférence à côté du contrôleur de mur, le compositeur s'abonnant aux scores. Le travail sur les emplacements ONNX et l'API de disposition pilotée par les scores figurent sur la feuille de route plutôt que dans les versions actuellement livrées ; la mention du produit ici est honnête plutôt qu'aspirationnelle. Pour les acquisitions qui nécessitent de l'IA aujourd'hui, la bonne voie est Userful ou Visiology selon la juridiction ; Craft Wall s'inscrit dans la conversation 2026-2027 comme l'option sur site et agnostique au matériel une fois le chemin ONNX livré.
Une conclusion honnête
Les murs d'images dotés d'IA ne constituent pas encore une catégorie de produits — ce sont un schéma de déploiement qu'un fournisseur (Userful) articule actuellement le mieux et qu'un second (Visiology) livre le mieux à l'intérieur d'un régime réglementaire unique. La plupart des autres fournisseurs y parviendront en 2026-2027. La question de l'acheteur n'est pas « quel fournisseur de murs IA est le meilleur », c'est « quel cas d'usage justifie réellement l'inférence sur le mur, et notre infrastructure le prend-elle déjà en charge ». La détection d'anomalies sur un périmètre de 12 caméras est un cas qui colle bien. La corrélation inter-sources entre SIEM + VMS + BMS est la démo marketing que la plupart des sites ne feront pas tourner avant deux ans encore.
À lire ensuite : Edge AI pour murs d'images (entrée de glossaire), IPMX vs ST 2110 vs SDVoE pour la question de transport sous-jacente, et la comparaison Craft Wall vs Userful pour voir comment la brique IA s'intègre dans une évaluation concurrentielle.
Questions fréquentes
Quelles fonctionnalités IA sont réellement livrées dans les murs d'images NOC et SOC en 2026 ?
Trois classes de fonctionnalités sont en production : (1) Détection d'anomalies sur les flux de caméras IP — détection d'objets de classe YOLO exécutée sur le contrôleur de mur via ONNX ; (2) Suggestion de disposition automatique — le ML recommande l'agencement des sources selon les habitudes de travail des opérateurs ; (3) Synthèse des alertes — un LLM condense les flux SIEM et de supervision en tuiles classées par priorité. Userful Infinity EdgeAI et Visiology Cortex sont les implémentations 2026 les plus citées.
Comment fonctionne la détection d'anomalies par IA sur un mur d'images ?
Le contrôleur de mur exécute une inférence de détection d'objets (typiquement la famille YOLO v5 / v8, ~30 ms par image sur GPU de classe RTX) sur les flux de caméras IP. Lorsque le modèle détecte une anomalie (personne en zone interdite, objet abandonné, signature de fumée / d'incendie), il met automatiquement en évidence la tuile de la caméra avec une bordure colorée, déclenche une alerte dans l'interface opérateur et marque optionnellement l'image pour examen. Les règles de détection sont configurables par caméra.
Les modèles YOLO peuvent-ils tourner sur un contrôleur de mur d'images ?
Oui — les contrôleurs de mur modernes dotés de GPU de classe RTX exécutent YOLOv8n (nano) à ~120 FPS par flux et YOLOv8m (medium) à ~30 FPS par flux. Le goulot d'étranglement est la mémoire GPU plutôt que le calcul — chaque flux d'inférence parallèle nécessite ~500 Mo de VRAM. Une seule RTX A4000 (16 Go) prend en charge jusqu'à 16 flux de détection d'anomalies simultanés. Les modèles sont chargés via ONNX runtime pour un déploiement neutre vis-à-vis du fournisseur.
Pourquoi la plupart des murs d'images dotés d'IA échouent-ils en production ?
La confiance de l'opérateur, pas la précision du modèle. Même à 95 % de précision, le taux de 5 % de faux positifs habitue les opérateurs à écarter les alertes IA — au deuxième mois, l'IA est décorative. Les déploiements réussis investissent dans : (1) un calibrage par caméra pour porter la précision au-dessus de 99 % dans la scène spécifique, (2) une boucle de retour opérateur qui réentraîne sur les alertes écartées, (3) des seuils de confiance visibles par les opérateurs afin qu'ils puissent interpréter plutôt que faire aveuglément confiance.
L'inférence IA sur site est-elle réaliste pour un NOC, ou faut-il le cloud ?
Le sur site est pleinement réaliste pour les cas d'usage NOC. La latence d'inférence YOLO sur GPU local est de 20-50 ms contre 200-500 ms d'aller-retour vers le cloud — la voie sur site l'emporte sur l'expérience opérateur. Pour les secteurs réglementés (énergie, banque, défense), le sur site est en outre la seule option acceptable au regard de la conformité. L'inférence IA en cloud n'a de sens que lorsque la charge d'inférence dépasse la capacité GPU locale — typiquement au-delà de 30 flux vidéo simultanés avec des modèles lourds.