Comment nous avons construit un Customer 360 complet dans Snowflake avec Cortex Code

Greg Wolszczak 5 juin 2026

Construire un véritable Customer 360 est l'une des initiatives les plus demandées - et les plus enlisées - dans les programmes data d'entreprise. L'ambition est toujours claire : une vue unifiée du client, des insights prédictifs, des actions remontées aux personnes qui en ont besoin. L'exécution, elle, est souvent douloureuse. Des mois de travail sur les pipelines. Des outils fragmentés. Des modèles ML qui ne sortent jamais des notebooks. Des dashboards qui montrent ce qui s'est passé, pas ce qu'il faut faire ensuite.

Nous avons décidé de tout reconstruire from scratch, dans Snowflake, avec Cortex Code comme moteur. Ce qui en est sorti a changé notre façon d'aborder la livraison.

Ce qu'est vraiment Cortex Code

Cortex Code est l'assistant de codage IA agentique de Snowflake, intégré directement dans la plateforme. Le mot agentique est important - il ne se contente pas de compléter des lignes de code. Il planifie, raisonne sur plusieurs étapes, écrit et exécute du code dans votre environnement Snowflake, inspecte les résultats, se corrige, puis passe à la tâche suivante. Vous décrivez ce que vous voulez construire. Cortex Code détermine comment le construire.

Pour une équipe data, cela change la donne. L'écart entre savoir quelle architecture vous avez besoin et l'avoir opérationnelle dans Snowflake - un écart qui prend normalement des semaines d'ingénierie - se réduit à quelques heures. Non pas parce que l'ingénierie disparaît, mais parce que Cortex Code gère la traduction mécanique de l'intention vers le code. Votre équipe reste concentrée sur les décisions qui nécessitent vraiment de l'expertise : quoi construire, pourquoi, et si le résultat fait sens pour le métier.

Le cas d'usage : Customer 360

Le scénario vous semblera familier. Cinq systèmes sources déconnectés - CRM, transactions, tickets support, catalogue produits, clickstream du portail - chacun géré par une équipe différente, aucun n'étant relié aux autres. Des centaines de milliers de lignes de données sales, cloisonnées dans des silos. Et une question que tout directeur commercial dans un secteur à forte intensité d'actifs et de contrats a posée à un moment ou un autre : qui est sur le point de partir, quelle est leur valeur, et comment mettre ça devant mes account managers avant qu'il soit trop tard.

On retrouve ce schéma dans de nombreux secteurs - industrie, services professionnels, distribution technologique, services financiers. Les données sont là. La question est claire. Ce qui bloque ces projets, ce n'est pas le manque d'ambition. C'est le poids de l'ingénierie entre la donnée brute et une décision sur laquelle quelqu'un peut agir.

Alors nous l'avons construit. Un Customer 360 de bout en bout couvrant la prédiction du churn, le scoring de la valeur client à vie (CLV), et une couche d'activation qui remonte des actions de rétention priorisées aux account managers. Pas une preuve de concept sur des données propres. Un pipeline opérationnel sur des données réalistes, multi-sources et désordonnées. En une fraction du temps qu'aurait pris un projet traditionnel.

Dans un engagement classique, c'est un effort multi-chantiers : ingénierie des données, feature engineering, modélisation ML et développement applicatif en parallèle, avec des outils différents, des points de transfert distincts, et un calendrier en mois. Nous avons abordé les choses différemment - et Cortex Code en est la raison.

La couche données - de la donnée brute au Golden Record

Le premier défi, c'était la donnée elle-même. Cortex Code a généré l'architecture medallion complète et écrit la logique de transformation pour chaque couche. Dans la seule couche de staging, il a produit plus de quarante opérations de nettoyage sur cinq tables : standardisation de valeurs catégorielles incohérentes - réduisant des dizaines de variantes sales à des valeurs propres et contrôlées - parsing de trois formats de date différents, marquage des enregistrements invalides plutôt que leur suppression, pour préserver l'auditabilité.

Ce qui a rendu ça rapide, ce n'était pas seulement la génération de code. C'est que Cortex Code a raisonné sur les données. Face à une colonne avec des formats mixtes, il a diagnostiqué le pattern, proposé la logique de nettoyage, la testé sur les vraies données dans Snowflake, et confirmé le résultat avant de passer à la suite. Une tâche qui occuperait normalement un ingénieur data pendant des jours a été bouclée en une seule session.

Le résultat : un Golden Customer Record - une table matérialisée, une ligne par client, avec les cinq sources jointes sur une identité client unique. Par-dessus, Cortex Code a calculé des champs déterministes (nombre de commandes, volume de tickets, date de dernière connexion) et des signaux dérivés qui captent des patterns que la donnée brute ne peut pas exprimer seule : ratios de tendance des dépenses sur les 90 derniers jours vs les 90 jours précédents, tendance d'achat des consommables, scores de quintile RFM, scores d'engagement composites, et un indice de risque de churn de 0 à 100.

Le signal de tendance des consommables illustre bien pourquoi les features dérivées comptent. Dans un secteur de contrats de services et d'équipements, un client qui cesse de commander des consommables est probablement en train de décommissionner ses appareils - des mois avant de résilier formellement le contrat. Le ratio de tendance dérivé transforme ça en un nombre que le modèle peut réellement apprendre.

La couche ML - deux modèles, une priorité

Avec le Golden Customer Record en place, Cortex Code a entraîné deux modèles directement dans Snowflake. Pas d'environnement Python à configurer, pas de plateforme ML externe, pas de données sortant du périmètre Snowflake.

Le premier : un classifieur de prédiction du churn. Il prend la table d'entraînement labellisée, apprend les relations entre les features et la variable cible, et retourne un modèle stocké dans Snowflake. Cortex Code a écrit l'appel d'entraînement, évalué les métriques de performance, et généré la requête de scoring sur l'ensemble de la base clients - en sortant un score de churn et un niveau de risque (Élevé, Moyen, Faible) pour chaque client. L'importance des features est incluse, permettant aux utilisateurs métier de voir quels signaux ont conduit chaque prédiction plutôt que de recevoir un chiffre opaque.

Le second : un modèle de régression sur la valeur client à vie (CLV) - entraîné sur les historiques de dépenses et les signaux clients, scoré sur toute la base, produisant une CLV prédite et un segment de valeur en cinq niveaux (de Bronze à Diamond).

Combiner les deux - risque de churn sur un axe, valeur à vie sur l'autre - produit la logique de priorisation qui pilote tout le reste. Risque élevé et forte valeur : c'est l'appel du lundi matin. Faible risque et faible valeur : ça peut attendre. Ce quadrant transforme 48 000 clients en une liste actionnable.

La couche d'activation - de l'insight à l'action

La plupart des projets Customer 360 s'arrêtent au score. Une liste classée remise à l'équipe commerciale, sans contexte ni prochaine étape claire. Nous sommes allés plus loin.

Pour chaque client à risque, Cortex Code a généré un appel qui transmet les signaux du client à un grand modèle de langage fonctionnant dans Snowflake. Aucune donnée ne sort du périmètre. Le modèle retourne trois choses : pourquoi ce client est à risque, en langage naturel ; ce que l'account manager devrait faire ; et quelle opportunité d'upsell existe en fonction de son historique d'achat. Ces outputs sont stockés comme colonnes dans la table curated - des insights générés par IA traités comme de la donnée structurée, requêtables et rafraîchissables.

Par-dessus, Cortex Code a scaffoldé une application Streamlit de sept pages connectée à toutes les couches : vue d'ensemble client, résultats des modèles de churn et CLV avec importance des features, profil Customer 360 complet, tableau de bord des actions de rétention avec messages de relance prêts à copier, vue pipeline de renouvellement, et page de santé du pipeline. L'account manager voit qui appeler, pourquoi, et quoi dire. C'est toute l'expérience.

Le tableau de bord des actions de rétention est le point final d'un pipeline qui commence avec cinq fichiers CSV désordonnés. Cortex Code a connecté chaque étape - nettoyage, jointure, feature engineering, entraînement des modèles, scoring, inférence LLM et visualisation - dans un seul environnement Snowflake, sans changer d'outils.

Ce que ça change

Cortex Code ne remplace pas les ingénieurs data ni les data scientists. Les décisions d'architecture, la logique du feature engineering, le choix des modèles, la logique métier derrière la couche d'activation - tout ça nécessite une vraie expertise. Ce qu'il remplace, c'est la traduction mécanique entre une décision et le code qui tourne. Les heures à écrire du SQL à la main. Les allers-retours pour déboguer une expression de nettoyage. Le boilerplate du déploiement de modèles. Les changements de contexte entre outils. En pratique :

Plus rapide à la valeur - De la définition du problème à quelque chose avec lequel les parties prenantes peuvent interagir, en jours plutôt qu'en mois.
Moins de risques - Tout reste dans Snowflake, gouverné et auditable, sans toolchain patchwork à maintenir ou à sécuriser.
Accès élargi - La compétence qui compte se déplace de l'écriture de l'expression de nettoyage à la compréhension de pourquoi la règle de nettoyage est importante. C'est un meilleur endroit où déployer l'expertise senior.
Crédibilité dès le premier jour - Un prototype fonctionnel en première semaine n'est pas seulement efficace. C'est un type de conversation différent avec le métier.

Ce que ça signifie pour nos clients

Cortex Code n'est aussi bon que l'expertise qui le sous-tend. Il accélère la livraison, mais il ne remplace pas le fait de savoir quoi construire, pourquoi ça compte, et comment faire la différence entre un modèle qui performe et un qui en a l'air.

Chez SBI, nous l'avons fait. Nous avons conçu l'architecture de transformation, écrit la logique de feature engineering, sélectionné et validé les modèles, construit la couche d'activation, et utilisé Cortex Code pour l'exécuter à un rythme qui n'aurait pas été possible autrement. C'est cette combinaison que nous apportons aux engagements Snowflake : la profondeur pour prendre les bonnes décisions, les outils pour les exécuter sans l'attente habituelle.

Partagez cet article

Nos Actus

8 juin 2018

Cognitive Search : des recherches plus pertinentes grâce à l’IA

Le Cognitive Search révolutionne les moteurs de recherche en dépassant la simple logique de mots-clés grâce à l’IA et au machine learning. Les...

1 juillet 2025

Découvrez nos accélérateurs Strategy®

Industrialiser une BI robuste, évolutive et utile aux métiers grâce à une couche sémantique enrichie et des accélérateurs, pour tirer le meilleur...

13 mai 2025

Comment ouvrir la voie à une première initiative en IA ?