Technologies
Les outils technologiques du Big Data et de l’IA sont nombreux. Avec une prépondérance de l’éco-système open-source (autour de Apache Hadoop), le domaine est très innovant. Bases de données NoSQL (MongoDB, HBase, CouchDB ou Redis par exemple), architectures applicatives (Data Lake), infrastructures cloud, outils d’intégration (Talend, Nifi…), outils et langages pour la data science et l’IA (Python, Scala, Knime, Dataiku…), virtualisation des données, in-memory… Les technologies se multiplient et les choix sont complexes à réaliser.
Découvrez les fondamentaux des solutions technologiques, et profitez de nos tutoriels dédiés aux outils et langages Data.
Fondamentaux technologiques data
Voir tous les contenus-
Fondamentaux technologiques data
Misez sur l’approche Mixture of Experts pour des LLMs plus rapides et plus efficaces
La course est lancée pour construire des modèles de langage de plus en plus grands et meilleurs ! Mais à mesure que les LLMs grandissent, ils deviennent de plus en plus ingérables. Les coûts computationnels sont astronomiques et les gains de performance commencent à plafonner. Mixture of Experts (MoE), une architecture astucieuse ancrée dans les années…
-
Fondamentaux technologiques data
DMP, DataLake, CDP : les solutions pour la qualification des données
Comment choisir la solution la plus adaptée à la qualification des données pour ses projets Data ? Quels sont les critères à prendre en compte ? Les réponses de Didier Gaultier, Directeur Data Science et IA (Orange Business) et de Simon Boivin, Senior Manager (Ekimetrics), à l’occasion de la table-ronde animée par Philippe Leroy lors de la…
-
Premium
Fondamentaux technologiques data
Replay | Maintenez vos données fiables et prêtes pour l’analyse
Vous vous demandez comment maintenir des données fiables et prêtes pour l’analyse ? Dans ce webinar maintenant disponible en replay, vous découvrirez les enjeux de la gestion de données hétérogènes ainsi qu’une solution agnostique, plébiscitée par Gartner, pour des données fiables et prêtes à l’emploi. Optimiser la gestion de votre Datawarehouse et gérer des données hétérogènes ?…
-
Fondamentaux technologiques data
Cartographie et Open Data : comprendre les bases pour votre business
L’Open Data et la Data Science permettent aujourd’hui d’optimiser l’analyse des données géographiques en mesurant des interactions très compliquées à modéliser autrement.
-
Fondamentaux technologiques data
Du datalake au datawarehouse agile : le décisionnel à l’ère du big data
Le concept de datalake lié à la mouvance Big Data est un moyen pour les entreprises de mettre en œuvre une plateforme de stockage de données fédérée s’appuyant sur les apports des technologies Big Data. Mais comment combiner un datalake avec un datawarehouse ?
-
Fondamentaux technologiques data
Maîtriser la qualité de ses (Big) Data avec le marquage
Les Big Data sont en grande partie alimentées par les données du web. Julien Coquet nous explique l'importance de mettre en place des plans de marquage exhaustifs sur les sites pour assurer la qualité des digital analytics
-
Fondamentaux technologiques data
Les enseignements du Glossaire Big Data de O’Reilly
En 2013, les Big Data faisaient partie des 7 ambitions stratégiques de la France déterminées par la Commission Innovation 2030. Aux côtés du stockage de l’énergie, de la médecine individualisée ou de l’innovation au service de la longévité (silver economy), la valorisation des données massives est un enjeu qu’il importe que la France et ses…
-
Fondamentaux technologiques data
Business Intelligence et Big Data : nouvelle ère technologique
Quand on évoque le sujet des Big Data et de la Business Intelligence (BI), il n’est pas rare d’obtenir deux avis opposés : ceux qui disent que la Business Intelligence va être remplacée par les Big Data d’une part. Et un autre point de vue, diamétralement opposé, qui consiste à dire que les Big Data n’apportent rien par rapport à…
-
Fondamentaux technologiques data
Le Big Data repousse les limites de la loi de Moore
Le Big Data apparaît aujourd’hui comme une continuité logique et une évolution naturelle du décisionnel. Après avoir rappelé dans le précédent article les fondamentaux de la BI, cet article se propose de faire un retour sur les limites de la loi de Moore et l’impact sur les architectures décisionnelles. C’est le deuxième article d’une série de trois sur le thème…
-
Fondamentaux technologiques data
Les fondamentaux de la Business Intelligence
Le Big Data apparaît aujourd’hui comme une continuité logique et une évolution naturelle du décisionnel. Cet article se propose de faire un retour sur les fondamentaux de la Business Intelligence et ce qui a fait son succès. C’est le premier article d’une série de trois sur le thème « De la BI au Big Data ». Les principes de la Business…
Solutions technologiques
Voir tous les contenus-
Solutions technologiques
Copilotage Intelligent avec Microsoft Azure : Approche d’architecture pilotée par les indicateurs de performance
Les avancées en intelligence artificielle générative, notamment via les LLMs (Large Language Models), ouvrent des perspectives inédites d’amplification des capacités humaines dans les entreprises. Comme l’ont souligné Brynjolfsson et McAfee (2014), l’IA peut jouer un rôle de co-pilote cognitif, venant enrichir, et non remplacer, les expertises humaines. OpenAI (2018) confirme cette vision d’augmentation humaine, en…
-
Premium
Solutions technologiques
Replay | Azure Arc ou comment optimiser vos usages Microsoft on premise
Comment maximiser la sécurité et l’efficacité de votre infrastructure ? Azure Arc peut transformer la gestion de vos serveurs SQL et Windows tout en restant sur site. Nos explications en vidéo pour tout comprendre de cette extension essentielle dédiée à la gestion de vos serveurs on-premise.… Optimisez la gestion de vos serveurs SQL et Windows avec…
-
Premium
Solutions technologiques
Replay | Liferay : accélérez le développement de vos applications digitales avec une plateforme low-code souveraine
Dans un marché en constante évolution, la rapidité de déploiement des expériences et applications digitales est essentielle pour garder une longueur d’avance. 70% des entreprises considèrent l’accélération du Time to Market comme une priorité stratégique. Mais elles sont aussi 65% à estimer que les solutions logicielles « sur étagère » ne répondent pas à leurs besoins spécifiques.…
-
Premium
Solutions technologiques
Replay | Améliorez la performance de votre entreprise grâce aux solutions Microsoft
Comment optimiser le pilotage de la performance de votre entreprise, digitaliser vos processus et faciliter le partage d’informations avec vos collaborateurs ? Nos experts vous répondent dans ce webinar dédié aux technologies Microsoft. Un événement à revoir en replay…. Optimisez la pilotage de la performance de votre entreprise Si vous êtes client de l’offre Working Together…
-
Premium
Solutions technologiques
Replay | Révolutionnez vos directions métiers : Innovez, performez, excellez !
L’automatisation permet aux équipes de réduire le temps consacré à la préparation des données, et leur donnent donc plus de temps pour prendre des décisions éclairées. Dans ce webinar à revoir en replay, on vous présente les clés de la simplification des processus d’analyse et de l’automatisation du traitement des données. Découvrez des stratégies efficaces…
-
Solutions technologiques
Passer du ML au MLOps avec Dataiku
Vous souhaitez utiliser le MLOps dans votre projet d’intelligence artificielle, sans consacrer trop du temps au développement, ou sans avoir les compétences nécessaires en codage ? Rassurez-vous, nul besoin d’être un ténor du code pour s’assurer que vos modèles en production sont toujours cohérents avec les données actualisées… Il est possible d’utiliser des techniques de MLOps…
-
Premium
Solutions technologiques
Replay | Une plateforme pour réunir tous vos portails : Liferay, la solution de vos expériences digitales
Marketplace & e-Commerce, Intranet & Extranet, Partenaires & Fournisseurs, modules de Marketing Analytics ou Relationnels… Orange Business a placé Liferay au cœur de sa stratégie Digitale et réalisé de nombreux cas d’usage. Des retours d’expérience à découvrir dans ce webinar à revoir en replay… La polyvalence de Liferay permet d’adresser tous vos cas d’usage digitaux,…
-
Premium
Solutions technologiques
Replay | Cdiscount : les recettes Data & IA du leader e-commerce
Cdiscount a placé la data et les IA au cœur de sa stratégie. Analytique, Intelligence Artificielle, Data Mesh, Big Data, Data Cloud, la démarche du leader e-commerce s’est construit au fil de challenges techniques exceptionnels. On fait le point dans ce webinar à revoir en replay… En ligne de mire : l’entreprise data & Ai driven.…
-
Premium
Solutions technologiques
Replay | Optimiser, gérer et contrôler ses coûts avec la Plateforme Data Cloud Snowflake
Comment les entreprises peuvent-elles optimiser leurs coûts dans un contexte de besoin d’analyses toujours plus important ? Réponses avec le retour d’expérience de Peaksys, filiale Tech de Cdiscount, présenté lors Data Cloud World Tour Paris. Une conférence à revoir en replay. Plateforme Data Cloud / Maîtrise des coûts : le retour d’expérience de Peaksys Dans cette vidéo,…
-
Premium
Solutions technologiques
Replay | MLOps Dataiku : 15 minutes pour déployer un modèle d’IA en production
Le Machine Learning Ops (MLOps) est au cœur de nombreuses problématiques actuelles des entreprises ayant besoin de faire réentraîner régulièrement leurs modèles. Comment déployer un modèle d’intelligence artificielle en production ? Réponses dans ce webinar à revoir en replay. Dans cette vidéo, vous allez découvrir comment Dataiku répond aux 3 principales problématiques du MLOps : ✅ Challenge…
-
Solutions technologiques
Fin de Talend Open Studio… comment réagir ?
Talend Open Studio, c’est fini ! Quels impacts pour votre entreprise ? Quelles sont les solutions ? On en discute en détail dans cet article. Décidément le monde de la data est particulièrement en ébullition en cette fin d’année. Après le débarquement aussitôt réintégré du co-fondateur d’OpenAI qui ne manque pas de soulever des débats dans nos communautés…
-
Premium
Solutions technologiques
Replay | Data Lakes Hadoop : 3 scénarios d’évolution
L’écosystème Hadoop est dans la tourmente ! Fusion de Cloudera et Hortonworks, quasi-mort de Mapr, nouvelle version CDP complexe à appréhender ! Si votre plateforme data est construite avec cet écosystème, si votre Data Lake est bâti sur Hadoop, vous devez vous poser la question de son évolution… Alors quelles sont les options ? S’envoler dans le cloud ?…
-
Premium
Solutions technologiques
Replay | Plateforme Management Cloud : Promesse ou réalité ? Quels bénéfices ?
De nouvelles plateformes 100% Cloud Native dédiées au Data Management émergent pour répondre aux nombreux challenges liés à la gestion de données. Nos experts vous en détaillent les enjeux et pourquoi vous devriez adopter une plateforme de Data Management Cloud. Un webinar à revoir en replay. La gestion de la donnée doit aujourd’hui répondre à…
-
Premium
Solutions technologiques
Replay | Data / IA dans le Cloud : on fait le point avec Google Cloud
Google Cloud propose l’une des solutions les plus complètes et plus performantes du marché pour valoriser vos données dans le Cloud. Intégration de données, streaming, calcul, IA, analytique, dashboarding, gouvernance… l’offre est complète pour permettre de réaliser efficacement tous vos projets data. Un webinar à revoir en replay. Si les avantages de cette plateforme sont…
Tutoriels outils et langages data
Voir tous les contenus-
Tutoriels outils et langages data
Snowflake : pourquoi et comment coder directement en Python ?
Snowflake, la plateforme d’hébergement de données dans le cloud est reconnue pour sa puissance, sa flexibilité et sa sécurité. Elle offre un large éventail de services pour stocker, analyser, partager des données, et permet désormais aux développeurs de coder directement en Python depuis son interface. On fait le point… Snowflake s’appuie sur les principaux fournisseurs…
-
Tutoriels outils et langages data
Snowflake : les Dynamic Tables peuvent-elles remplacer les ETL/ELT ?
Après toutes les annonces de Snowflake lors du Summit et Snow Day de l’année dernière, les nouvelles fonctionnalités arrivent progressivement en General Availibility. C’est désormais au tour des Dynamic Tables, et nous allons donc nous y attarder pour comprendre ce qu’elles peuvent apporter comme cas d’usage et surtout comment les mettre en place. C’est parti !…
-
Tutoriels outils et langages data
Certification éditeur : vos projets, vos clients et vous avez tout à y gagner
« J’ai le plaisir de vous annoncer que j’ai obtenu une nouvelle certification XX (insérer ici un éditeur 😉 ) » est devenu un post récurent sur les réseaux sociaux comme LinkedIn. Les certifications sont un sujet à part entière dans le monde informatique, et les avis sont souvent tranchés ! Alors faut-il se certifier ? Alerte spoil, dans cet…
-
Tutoriels outils et langages data
Certification Databricks Certified Associate Developer for Apache Spark : comment la passer avec brio ?
Dans ce guide, je vous partage mon expérience personnelle sur la préparation et le passage de la certification Databricks Certified Associate Developer for Apache Spark, ainsi que mes conseils pour la réussir. À vous de jouer ! Je commencerai par une présentation générale de la certification, puis vous expliquerai comment réviser cette certification et, pour terminer,…
-
Tutoriels outils et langages data
Move2cloud : et si c’était le moment de repenser vos dashboards ?
Les avantages du cloud ne sont aujourd’hui plus à prouver. L’élasticité, les coûts réduits, la maintenance simplifiée des serveurs ont déjà convaincu grand nombre d’entreprises de migrer leurs plateformes data dans le cloud. Pour bénéficier d’avantages encore plus nombreux, les entreprises migrent également leurs solutions de restitution des données vers le cloud, en 4 étapes.…
-
Tutoriels outils et langages data
Utiliser les API REST de Microsoft Power BI avec Power BI Report Server
Comme promis lors d’un précédent article « Utiliser Power BI pour monitorer… Power BI », voici un tutoriel destiné à vous expliquer comment utiliser les API REST de Microsoft Power BI, mais avec la contrainte de l’environnement Report Server. C’est parti ! La documentation Microsoft indique en préambule que « les API REST Power BI fournissent des points de…
-
Tutoriels outils et langages data
Move2cloud : Tests de non-régression ? Arrêtez de perdre du temps !
De plus en plus d’entreprises migrent vers le cloud pour bénéficier de ses avantages. Elasticité, scalabilité, performances, coût à l’usage… La Data est alors extraite des bases de données On Premise et envoyée vers le nouveau socle technique (Snowflake, GCP, Azure, AWS…). Dans cet article, nous verrons comment accélérer vos tests de non-régression, étape primordiale…
-
Tutoriels outils et langages data
Utiliser Power BI pour monitorer… Power BI !
Vous êtes responsable de la gestion d’un environnement Power BI ? Des statistiques sur vos rapports Power BI vous aideraient à démontrer votre impact, à prioriser la mise en avant de rapports, ou à améliorer les performances d’actualisation et/ou d’utilisation. Pourquoi alors ne pas utiliser Power BI pour monitorer Power BI ?! Les données de Power BI…
-
Tutoriels outils et langages data
Cas d’usage : créer un accélérateur de migration Data As Code
Dans le cadre d’une migration/standardisation d’un patrimoine applicatif de Cloudera v6 vers Cloudera Data Platform v7, et au vu du nombre de projets (~70) écrits en Spark-Scala ou PySpark-Python à porter, nous avons choisi de développer un programme pour automatiser une partie des transformations : changement des noms des tables, des chemins HDFS, nom de projet,……
-
Tutoriels outils et langages data
EL, ELT et ETL : savez-vous différencier ces processus de traitement de données ?
Dans le monde de la Data, on rencontre régulièrement les termes EL, ELT et ETL. Ce sont 3 acronymes qui se ressemblent, et signifient : Extract and Load (EL), Extract, Load, and Transform (ELT) et Extract, Transform, and Load (ETL). Ils expriment surtout des processus de traitement de la donnée bien différents que nous allons aborder…
-
Tutoriels outils et langages data
Supervision opérationnelle d’une plateforme Big Data Hadoop : les 5 étapes du processus
Dans ce nouvel article dédié à la question du monitoring technique et opérationnel d’une plateforme Big Data Hadoop, sous Horton Works (HDP) ou Cloudera (CDH), et désormais avec Cloudera Data Platform (CDP) ou des alternatives sous Kubernetes, nous allons entrer dans le détail des différentes étapes du processus de la supervision opérationnelle. Cette seconde partie…
-
Tutoriels outils et langages data
Supervision opérationnelle d’une plateforme Big Data Hadoop : périmètres et grands principes
Dans cet article, nous allons aborder la question du monitoring technique et opérationnel d’une plateforme Big Data Hadoop, sous Hortonworks (HDP) ou Cloudera (CDH), et désormais avec Cloudera Data Platform (CDP) ou des alternatives sous Kubernetes. Le sujet étant vaste, nous avons réparti l’effort dans 2 articles. Ce premier article va permettre d’introduire le sujet,…
-
Tutoriels outils et langages data
Spark Structured Streaming : les tests de performance
Spark est un framework open source de calcul distribué. Plus performant qu’hadoop, disponible avec trois langages principaux (Scala, Java, Python), il s’est rapidement taillé une place de choix au sein des projets Big Data pour le traitement massif de données aussi bien en batch qu’en streaming. Depuis la version 2.0, Spark propose une nouvelle approche…
-
Tutoriels outils et langages data
Apache Kafka expliqué à mes grands-parents
Quand on travaille dans le secteur des nouvelles technologies (souvent abstraites et complexes), ce n’est pas toujours simple d’expliquer le travail que nous réalisons ou encore le fonctionnement d’un programme. Je me suis donc prêté à un exercice de vulgarisation sur Apache Kafka avec comme objectif de pouvoir le faire comprendre à mes grands-parents. J’aime…