Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

cta

Démarrer

cloud

Prêt à débuter ?

Télécharger Sandbox

Que pouvons-nous faire pour vous ?

fermerBouton Fermer
cta

Architecture d'entrepôt de données Apache Hadoop pour l'optimisation des entrepôts

Réduisez vos coûts par le déplacement des données et de leur traitement vers Hadoop®

cloud Hortonworks is a leader. Read the Forrester Wave.

DOWNLOAD Report

Qu'est-ce qu'un EDE ?

L'entrepôt de données d'entreprise (EDE) est le principal référentiel de données d'une entreprise. Il a pour objectif d'appuyer les décisions stratégiques. L'EDE contient des données relatives aux domaines que l'entreprise souhaite analyser. Pour un fabricant, il peut s'agir d'un client, d'un produit ou d'une nomenclature. L'EDE est créé par l'extraction de données issues d'un certain nombre de systèmes opérationnels. Les données sont converties à mesure qu'elles sont introduites dans l'EDE. Puis, elles sont reformatées et synthétisées pour présenter une vue unique à l'entreprise. Les données sont ajoutées dans l'entrepôt de données au fil du temps sous la forme de snapshots et l'EDE contient en principe des données pouvant remonter à 5 ou 10 ans.

Optimisation de l'EDE

Problèmes rencontrés avec un EDE classique

L'entrepôt de données d'entreprise (EDE) est devenu une composante standard des architectures de données professionnelles. Cependant, la complexité et le volume des données mettent l'efficacité de cette solution à rude épreuve.

La réalisation du potentiel de transformation des Big Data dépend de la capacité des sociétés à gérer leur complexité, tout en tirant parti des différentes sources de données, comme les réseaux sociaux, le Web, l'Internet des Objets et plus encore. L'intégration de nouvelles sources de données dans le système EDE existant permettra aux sociétés d'effectuer davantage d'analyses, plus approfondies, pour bénéficier de meilleures informations. Plus important encore, il devient de plus en plus difficile pour les technologies EDE existantes de fournir un environnement extrêmement rentable tout en offrant des performances, une évolutivité et une flexibilité optimales.

Composants de la solution

Hortonworks Data Platform

*

Les puissantes fonctionnalités open source Hadoop pour la gouvernance, l'intégration, la gestion, l'accès, la sécurité et l'exploitation des données, conçues pour s'intégrer parfaitement avec la technologie existante de votre datacentre. En savoir plus

Syncsort

*

Un logiciel hautes performances d'extraction, de transformation et de chargement des données pour accéder facilement aux données traditionnelles de l'entreprise et les intégrer dans HDP. En savoir plus

À l’échelle

*

Une interface professionnelle offrant un système décisionnel rapide sur Hadoop pour combler le fossé entre les utilisateurs et leurs données. En savoir plus

Services Professionnels

*

L'assistance et des conseils d'experts afin de démontrer rapidement la valeur de votre nouvelle architecture et optimiser la valeur de la solution testée et validée de gestion de l'architecture de données proposée par Hortonworks. En savoir plus

Optmisation de l'EDE avec Apache Hadoop ®

Flexible

*

Les données peuvent être chargées dans HDP sans aucun modèle de données

*

Un modèle de données peut être appliqué en fonction des questions posées aux données (schéma en lecture)

*

HDP est conçu pour répondre aux questions à mesure qu'elles se présentent à l'utilisateur

Efficace

*

100 % des données sont disponibles au niveau granulaire pour l'analyse

*

HDP peut à la fois stocker et analyser des données structurées et non structurées

*

Les données peuvent être analysées de différentes façons pour soutenir des exemples d'utilisation variés

Rentable

*

HDP (Hortonworks Data Platform) est une solution entièrement ouverte - aucuns frais de licence pour les logiciels

*

HDP s'exécute sur du matériel générique

*

De nouvelles données peuvent être implantées dans HDP et utilisées dans les jours ou les heures qui suivent

Exemples d'utilisation de l'optimisation de l'EDE

EXEMPLE D’UTILISATION N°1
media img

Système décisionnel rapide sur Hadoop

Des systèmes propriétaires d'entreposage des données d'entreprise ont été adoptés pour créer des systèmes décisionnels rapides, et bénéficier d'outil d'analyse approfondie. Mais les EDE affichent des prix exorbitants et  ne sont pas adaptés aux défis posés par le Big Data aujourd'hui, tels que les données non structurées et l'analyse à grande échelle.

Hortonworks donne vie aux systèmes décisionnels rapides sur Hadoop, grâce à l'alliance d'un moteur SQL en mémoire ultra- rapide facilitant la création de magasins de données et d'un moteur à cubes OLAP vous permettant d'interroger d'énormes ensembles de données en quelques secondes. Ainsi, vous pouvez soit interroger des données agrégées au préalable pour obtenir des performances optimales, soit autoriser l'accès à partir des plus grands outils décisionnels prenant en charge ODBC, JDBC ou MDX lorsqu'un niveau de détail élevé est exigé.

En savoir plus

EXEMPLE D'UTILISATION 2
media img

INTÉGRATION DE PROCESSUS D'EXTRACTION, DE TRANSFORMATION ET DE CHARGEMENT DANS HADOOP

En général, un entrepôt de données d'entreprise (EDE) consacre entre 45 et 65 % de la puissance de ses processeurs au traitement des opérations d'extraction, de transformation et de chargement des données. Pour obtenir des ressources, ces tâches de faible valeur sont en concurrence directe avec d'autres charges de travail et peuvent empêcher le respect des accords sur les niveaux de service. Hadoop peut réduire ce type de tâches avec un minimum d'effort de portage et un coût nettement inférieur, tout en réalisant des économies et en libérant de la capacité dans votre EDE pour vos charges de travail d'analyse à forte valeur ajoutée. Hortonworks vous facilite la tâche en vous fournissant des outils hautes performances pour l'extraction, la transformation et le chargement des données, un puissant moteur SQL et une intégration avec tous les principaux fournisseurs de systèmes décisionnels.

En savoir plus

EXEMPLE D'UTILISATION 3
media img

ARCHIVAGE DE DONNÉES DANS HADOOP

L'augmentation des volumes de données et une forte pression sur les coûts incitent de nombreuses entreprises à archiver leurs anciennes données sur des bandes qui ne permettent pas leur analyse ou leur extraction à moindres frais.

Hadoop offre un coût par téraoctet équivalent aux solutions de sauvegarde sur bande. Cette solution économique vous permet de stocker non pas des mois mais des années de données. Toutes les données de votre entreprise restent disponibles pour l'extraction, l'interrogation et l'analyse approfondie à l'aide des mêmes outils que vous utilisez sur vos systèmes EDE existants.

En savoir plus