Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics information and knowledge of Big Data.

cta

Démarrer

cloud

Prêt à débuter ?

Télécharger Sandbox

Que pouvons-nous faire pour vous ?

fermerBouton Fermer
cta

Apache Hadoop Data Warehouse Architecture for EDW Optimization

Reduce Costs by Moving Data and Processing to Hadoop®

cloud Hortonworks jouit d'une position dominante. Lisez le rapport Forrester Wave

Télécharger le rapport

Qu'est-ce qu'un EDE ?

Enterprise Data Warehouse (EDW) is an organization’s central data repository that is built to support business decisions. EDW contains data related to areas that the company wants to analyze. For a manufacturer, it might be customer, product or bill of material data. EDW is built by extracting data from a number of operational systems. As the data is fed into EDW it is converted, reformatted and summarized to present a single corporate view. Data is added into the data warehouse over time in the form of snapshots and normally an enterprise data warehouse contains data spanning 5 to 10 years. A Hadoop data warehouse architecture enables deeper analytics and advanced reporting from these diverse sets of data.

Optimisation de l'EDE

Problèmes rencontrés avec un EDE classique

The Enterprise Data Warehouse has become a standard component of the corporate data architectures. However, the complexity and volume of data has posed some interesting challenges to the efficiency of existing EDW solutions.

Realizing the transformative potential of Big Data depends on the corporations’ ability to manage complexity while leveraging data sources of all types such as social, web, IoT and more. The integration of new data sources into the existing EDW system will empower corporations more and deeper analytics and insights. More importantly, EDW optimization using Hadoop provides a highly cost-efficient environment with optimal performance, scalability and flexibility.

Composants de la solution

Hortonworks Data Platform

*

Powerful open Hadoop data warehouse architecture with capabilities for data governance and integration, data management, data access, security and operations—designed for deep integration with your existing data center technology. Learn More

Syncsort

*

EDW offload to Hadoop - High-performance ETL software to access and easily onboard traditional enterprise data to HDP. Learn More
 
 

Services Professionnels

*

L'assistance et des conseils d'experts afin de démontrer rapidement la valeur de votre nouvelle architecture et optimiser la valeur de la solution testée et validée de gestion de l'architecture de données proposée par Hortonworks. En savoir plus

EDW optimization with Apache Hadoop ®

Flexible

*

Data can be loaded in HDP without having a data model in place

*

Un modèle de données peut être appliqué en fonction des questions posées aux données (schéma en lecture)

*

HDP est conçu pour répondre aux questions à mesure qu'elles se présentent à l'utilisateur

Efficace

*

100 % des données sont disponibles au niveau granulaire pour l'analyse

*

HDP peut à la fois stocker et analyser des données structurées et non structurées

*

Les données peuvent être analysées de différentes façons pour soutenir des exemples d'utilisation variés

Rentable

*

HDP (Hortonworks Data Platform) est une solution entièrement ouverte - aucuns frais de licence pour les logiciels

*

HDP s'exécute sur du matériel générique

*

De nouvelles données peuvent être implantées dans HDP et utilisées dans les jours ou les heures qui suivent

Exemples d'utilisation de l'optimisation de l'EDE

EXEMPLE D’UTILISATION N°1
media img

Système décisionnel rapide sur Hadoop

Des systèmes propriétaires d'entreposage des données d'entreprise ont été adoptés pour créer des systèmes décisionnels rapides, et bénéficier d'outil d'analyse approfondie. Mais les EDE affichent des prix exorbitants et  ne sont pas adaptés aux défis posés par le Big Data aujourd'hui, tels que les données non structurées et l'analyse à grande échelle.

Hortonworks donne vie aux systèmes décisionnels rapides sur Hadoop, grâce à l'alliance d'un moteur SQL en mémoire ultra- rapide facilitant la création de magasins de données et d'un moteur à cubes OLAP vous permettant d'interroger d'énormes ensembles de données en quelques secondes. Ainsi, vous pouvez soit interroger des données agrégées au préalable pour obtenir des performances optimales, soit autoriser l'accès à partir des plus grands outils décisionnels prenant en charge ODBC, JDBC ou MDX lorsqu'un niveau de détail élevé est exigé.

En savoir plus

EXEMPLE D'UTILISATION 2
media img

INTÉGRATION DE PROCESSUS D'EXTRACTION, DE TRANSFORMATION ET DE CHARGEMENT DANS HADOOP

A typical EDW spends between 45 to 65 percent of its CPU cycles on ETL processing.These lower-value ETL jobs compete for resources with more business-critical workloads and can cause SLA misses. Hadoop can EDW offload these ETL jobs with minimal porting effort and at substantially lower cost, saving money and freeing up capacity on your EDW for higher-value analytical workloads. Hortonworks makes it easy by providing high-performance ETL tools, a powerful SQL engine and integration with all major BI vendors.

En savoir plus

EXEMPLE D'UTILISATION 3
media img

ARCHIVAGE DE DONNÉES DANS HADOOP

L'augmentation des volumes de données et une forte pression sur les coûts incitent de nombreuses entreprises à archiver leurs anciennes données sur des bandes qui ne permettent pas leur analyse ou leur extraction à moindres frais.

A Hadoop data warehouse architecture offers cost per terabyte on par with tape backup solutions. Because of the appealing cost, you can store years of data rather than months. All of your enterprise data remains available for retrieval, query and deep analytics with the same tools you use on existing EDW systems.

En savoir plus