cta

Démarrer

cloud

Prêt à débuter ?

Télécharger Sandbox

Que pouvons-nous faire pour vous ?

fermerBouton Fermer
cta

Optimisez la valeur des données au repos

lire la bouton de la vidéo vidéo

cloud Prêt à débuter ?

READ THE BLOG
HORTONW0RKS DATA PLATFORM (HDP®)

HORTONW0RKS DATA PLATFORM (HDP®)

HDP est la seule véritable distribution d'Apache™ Hadoop® Open Source sécurisée et optimisée pour l'entreprise fondée sur une architecture centralisée (YARN). HDP répond à la totalité des besoins pour les données au repos, optimise les applications client en temps réel et fournit des analyses efficaces pour accélérer la prise de décision et l'innovation.

Powering the Future of Data
S'ABONNER

INTÉGRATION DE LA GOUVERNANCE

Cycle de vie et gouvernance des données

Flux de données

EXPLOITATION

Provisionnement, gestion et surveillance

Programmation

SÉCURITÉ

Administration, authentification, autorisation, audit, protection des données

ACCÈS AUX DONNÉES

S T
HDFS(Système de fichiers distribué Hadoop)

GESTION DES DONNÉES

Le cœur de Hortonworks Data Platform

YARN et le système de fichiers distribués Hadoop (HDFS) sont les composants clés de Hortonworks Data Platform (HDP). Pour votre Big Data Lake, HDFS fournit du stockage évolutif, rentable et insensible aux défaillances. De son côté, YARN vous fournit une architecture centralisée capable de traiter simultanément diverses charges de travail. Les fonctionnalités de gestion des ressources YARN ainsi que son architecture adaptable permettent de prendre en charge un grand nombre de méthodes d'accès aux données.

Plus d'informations : 

Gestion des données

Des moteurs d'analyse, de traitement et de streaming des données pour diverses charges de travail

Hortonworks Data Platform comporte un grand nombre de systèmes de traitement. Votre entreprise peut ainsi utiliser simultanément plusieurs méthodes de traitement des mêmes données. Les applications peuvent donc interagir avec les données de façon optimale : traitements par lots, SQL interactif ou accès à faible temps de latence avec NoSQL. Apache Spark, Kafka et Storm prennent également en charge les nouvelles utilisations dans le cadre des opérations d'analyse, de recherche et de streaming.

Plus d'informations : 

Accès aux données

Chargez et gérez vos données conformément à vos politiques

HDP élargit l'accès aux données ainsi que leur gestion grâce à des outils de gouvernance et d'intégration des données particulièrement efficaces. Ils fournissent un cadre fiable, simple et reproductible pour la gestion du flux de données vers et depuis Hadoop. Cette structure de contrôle ainsi que les outils de simplification et d'automatisation de l'application de schémas ou de métadonnées aux sources, sont vitales pour la réussite de l'intégration de Hadoop dans votre architecture moderne de données.

Les ingénieurs de Hortonworks sont en relation avec les meilleurs fournisseurs de solutions de gestion des données afin que celles-ci s'intègrent et fonctionnent dans HDP.

Plus d'informations : 

Gouvernance et intégration des données

Authentification, autorisation et protection des données

La sécurité de HDP est assurée de façon intégrée à tous les niveaux. Les fonctionnalités vitales d'authentification, d'autorisation, de responsabilité et de protection des données vous permettent de sécuriser HDP pour l'ensemble de ces exigences clés. À l'image de l'ensemble des fonctionnalités de Hadoop pour les entreprises, HDP vous permet également d'intégrer et d'élargir vos solutions de sécurité actuelles afin de protéger votre architecture de données moderne sous un bouclier unique, cohérent et sécurisé.

Plus d'informations : 

Sécurité

Éliminez les conjectures sur l'utilisation de Hadoop

Les équipes d'exploitation déploient, surveillent et gèrent un cluster Hadoop au sein de leur écosystème élargi de données d'entreprise. Apache Ambari simplifie cette expérience. Ambari est une plateforme de gestion Open Source pour l'approvisionnement, la gestion, la surveillance et la sécurité de Hortonworks Data Platform. Elle permet à Hadoop de s'adapter en toute transparence à l'environnement de votre entreprise.

Plus d'informations : 

Exploitation

Approvisionnez et gérez des clusters Hadoop dans n'importe quel environnement cloud

Cloudbreak, qui est intégré à Hortonworks Data Platform et optimisé par Apache Ambari, vous permet de simplifier l'approvisionnement des clusters dans n'importe quel environnement cloud (Amazon Web Services, Microsoft Azure, Google Cloud Platform et OpenStack). Il optimise votre utilisation des ressources cloud en suivant l'évolution des charges de travail.

Plus d'informations : 

Cloud

NOUVEAUTÉS DE HORTONWORKS DATA PLATFORM 2.6

administrateur

Innovation et performance

  • Accès aux dernières fonctionnalités de science des données. Prise en charge étendue des algorithmes d'apprentissage automatique disponible dans Spark 2.1, Spark 1.6.3, Zeppelin 0.7 et Livy REST API.
  • Hive LLAP en production. Obtenez des performances 10x plus rapides grâce au filtrage dynamique du runtime.
  • Conformité avec les propriétés ACID. Accélérez considérablement et autorisez les modifications de données en streaming / micro-batchs dans l'entrepôt de données Hive via des mises à jour incrémentielles.
  • Requêtes < 1 sec pour les outils d'informatique décisionnelle. Plus besoin désormais de reproduire les données dans Hadoop en les stockant d'abord dans une base de données analytique sur SQL.
administrateur

Prête pour les entreprises

  • Exporter / Importer les politiques de sécurité de Ranger. Améliorez la productivité en transférant les politiques de sécurité de manière groupée d'un environnement à l'autre.
  • Prise en charge étendue des politiques identifiées par des balises avec Atlas dans tout l'écosystème. Les workflows de sécurité peuvent être classés dans HDFS, Kafka et HBase.
  • Sécurité des lignes et des colonnes. Mettez en place un contrôle très précis de l'accès aux données à chaque niveau de la pile Hadoop, y compris dans Spark et Hive.
  • Prise en charge SSL pour les connexions de Spark Streaming à Kafka. Des environnements sécurisés pour Spark Streaming et Kafka.
administrateur

Facilité d’utilisation

  • Démarrage automatique du service. Configurez facilement les services et composants devant démarrer automatiquement si un nœud de cluster redémarre ou si le daemon plante.
  • Configuration simplifiée de la rotation des logs. Configurez rapidement le nombre et la taille des fichiers de sauvegarde pour tous les composants.
  • Visualisation des opérations et des utilisateurs finaux les plus fréquents sur HDFS. Découvrez les opérations les plus fréquemment réalisées sur le NameNode et les utilisateurs à l'origine de ces opérations.
  • Prise en charge de package pour PySpark (Spark Python API) et SparkR. Les data scientists qui utilisent Spark avec le langage R peuvent désormais déployer leur package R préféré au sein d’une tâche Spark.
Téléchargements HDP

Découvrez les récentes fonctionnalités HDP avec Hortonworks Sandbox ou configurez HDP pour un environnement de production avant d'installer et de configurer vos clusters.

Extensions HDP

Découvrez les extensions HDP pour connecter la solution aux outils décisionnels répandus, optimiser les requêtes de recherche et bien plus encore.