Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

cta

Démarrer

cloud

Prêt à débuter ?

Télécharger Sandbox

Que pouvons-nous faire pour vous ?

fermerBouton Fermer
cta

Solutions big data Spark pour les entreprises à l'échelle

HORTONWORKS OFFRE SPARK POUR LES DÉPLOIEMENTS EN ENTREPRISE

cloud Hortonworks is a leader. Read the Forrester Wave.

DOWNLOAD Report

Présentation



Hortonworks exploite la puissance d'Apache Spark à l'échelle de l'entreprise, tout en unifiant les capacités d'Apache Hadoop® pour les entreprises en open source et les fonctionnalités d'analyse en mémoire d'Apache Spark pour optimiser la valeur organisationnelle.

Optimisez Spark en l'utilisant dans la plateforme
Spark est certifié compatible YARN et fait partie intégrante d'Hortonworks Data Platform. Les applications Spark gourmandes en mémoire et CPU peuvent coexister avec d'autres charges de travail déployées dans un cluster YARN. Spark offre une prise en charge hors pair des sources de données externes. Il peut s'exécuter directement sur le cluster dans YARN, et c'est là que les entreprises souhaitent effectuer leurs analyses de données. Cette approche évite de devoir créer et gérer des clusters Spark dédiés et autorise une utilisation plus efficace des ressources au sein d'un seul cluster.

Spark nécessite une sécurité et une gouvernance de niveau professionnel
Faisant partie de la plateforme HDP, Spark a accès aux mêmes règles de gouvernance, de sécurité et de gestion que les autres composants de la pile HDP. Spark est l'un des projets dont l'évolution est la plus rapide dans l'écosystème du Big Data et ses bibliothèques ont des niveaux de maturité différents. Hortonworks étudie, valide, certifie et prend en charge chacun des composants du projet Spark. Cette approche est essentielle dans la façon dont nous ajoutons de la valeur pour nos clients.

Les blocs-notes facilitent l'utilisation et le partage de Spark et de la science des données
Les blocs-notes Web apportent à Hadoop et Spark des fonctionnalités d'ingestion, d'exploration, de visualisation et de partage des données, ainsi que des fonctionnalités de collaboration. Hortonworks a grandement investi dans Apache Zeppelin et nous prévoyons de l'adapter pour une utilisation dans des environnements de production en lui ajoutant des fonctionnalités de sécurité et de stabilité, une prise en charge du langage R et une plus grande simplicité d'utilisation.


En offrant une solution Apache Spark et Hadoop unifiée, nous combinons des flux d'analyse agiles axés sur Spark avec les vastes ensembles de données et les avantages économiques d'Hadoop. Grâce à Hortonworks, les entreprises peuvent déployer Apache Spark en utilisant les fonctionnalités de sécurité, de gouvernance et d'exploitation les plus avancées du secteur.

QUEL EST L'INTÉRÊT D'HORTONWORKS POUR SPARK ?

Grâce à la mise à jour Spark 1.6, Hortonworks s'engage à aider les clients à faire progresser la science des données, à maintenir un accès continu aux données et à stimuler l'innovation au cœur de leur entreprise.

Les entreprises, qui utilisent le projet Spark dans le cadre d'Hadoop pour les entreprises en open source, peuvent le faire évoluer pour améliorer la valeur de leur organisation.

administrateur

Accélération de la science des données

Améliorez la productivité de la science des données en optimisant Apache Zeppelin et en contribuant à la création d'algorithmes et de modules Spark supplémentaires pour faciliter le développement de solutions clé en main.

Par exemple : le projet Magellan (analyse géospatiale dans Apache Spark) est une bibliothèque open source d'analyse géospatiale qui facilite les requêtes géospatiales et qui s'appuie sur Spark pour résoudre des problèmes difficiles suscités par les données géospatiales à grande échelle.

administrateur

Accès continu aux données

Spark SQL fournit des API SQL et de trame de données permettant d'accéder aux données structurées, tandis que Spark Streaming permet aux développeurs de créer une solution de traitement des trains de données, à la fois évolutive, à haut débit et insensible aux défaillances.

Hortonworks a amélioré l'intégration de Spark avec YARN, HDFS, Hive, HBase et ORC. Nous pensons en particulier que nous pouvons optimiser davantage l'accès aux données via la nouvelle API Data Source.

administrateur

Au cœur de l'innovation

Activez le partage RDD avec le niveau de mémoire HDFS

Créez des algorithmes supplémentaires pour l'apprentissage automatique

Optimisez Spark pour obtenir une sécurité, une gouvernance, des opérations et une préparation de niveau professionnel

cta

Pour en savoir plus sur toutes les grandes innovations de Spark,

CONSULTEZ NOTRE PAGE APACHE SPARK.

AFFICHER LA PAGE

COMMENT PRENDRE UN BON DÉPART AVEC APACHE SPARK À L'ÉCHELLE DE L'ENTREPRISE ?

Écoutez notre récent webinaire - Spark à l'échelle de l'entreprise avec Hadoop