Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics information and knowledge of Big Data.

cta

Démarrer

cloud

Prêt à débuter ?

Télécharger Sandbox

Que pouvons-nous faire pour vous ?

fermerBouton Fermer
cta

Solutions big data Spark pour les entreprises à l'échelle

HORTONWORKS OFFRE SPARK POUR LES DÉPLOIEMENTS EN ENTREPRISE

cloud Hortonworks jouit d'une position dominante. Lisez le rapport Forrester Wave

Télécharger le rapport

Présentation

Apache™ Spark Overview

Hortonworks is unleashing the power of the Apache Spark big data processing framework for enterprise scale, unifying the capabilities of open enterprise Apache Hadoop® and the in-memory analytic capabilities of Apache Spark to maximize organizational value.

Spark is Better as Part of the Platform
Spark is certified as YARN-ready and is part of Hortonworks Data Platform. Memory and CPU-intensive enterprise Spark-based applications can coexist with other workloads deployed in a YARN-enabled cluster. Spark has first class support for external data sources, it can run directly on the cluster in YARN, and that is where enterprises want to perform their data analysis. This approach avoids the need to create and manage dedicated enterprise Spark clusters and allows for more efficient resource use within a single cluster. 

Spark Requires Enterprise-Grade Security and Governance
As part of the HDP platform, Spark has access to the same governance, security and management policies as other components of the HDP stack. The Spark big data processing framework is one the fastest moving projects in the Big Data ecosystem and its libraries remain at different levels of maturity. Hortonworks investigates, validates, certifies and then supports each of the components in the Spark project. This approach is key to the way we add value for our customers.

Notebooks Makes Spark and Data Science Easier to Consume & Share
Web-based notebooks bring data ingestion, exploration, visualization, sharing and collaboration capabilities to Hadoop and Spark. Hortonworks is making a substantial investment in Apache Zeppelin; we plan to make Zeppelin ready for production use by making it easier to use, while adding security, stability and R support.

By delivering a unified Apache Spark and Hadoop, we combine Spark-driven Agile Analytic workflows with the vast-data set and economics of Hadoop. With Hortonworks, enterprises can deploy the Apache Spark big data processing framework with the industry’s best security, governance, and operations capabilities.

QUEL EST L'INTÉRÊT D'HORTONWORKS POUR SPARK ?

Grâce à la mise à jour Spark 1.6, Hortonworks s'engage à aider les clients à faire progresser la science des données, à maintenir un accès continu aux données et à stimuler l'innovation au cœur de leur entreprise.

Les entreprises, qui utilisent le projet Spark dans le cadre d'Hadoop pour les entreprises en open source, peuvent le faire évoluer pour améliorer la valeur de leur organisation.

administrateur

Accélération de la science des données

Améliorez la productivité de la science des données en optimisant Apache Zeppelin et en contribuant à la création d'algorithmes et de modules Spark supplémentaires pour faciliter le développement de solutions clé en main.

Par exemple : le projet Magellan (analyse géospatiale dans Apache Spark) est une bibliothèque open source d'analyse géospatiale qui facilite les requêtes géospatiales et qui s'appuie sur Spark pour résoudre des problèmes difficiles suscités par les données géospatiales à grande échelle.

administrateur

Accès continu aux données

Spark SQL fournit des API SQL et de trame de données permettant d'accéder aux données structurées, tandis que Spark Streaming permet aux développeurs de créer une solution de traitement des trains de données, à la fois évolutive, à haut débit et insensible aux défaillances.

Hortonworks a amélioré l'intégration de Spark avec YARN, HDFS, Hive, HBase et ORC. Nous pensons en particulier que nous pouvons optimiser davantage l'accès aux données via la nouvelle API Data Source.

administrateur

Au cœur de l'innovation

Activez le partage RDD avec le niveau de mémoire HDFS

Créez des algorithmes supplémentaires pour l'apprentissage automatique

Enhance enterprise Spark’s security, governance, operations, and readiness

cta

Pour en savoir plus sur toutes les grandes innovations de Spark,

CONSULTEZ NOTRE PAGE APACHE SPARK.

AFFICHER LA PAGE

COMMENT PRENDRE UN BON DÉPART AVEC APACHE SPARK À L'ÉCHELLE DE L'ENTREPRISE ?

Écoutez notre récent webinaire - Spark à l'échelle de l'entreprise avec Hadoop