Big Data Automation - Fonctionnalités

Un outil unique pour accélérer les analytiques big data dans tous les langages et frameworks scientifiques : R, Spark, Hadoop, Matlab and Scilab.

Vue d’ensemble

Avec la complexification des problèmes scientifiques et techniques modernes, le temps de calcul et les besoins en mémoire augmentent. Pour assurer des traitements volumineux, le calcul parallèle s’impose. ProActive s’intègre avec les environnements scientifiques et techniques tels que R, Spark, Hadoop, Matlab et Scilab. Directement à partir de ces environnements familiers, le logiciel offre aux utilisateurs la capacité de distribuer les exécutions et de gérer les transferts de données sur d’autres ordinateurs de bureau, clusters, grilles et clouds.

ProActive Distributed R

R logo

Accélération des calculs statistiques

L’approche distribuée du R permet à ProActive de s’intégrer au R Project pour le calcul statistique afin de permettre l’exécution distribuée à distance de fonctions R sur des infrastructures hétérogènes (Linux, Windows, MacOS X) via une API puissante directement depuis l’interpréteur en ligne de commande R.

Le langage R est largement utilisé par les statisticiens et les professionnels du data mining pour le développement de logiciels statistiques et l’analyse de données. R fournit une grande variété de techniques statistiques et graphiques, y compris la modélisation linéaire et non linéaire, les tests statistiques classiques, l’analyse des séries temporelles, la classification, le regroupement et d’autres. R est utilisé dans divers domaines tels que la finance, la biologie et la bioinformatique, et est facilement extensible.

ProActive Distributed R fait partie de l’offre standard R, qui se connecte à ProActive Workflows & Scheduling.

ProActive Distributed Spark

ProActive Distributed Spark permet d’interfacer plusieurs clusters Apache Spark. Tous les clusters Spark sont accessibles et gérés à partir d’une seule interface. Les jobs Spark sont programmés pour utiliser l’infrastructure existante de manière efficace.

Spark est un langage de programmation destiné au développement sur des logiciels de haute intégrité, utilisés dans des systèmes où un fonctionnement prévisible et hautement fiable est essentiel. Spark facilite le développement d’applications qui exigent de la sécurité ou de business intelligence.

ProActive Distributed Spark fait partie de l’offre standard Spark, qui se connecte à ProActive Workflows & Scheduling.

spark logo

ProActive Distributed Hadoop

hadoop logo

ProActive Distributed Hadoop permet d’interfacer plusieurs clusters Apache Hadoop. Tous les clusters Hadoop sont accessibles et gérés à partir d’une seule interface. Les jobs Hadoop sont planifiés pour utiliser efficacement l’infrastructure existante.

Apache Hadoop est un framework logiciel open source écrit en Java pour le traitement distribué de très grands ensembles de données sur des clusters d’ordinateurs construits à partir du commodity computing. Tous les modules de Hadoop sont conçus en partant de l’hypothèse fondamentale que les pannes matérielles sont courantes et doivent donc être automatiquement traitées dans le logiciel par le framework.

ProActive Distributed Hadoop est fourni en tant que package Hadoop standard, connecté à ProActive Workflows & Scheduling.

ProActive Distributed Matlab

Exécutez vos calculs plus rapidement. Optimisez vos coûts de licences

ProActive Distributed Matlab distribue de façon transparente vos modèles et programmes Matlab à partir de votre environnement Matlab interactif vers diverses ressources telles que les ordinateurs de bureau de vos collègues, les serveurs et clusters d’entreprise, les grilles incluant d’autres sites d’entreprise, les clouds privés ou hybrides. Les sources Matlab, votre environnement interactif actuel, les fichiers d’entrée, les paramètres et les résultats sont transférés de manière transparente sur le réseau vers les machines cibles.

Par rapport à Mathworks Parallel Computing Toolbox™ et Distributed Computing Server™, ProActive Distributed Matlab est plus flexible et peut être déployé sur des infrastructures hétérogènes (postes de travail Windows, Linux et Mac combinés, machines virtuelles dans le cloud) et peut même optimiser l’utilisation des licences Matlab avec ProActive Licence Saver.

ProActive Distributed Matlab est une boîte à outils Matlab standard, qui se connecte à ProActive Workflows & Scheduling.

matlab logo

ProActive Distributed Scilab

scilab logo

Accélérez vos calculs en utilisant toutes vos ressources

ProActive Distributed Scilab permet l’exécution distribuée et à distance de calculs Scilab directement depuis l’environnement Scilab. Il offre les mêmes fonctionnalités que l’intégration Matlab décrite ci-dessus et de plus la même API, permettant aux utilisateurs de passer très facilement d’un connecteur à l’autre.

Scilab est un équivalent libre et open source de Matlab. Il offre les mêmes fonctionnalités de base telles que la manipulation facile des matrices, l’implémentation d’algorithmes, l’interfaçage. Il est connu comme la meilleure alternative open source de Matlab.

ProActive Distributed Scilab est un module standard ATOMS Scilab qui se connecte à ProActive Workflows & Scheduling.