-
Pentaho Business Analytics CE
Pentaho Business Analytics fournit toutes les fonctionnalités attendues d’une suite décisionnelle. Son moteur ETL (Pentaho Data Integration) exposent une riche collection de connecteurs notamment ceux permettant une intégration facile des technologies Big Data. L'analyse multidimensionnelle s'appuie sur le moteur OLAP Mondrian ... todo
R
R offre une grande variété d'outils d'analyses statistiques - test statistique classique, analyse de séries chronologiques, modélisation linéaire et non linéaire, classification, segmentation, ... - couramment mis en œuvre en analyse prédictive ou pour la conception de systèmes auto-apprenants. R dispose d'une vaste bibliothèque graphique et produit des tracés de haute qualité comprenant les symboles et formules mathématiques.
Anaconda
Python et R sont devenus des langages de programmation de référence dans la pratique de la science des données. Anaconda renferme plus de 330 modules Python open source et intègre les librairies essentiels du langage R. Grâce à cette puissante combinaison, les capacités de réalisations de la Business Intelligence à la modélisation avancée de Big Data sont quasiment sans limite...
Python 3.0
Python est un langage flexible, puissant facile à apprendre et à programmer. Il dispose de puissantes bibliothèques pour le traitement et l'analyse de données. Python possède la capacité unique d'être à la fois un langage de programmation généraliste performant tout en présentant des fonctions de haut niveau pour du calcul analytique et quantitative...
Elastic Stack
Elastic Stack combine plusieurs produits open source dont les très populaires : Elasticsearch, Logstash, Kibana et Beats. Elastic Stack rend l'extraction, la recherche, l'analyse et la visualisation des données en temps réel plus faciles que jamais. En créant cette suite, la société Elastic fournit une plateforme capable de délivrer des informations exploitables en temps réel à partir de presque n'importe quelle source de données structurées et non-structurées.
Jupyter Notebook
Jupyter Notebook est une application Web qui permet de créer et de partager des documents contenant du code interactif, des calculs, des visualisations et des commentaires. Il est utilisé pour la préparation et transformation des données, la simulation numérique, la modélisation statistique, l'apprentissage automatique et bien d'autres traitements. Jupyter est un outil Open source.
RapidMiner
RapidMiner est un environnement intégré de développement et de prototypage rapide d'applications dédiées à l'apprentissage automatique, l'exploration de données, l'analyse prédictive, l'analyse décisionnelle... Il fournit tous les processus nécessaires au datamining y compris la préparation des données, la visualisation, la validation et l'optimisation des résultats.
Spark Apache (Framework Big Data)
Apache Spark exécute en une seule fois la totalité des opérations d'analyse de données en mémoire et en quasi-temps réel. Spark peut être jusqu'à 100 plus rapide que MapReduce pour l'analyse en mémoire. C'est la solution de fait pour l'analyse en streaming (capteurs, campagnes de marketing en temps-réel, recommandations, analyse de sentiments, surveillance des logs...)