La préparation des données, par Pierre-Raffaele

En data science la « data préparation » est très importante.

Les structures doivent gérer un nombre de plus en plus important de données, et les traiter dans des délais qui de plus en plus cours. Avec les changements de plus en plus fréquents liés aux comportements des utilisateurs, il faut sans-cesse les remettre à jour les données.

Une entreprise qui maîtrise le processus de préparation des données, et dispose d’outils performants permettant l’automatisation du processus s’assure d’obtenir de meilleurs résultats d’analyse de ses données.

Une maîtrise et une bonne compréhension de ses données représente un enjeu essentiel dans la prise de choix stratégiques. Il convient donc d’avoir des données correctes, fiables et cohérentes avec le temps.

Dans cette vidéo Pierre-Raffaele nous explique ce qu’est la préparation des données avec ses lego.

Avec le data cleaning, la préparation des données occupe facilement 80% du temps des data scientists. La démonstration technique a été réalisée avec le logiciel Anatella disponible gratuitement sur le site timi.eu.

Une production d’  https://www.intotheminds.fr

Pour en savoir plus sur la data visualisation : https://www.intotheminds.com/blog/data-visualisation/