Au final, travailler sur ses données permet :
A vrai dire, aujourd'hui tout est un peu data, ou a la possibilité de le devenir.
On regroupe sous le terme data toutes les données qui concernent notre activité, qui existent généralement au format numérique.
Il peut s'agir de chiffres de vente, de quantités et de natures d'interventions, de quantités d'objets produits, de quantités de ressources consommées, de nombre de kilomètres parcourus, d'avis clients...
Ces données peuvent se trouver dans des tableurs Excel, des bases de données, des logiciels de comptabilité, de relation client (CRM), des sites internet... Il peut également s'agir de contenus multimedia : image, vidéo, audio.
On peut ainsi mettre au point des dispositifs pour numériser des éléments physiques : les convertir ou les représenter en fichiers informatiques.
Tant qu'on ne les a pas travaillées, cela ne reste que des données. L'enjeu consiste donc à les faire parler pour les transformer en information, ou en matière première destinée à alimenter des systèmes qui produiront de la valeur en optimisant l'atteinte d'objectifs : gain de temps, profit, bien-être...
L'objectif ici est d'identifier en quoi la data peut améliorer votre activité.
Une première étape consiste à recenser les données dont vous disposez et à déterminer la valeur que leur exploitation peut générer : les informations qu'elles peuvent offrir, les questions auxquelles elles peuvent permettre de répondre, les gains de temps que peut présenter l'automatisation de leur traitement.
En complément, il est aussi intéressant d'identifier les données qui vous manquent pour répondre à vos enjeux, et qu'il faut envisager d'obtenir ou de créer.
data quality - dataprep /data preparation - data wrangling - data cleansing
Souvent les données ne sont pas exploitables telles quelles et nécessitent des traitements pour être utilisées.
Les travaux de qualité de la donnée informent sur les données manquantes, invalides, les doublons. Des données de mauvaise qualité peuvent être coûteuses, particulièrement quand il s'agit de données de contact utilisées dans des communications : adresses postales, emails, numéros de téléphone. Des actions de nettoyage s'imposent alors : corrections, dédoublonnage, standardisation...
Il est fréquent que des données concernant un même sujet existent à plusieurs endroits : dans des bases de données, des fichiers Excel. Il est intéressant d'agréger, réconcilier, connecter, fusionner ces données éparses pour obtenir une vision complète du sujet en question.
De la même manière, il peut être intéressant d'enrichir ces données avec des données supplémentaires : données de géolocalisation qui permettent des représentations plus visuelles, création d'indicateurs spécifiques basés sur les données existantes qui offrent des visions plus synthétiques.
data analysis - data mining - BI /business intelligence - dataviz /data visualization - dashboard
Il s'agit ici de faire parler les données, et surtout de les rendre lisibles par ceux qu'elles concernent.
L'analyse de données permet de répondre aux questions que l'on se pose, de factualiser des intuitions, d'identifier des corrélations entre des mesures ou des événements, de trouver des explications à des phénomènes. Cela permet de prendre des décisions en connaissance de cause, de prioriser ses actions en fonction de critères factuels.
La visualisation des données à l'aide de graphiques est souvent cruciale pour une compréhension facile et rapide de grandes quantités de données complexes. La réalisation de tableaux de bords aide grandement pour le suivi simple et régulier d'une activité.
IA - data science - AI /artificial intelligence - machine learning - deep learning - neural networks - CV /computer vision - NLP /natural language processing - OR /operations research - OCR /optical character recognition
Au delà d'analyses et de représentations qui permettent d'extraire de l'information, les données peuvent également être utilisées pour des opérations visant à automatiser des tâches ou résoudre des problématiques.
Ainsi peut-on créer des modèles prédictifs, qui utilisent des données passées pour donner des pronostics lorsqu'on leur présente de nouvelles données. Par exemple, c'est ce type de modèle qui est utilisé par les messageries électroniques pour catégoriser les emails en spam ou non-spam.
L'utilisation d'algorithmes spécifiques peuvent également apporter des solutions qui répondent à des enjeux d'optimisation.
Le travail sur les données peut présenter des bénéfices pour tous les types d'activités. En particulier, l'existence de tableaux de bord qui permettent de suivre à tout moment les indicateurs significatifs de son activité est un minimum pour quiconque souhaite être en maîtrise de sa performance.
De la même manière, tout le monde a intérêt à s'appuyer sur ses données pour prendre ses décisions, notamment déterminer ses priorités en termes d'actions ou d'investissements, que ce soit en besoins de formation des employés de help desks, en répartition de budgets publicitaires...
Pour les activités d'ordre commercial / marketing / communication les données peuvent être utilisées pour connaître ses clients, leur localisation, leurs habitudes d'achat, les produits qu'ils achètent fréquemment ensemble, les circonstances et les actions qui déclenchent leurs achats... pour personnaliser la relation client et leur communiquer la bonne offre au bon moment.
Dans les activités de production, des bénéfices sont à trouver dans la prédictions des pannes qui permet d'anticiper les opérations de maintenance, ainsi que dans l'amélioration de la qualité en identifiant au plus tôt les défauts.
Des solutions d'optimisation présenteront un intérêt aux personnes en charge de la réalisation de plannings, que ce soit des responsables d'équipes, des organisateurs d'événements... Il est aussi possible d'optimiser l'ordre des visites de tournées ou encore la répartition d'objets dans un espace, qui seront utiles entre autres aux transporteurs et responsables logistiques.