Quelle richesse peut m’apporter la maîtrise des données temporelles ?
Devinette : qu’ont en commun Tesla et ses voitures autonomes, les algorithmes de trading des salles de marché, la domotique et les réseaux de transport qui assurent des livraisons de plus en plus rapides ?
D’une part, ils indiquent que notre monde évolue à grande vitesse, grâce à notre capacité à capturer et à analyser de plus en plus de données.
Mais si vous regardez de près, vous remarquerez que chacune de ces applications requiert un type de données particulier :
- Les voitures autonomes collectent en permanence des données sur l’évolution de leur environnement.
- Les algorithmes de trading collectent en permanence des données sur l’évolution des marchés.
- Nos maisons intelligentes surveillent l’état de notre habitat pour réguler la température, identifier les intrus et répondre à nos appels («Alexa, joue de la musique relaxante»).
- Le secteur de la vente surveille l’évolution de ses actifs avec une précision et une efficacité telles que la livraison à moindre coût le jour même est un luxe que beaucoup d’entre nous prenons pour acquis.
Ces applications reposent sur une forme de données qui mesure l’évolution des choses dans le temps. Le temps n’est pas simplement une mesure, mais un axe principal.
Ce sont des données temporelles – ou time series.
Et ce type de donnée joue un rôle de plus en plus important dans notre monde.
L’évolution des technologies de stockage des données temporelles reflète cette tendance. Au cours des 24 derniers mois, les bases de données axées sur des données temporelles (TSDB pour Time Series DataBase) sont devenues la catégorie de bases de données à la croissance la plus rapide:
En tant que spécialiste de l’exploitation des données temporelles, on nous pose souvent des questions sur cette tendance.
Typiquement, nous avons trois questions qui reviennent :
- Que sont les données temporelles ?
- Quelle richesse peut m’apporter la maîtrise des données temporelles ?
- Pourquoi devrais-je utiliser (ou ne pas utiliser) Timelight ?
Il existe de nombreux autres types de données chronologiques.
Pour en nommer quelques-uns: données de surveillance DevOps, flux d’événements d’applications mobiles / Web, données de machines industrielles, mesures scientifiques.
Que sont les données temporelles?
Certains pensent que les «données chronologiques» sont une séquence de points de données, mesurant la même chose dans le temps, stockées dans un ordre chronologique. C’est vrai, mais cela ne fait qu’effleurer la surface.
D’autres peuvent penser à une série de valeurs numériques, chacune associée à un horodatage, défini par un nom et un ensemble de dimensions étiquetées.
C’est peut-être un moyen de modéliser des données chronologiques, mais pas une définition des données elles-mêmes.
Allons un peu plus loin.
Prenons un premier exemple d’un bâtiment connecté, peut être chez vous avec le compteur nouvelle génération Linky : le compteur transmet des données de consommations aux serveurs d’engie et tout propriétaire peut retrouver dans son espace ces données pour suivre sa consommation énergétique.
Les mesures de consommation énergétique sont collectées au fil du temps et restituées par pas de 10 min :
Ces données “brutes” ne sont pas directement exploitables, il faudrait par exemple, calculer les valeurs moyennes par jour, ou sur des tranches spécifiques selon ce que l’on cherche.
Voici un autre exemple, avec de vraies données de la ville de New York, montrant chaque trajet en taxi pour les premières secondes de 2016.
Comme vous pouvez le constater, chaque rangée correspond à un trajet.
Un dernier exemple, imaginez que vous mainteniez une application Web et que vous souhaitez suivre son utilisation. Vous pourriez mettre à jour une donnée caractéristique de la date de dernière connection dans une base de donnée pour cet utilisateur et ainsi ne conserver que la dernière donnée reflétant la connexion.
Mais que se passe-t-il si vous traitez chaque connexion comme un événement séparé et que vous les collectez au fil du temps ? Vous pouvez ensuite : suivre l’activité de connexion historique, voir comment l’utilisation de votre service évolue dans le temps, classer les utilisateurs en fonction de leur fréquence d’accès à l’application, adapter votre architecture informatique pour répondre au mieux au volume des demandes…
Cet exemple illustre un point clé : en préservant la nature chronologique inhérente de nos données, nous sommes en mesure de conserver des informations précieuses sur l’évolution de ces données dans le temps.
Toute donnée peut être vue comme un événement temporel. Nous avons l’habitude de stocker des données qui reflètent l’état actuel d’une organisation métier, et de modifier ces données avec l’évolution du métier. Cette première approche nous prive d’un regard sur leur évolution, et donc sur l’évolution des métiers sous jacents.
Bien sûr, stocker des données à cette résolution pose un problème évident: vous vous retrouvez avec beaucoup de données, plutôt rapidement.
Et le fait d’avoir beaucoup de donnée ne veut pas dire qu’il sera plus facile de les comprendre.
Pourtant, la maîtrise de ces données est porteuse d’une grande richesse.
Quelle richesse peut m’apporter la maîtrise des données temporelles ?
Historiquement, de nombreux métiers ont pour fondement l’exploitation directe des données temporelles :
- Les acteurs de la performance énergétique analysent les consommations énergétiques des bâtiments pour comprendre comment réduire les consommations ou les factures énergétiques associées.
- Les revenue managers qui établissent le prix des billets d’avion ou des chambres d’hôtels exploitent l’évolution des réservations pour décider de leur stratégie de pricing.
- Les acteurs de l’industrie automobile projettent les ventes futures par segment sur leurs marchés pour ajuster leur production longtemps en avance et ainsi minimiser les coûts de stockage des véhicules neufs.
- Les systèmes de monitoring informatique analysent l’utilisation des serveurs et des visites pour déterminer les comportement anormaux et réagir au plus vite en cas d’une cyber attaque.
Tous ces métiers ont la même approche vis à vis de l’exploitation de leurs données temporelles :
- Constituer une base historique de référence pour une problématique ciblée
- Extraire de cette base historique les profils type caractérisant les données (profils de consommation énergétique / courbe de charge pour le revenue management / utilisation standard des ressources serveur)
- Qualifier les profils normaux et anormaux
- Etablir une planification attendue
- Agir si la planification ne correspond pas à la réalité
C’est l’équivalent d’une démarche PDCA (Plan Do Check Act) orientée donnée business, et donc orientée pilotage business.
Pourquoi devrais-je utiliser (ou ne pas utiliser) Timelight ?
Nous l’avons vu sur l’exemple des données de taxi, même si les données temporelles sont stockées dans des SGBD classiques (ou spécialisés), l’exploitation de ces données ne peut suivre les mêmes règles.
Une requête sur une table de données temporelles ne vous donnera ni les profils types, ni les tendances, en somme peu de caractéristiques intelligibles.
Ces systèmes de stockage dédiés aux données temporelles ne garantissent aujourd’hui qu’une exploitation brute de ces données, mais pas une compréhension de leur nature.
Les outils de BI connectés à des bases de données temporelles ne permettent pas non plus de chercher des tendances ou des profils types dans ces données.
Car les données doivent être ingérées et “pensées” au travers d’algorithmes pour révéler leur nature.
Timelight est une plateforme SaaS permettant de maîtriser vos données temporelles et de mettre en place une démarche de pilotage de ces données.
Nous utilisons de puissants algorithmes d’intelligence artificielle pour révéler les caractéristiques des données temporelles afin qu’elles soient facilement compréhensibles via des dashboards et des API pour une exploitation facile dans vos systèmes.
Timelight révèle les caractéristiques inhérente à l’évolution de vos données, et donc à votre business.
Sans Timelight vous pouvez stocker beaucoup de données temporelles mais vous ne pourrez pas les indexer et les traiter facilement – c’est comme si vous disposez de millions de pages et que timelight vous permettait de les organiser dans des livres et des bibliothèques.
Timelight est une solution généraliste utilisée dans plusieurs secteurs d’activité, n’hésitez pas à consulter le site secure-energy.tech pour plus de détail sur un cas d’application aux acteurs de la performance énergétique.