Les partenaires du portail Données Québec travaillent de concert pour diffuser des données de qualité. En plus de respecter les lignes directrices sur la diffusion des données ouvertes, les partenaires établissent des schémas de données qui s’inspirent des meilleures pratiques et des standards internationaux en matière de données ouvertes.
Liste des schémas de données
A
- Adresse ponctuelle
- Avis d’ébulition
B
- Borne incendie
C
- Chantiers – 511
D
- Districts électoraux
E
- Empreinte de la voirie
- Empreinte de bâtiments
- Espace de stationnement
- Espèces exotiques envahissantes
I
- Infrastructure piétonnes
- Inventaire des arbres répertoriés
L
- Lieux publics
M
- Milieux humides
O
- Offre de services récréatifs
P
- Parcs et espaces verts
R
- Rejets des eaux usées
- Requêtes citoyennes 311
S
- Subventions
T
- Transport en commun – GTFS
U
- Unité d’évaluation
W
- Wifi du territoire
Z
- Zonage
- Zones inondables
Qu’est-ce qu’un schéma de données?
Un schéma de données présente les instructions techniques permettant de normaliser un jeu de données, soit :
- le format de fichier à adopter;
- la structure détaillée du fichier;
- la nomenclature des champs à respecter;
- le référentiel des valeurs pour certains champs.
Pourquoi normaliser les données?
L’utilisation de formats ouverts standards et de structures de données communes permet d’assurer la qualité et l’interoperabilité des données, ce qui favoriser leur réutilisation.
Par exemple, la normalisation des données sur la localisation des pistes cyclables permet de facilement rassembler les jeux publiés par différentes villes et MRC et de mettre en valeur ces données sur l’ensemble du territoire, au moyen d’une application citoyenne.
- Interoperabilité : L’utilisation de formats ouverts standards et de structures de données communes permet d’assurer leur compatibilité.
- Comparer : En imposant des unités de mesure et des référentiels communs, les données peuvent être comparées directement, sans les transformer (exemple : valeurs monétaires, noms officiels des municipalités).
- Combiner: L’uniformisation de la structure et de la nomenclature facilite l’agrégation des données qui proviennent de différentes sources ou qui couvrent différents territoires.
- Qualité: Normaliser à la source permet d’éviter des erreurs dans les données (exemple : erreurs de saisi, doublons, incohérences) en limitant les opérations de restructuration et d’uniformisation (nettoyage) manuels des données.
- Fiabilité : Des règles stricts sur le formatage assure la conformité des valeurs de certains champs (exemple, dates au format ISO 8601 : AAAA-MM-JJ).
- Documenter : Le schéma agit à titre de « dictionnaire » des données, ce qui en facilite la compréhension par les utilisateurs.
- Automatiser : Des données propres, standardisé et de qualité, permettent d’automatiser l’utilisation des données (exemple : programmation, accès par API, agrégation de fichiers, visualisation) et sont consommables/exploitables par les outils d’intelligence artificielle.
- Utiliser / valoriser / visualiser : L’écosystème de données normalisée est favorable à la réutilisation et la valorisation des données, particulièrement au développement d’applications (exemple : applications de mobilité, comparateurs de prix, cartes interactives, etc.), notamment dans le cadre de hackathons