Qualité de la donnée

Les données exploitées par l’observatoire proviennent de l’intégralité des attestations générées via le service fourni re-batiment2020.cstb.fr/attestations/).


La méthode de collecte utilisée implique un certain nombre de limites quant à la qualité de la donnée qu’il apparaît nécessaire d’expliciter :
  • Projets non concrétisés
    Les fichiers RSEE étant collectés lors de la production de l’attestation, un certain nombre des données collectées et exposées dans l’observatoire correspond potentiellement à des projets non concrétisés.
    L’identification précise des données correspondant à des projets achevés est un développement futur prévu pour améliorer la qualité de donnée de l’outil.
  • Projets déposés plusieurs fois (doublons)
    Un travail de dédoublonnage est réalisé par le CSTB pour ne conserver que le dernier RSEE produit pour chaque projet dans la base de données de l’observatoire.
    En effet, il est possible de soumettre et générer plusieurs fois une même opération - ou ses variantes - dans l'outil attestations. Un algorithme est mis en place pour supprimer les opérations-doublons supposées dans les analyses statistiques. Cet algorithme, bien que robuste, reste perfectible.
  • Champs mal renseignés ou non renseignés
    L’exploitation de la base de donnée permet d’identifier un certain nombre de champs où les valeurs apparaissent statistiquement incohérentes. Ce phénomène est dû à un renseignement peu rigoureux de certains champs lors de la saisie du projet dans les logiciels de simulation.
    Il s’explique par plusieurs phénomènes : mauvaise compréhension de l’information à saisir, saisie rapide d’un champ identifié comme non essentiel dans le calcul réglementaire.
    A titre d’exemple le champ « nombre d’étage » apparaît très régulièrement rempli à 0. Cette information n’étant pas utilisée dans le calcul, elle ne génère pas d’erreur lors du contrôle des résultats.
    Pour améliorer progressivement la qualité de la donnée, la DGALN engagera au long du développement puis de l’exploitation de l’observatoire des travaux visant à assurer un contrôle plus fin des saisies.
  • Respect des exigences
    Les statistiques sont produites sur la base de l'ensemble des données d'achèvement collectées. Parmi les bâtiments décrits dans ces données, se trouvent des bâtiments qui apparaissent ne pas respecter les exigences de la réglementation. Comme mentionné plus haut, rien n'indique que ces bâtiments ont effectivement été construits.
    Au 01/01/2024, les non conformités représentent 1,4% des bâtiments référencés.