Site des données ouvertes du Ministère de l'Intérieur tunisien

Lexique

API Application Programming Interface. Interface à un ou plusieurs jeux de données permettant à un programme ou une application d’y accéder. Les jeux de données peuvent être rendus accessibles soit par téléchargement (pour les jeux de données raisonnablement stables dans le temps) soit par API (pour les jeux de données très volumineux ou très volatiles).
CKAN Comprehensive Knowledge Archive Network. Logiciel open source pour portail Open Data permettant de publier, de partager et de trouver des données. Il inclut une base de données pour cataloguer et stocker des jeux de données.
CROWDSOURCING Externalisation de masse : recueil de données par une communauté de volontaires (eg Open Street Map).
CSV le Comma-separated values est un format informatique ouvert représentant des données tabulaires sous forme de valeurs séparées par des virgules. Un fichier CSV est un fichier texte, par opposition aux formats dits « binaires ». Chaque ligne du texte correspond à une ligne du tableau et les virgules correspondent aux séparations entre les colonnes. Les portions de texte séparées par une virgule correspondent ainsi aux contenus des cellules du tableau.
DATA La Data constitue le cœur de tous nos systèmes d'information et jouent donc un rôle essentiel dans la prise de décisions économiques, stratégiques ou politiques. Stockées de manière numérique, les données sont le plus souvent structurées et peuvent ainsi être traitées efficacement grâce à la puissance des outils informatiques.
DATAJOURNALISME (ou Journalisme de données) Nouveau type de journalisme basé essentiellement sur l’utilisation des données, consistant à identifier des données intéressantes, en faire l’analyse, en extraire des informations nouvelles et en présenter éventuellement les résultats sous la forme d’une visualisation interactive. Le journalisme de données se nourrit notamment des données publiques.
DATAVIZ (ou Data Visualisations) Technologies, méthodes et outils de visualisation des données. Ce ne sont pas des données mais des graphiques permettant de les interpréter. Elles sont souvent conçues à partir de données libérées soumises à une licence d’utilisation.
DCAT (Data Catalog Vocabulary) Le schéma de données DCAT est une proposition de standard pour l’interopérabilité des catalogues de données. Il est basé sur le schéma de données RDF. Ce format a été élaboré à l’université DERI de Galway et est aujourd’hui maintenu par le W3C.
DIX PRINCIPES Énoncés par la Sunlight Foundation, ils donnent les critères auxquels les données ouvertes doivent satisfaire. Pour obéir à ces critères, les données doivent être complètes, primaires, fraîches, accessibles électroniquement, lisibles par une machine, accessibles sans discrimination, respectant les standards ouverts, disponibles sous une licence claire, accessibles de façon pérenne et gratuite.
DONNÉES BRUTES Les données brutes est un terme pour les données recueillies auprès d'une source. Les données brutes n'ayant pas subi de traitement ou de toute autre manipulation sont également appelées données primaires.
DONNEES PUBLIQUES Données collectées, maintenues et utilisées par les organismes publics pour accomplir leur mission.
DKAN c'est une version "clonée" du projet CKAN.
DSPL DataSet Publishing Language, langage de description de jeux de données, défini par Google, structurant un jeu de données en des données CSV et un descripteur XML et permettant de visualiser les données grâce à Google Public Data Explorer (http://www.google.com/publicdata/home).
GEODATA Sans qu'il soit évident de le démontrer, il est communément admis que 80% de nos bases de données ont une composante géographique, on parlera donc parfois de GeoData. Que ces données soit directement géographiques (imagerie satellitaire, relevés topographiques, coordonnées GPS, …) ou indirectement (adresse postal, adresse IP, cellule radio d'un téléphone portable, …) cela veut dire que la grande majorité des informations issues de nos bases de données peut s'analyser sous un angle spatial et se représenter sous la forme de cartes.
GIS voir SIG.
INTEROPÉRABILITÉ L'interopérabilité est la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d'autres produits ou systèmes existants ou futurs et ce sans restriction d'accès ou de mise en œuvre. Il convient de distinguer « interopérabilité » et « compatibilité ». Pour être simple, on peut dire que la compatibilité est une notion verticale qui fait qu'un outil peut fonctionner dans un environnement donné en respectant toutes les caractéristiques et l'interopérabilité est une notion transversale qui permet à divers outils de pouvoir communiquer - quand on sait pourquoi, et comment, ils peuvent fonctionner ensemble.
JEU DE DONNEES Unité de publication, peut être un fichier ou un ensemble de fichiers se rapportant au même sujet.
JSON (JavaScript Object Notation) est un format de données textuelles, générique, dérivé de la notation des objets du langage ECMAScript. Il permet de représenter de l’information structurée.
LICENCES L'ouverture des données impose d'apposer une licence fixant les conditions dans lesquelles ces données pourront être copiées, diffusées, réutilisées librement. Les contextes juridiques variant d'un pays à un autre, diverses licences sont aujourd'hui utilisées à travers le monde.
LINKED DATA voir Web de données.
LINKED OPEN DATA (ou LOD) En français web des données: publication de données structurées sur le web, reliant les silos de données entre eux permettant ainsi de constituer un réseau global d’informations. Cela permet aussi d’interroger automatiquement les données où qu’elles soient stockées.
MÉTADONNÉES Une métadonnée est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique). Un exemple type est d'associer à toute donnée, la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées GPS du lieu où elle a été prise. Les métadonnées sont à la base des techniques du Web sémantique. Elles sont définies dans le cadre du modèle Resource Description Framework (RDF).
MICROFORMAT (parfois abrégé sous μF ou uF) C'est une approche de formatage de données basé sur le web qui cherche à réutiliser le contenu existant comme les métadonnées, en n'utilisant que des classes et attributs XHTML et HTML. Cette approche est conçue pour permettre à l'information destinée aux utilisateurs finaux (comme le carnet d'adresses, les coordonnées géographiques, les événements et autres données en rapport) d'être traitée automatiquement par le logiciel. Contrairement au contenu des pages web qui utilisent des balises traditionnelles permettant d'afficher l'information, les microformats sont plutôt orientés description de l'information.
NOSQL Base de Données n’obéissant pas au modèle relationnel, à fonctionnalités réduites, se prêtant bien au traitement massivement parallèle des données. De nombreux catalogues de données sont construits sur une base de données NoSQL.
NOTATION CINQ ETOILES Notation proposée par Tim Berners Lee pour mesurer le degré qualitatif des données ouvertes.
★ Vos données (non filtrées c'est-à-dire dégradées) sont en ligne quel que soit leur format (n'importe quel format)
★ ★ Vos données sont disponibles sous forme de données structurées (par exemple données tabulaires en CSV, XML, Excel, RDF)
★ ★ ★ Vos données sont libres d'être exploitées juridiquement (voir la partie sur les licences) et techniquement dans des formats non-propriétaires (notamment pas Excel)
★ ★ ★ ★ utiliser des URL pour identifier vos données, de sorte que l'on puisse pointer dessus
★ ★ ★ ★ ★ lier vos données à d'autres personnes pour fournir un contexte à ces données
ODAO (ou Open Data App Framework) Le Cadre d’Application Open Data permet de créer des repères sur des cartes interactives grâce à la publication de jeux de données mis sous forme de data visualisations. Elle permet aussi à n’importe quel utilisateur de créer de nouveaux repères, de les noter et les commenter.
ODATA (ou Open Data Protocol) c’est un protocole qui facilite la mise à disposition, le partage, la création et la consommation des données par le biais des réseaux d’entreprises et du web.Ses spécificités sont publiées sous licence OSP (Mirosoft Open Specification Promise) qui permet à de tierces parties (dont des projets Open Source) la possibilité de développer des services pour n’importe quelle plateforme.
OPEN DATA SETS Terme anglais faisant référence aux jeux de données rendus publiques par les administrations ou entreprises.
OPEN STREET MAP C'est un projet qui a pour but de constituer une base de données cartographiques libre du monde (permettant par exemple de créer des cartes sous licence libre).
OGDI Open Government Data Initiative. Logiciel open source développé et distribué par Microsoft, fonctionnant sur la plateforme Azure et permettant à un organisme public de mettre en place un portail de mise à disposition de données ouvertes.
OKFN Open Knowledge Foundation Network, association à but non lucratif britannique oeuvrant pour l’ouverture des données, elle a notamment développé CKan.
OPEN DATA Voir “ouverture des données”.
OUVERTURE DES DONNEES Principe selon lequel les données publiques (celles recueillies, maintenues et utilisées par les organismes publics) doivent être disponibles pour accès et réutilisation par les citoyens et les entreprises.
PRODUCTEUR DE DONNÉES Un producteur de données est une personne morale de droit public qui met à disposition des informations et des données soumises à une licence et qui peuvent être utilisées par toute personne qui le souhaite.
PSI Public Sector Information, voir données publiques.
PUBLIC DATA EXPLORER Outil de stockage et de visualisation de données au format DSPL, développé et opéré par Google. Pour visualiser ses données, il faut d’abord les stocker chez Google.
RAW DATA voir données brutes.
RDF (ou Resource Description Framework) est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. RDF est le langage de base du Web sémantique. L'une des syntaxes (ou sérialisations) de ce langage est RDF/XML.
REUTILISATEUR DE DONNÉES Le « réutilisateur » est la personne physique ou morale qui utilise les données ou informations mises à disposition par le « producteur » conformément à la licence à laquelle lesdites données (ou informations) sont soumises.
REUTILISATION Fait de prendre un jeu de données pour le visualiser, le fusionner avec d’autres jeux, l’utiliser dans une application, le modifier, le corriger, le commenter, etc.
SDMX Statistical Data and Metadata eXchange, langage de description de jeux de données statistiques conçu par un groupe d’utilisateurs incluant l’OCDE, l’ONU, la Banque Mondiale et Eurostat.
SIG Un système d'information géographique (SIG) est un système d'information permettant de créer, d'organiser et de présenter des données alphanumériques spatialement référencées, autrement dit géoréférencées, ainsi que de produire des plans et des cartes. Ses usages couvrent les activités géomatiques de traitement, de partage et de diffusion de l'information géographique. La représentation est généralement en deux dimensions, mais un rendu 3D ou une animation présentant des variations temporelles sur un territoire sont possibles. (Une liste de logiciels libres se trouve dans la boîte à outils sous le menu "Open Data".
SPARQL est un langage de requête et un protocole qui permet de rechercher, d'ajouter, de modifier ou de supprimer des données RDF disponibles à travers Internet. Son nom est un acronyme qui signifie SPARQL Protocol and RDF Query Language. Alors qu'avec SQL, on accède aux données d'une base de données, on accède avec SPARQL, aux données du Web des données. Cela signifie qu'en théorie, on pourrait accéder à toutes les données du Web avec ce standard.
TIM BERNERS-LEE Co-inventeur du Web, inventeur du Web sémantique, très actif et impliqué dans data.gov.uk, il a notamment défini la notation en cinq étoiles pour mesurer le niveau d’ouverture de Web sémantique d’une mise en ligne de jeu de données.
WEB DE DONNÉES Le Web de données (Linked Data en anglais) combine les technologies du Web sémantique avec les principes fondamentaux du Web (protocole HTTP, identifiants URI), avec pour objectif la construction d'un réseau d'informations structurées, disponibles en ligne et facilement réutilisables dans de nombreux contextes.
XML L'Extensible Markup Language est un langage informatique de balisage générique qui peut être transmis, reçu et traité sur le web de la même manière que l'est HTML aujourd'hui.