3 SQL (Vues, intégrité et droits) - Complex systems and AI

Contenus

Exercices Corrigés en SQL - Intégrité, vues et confidentialité

SQL sur l’intégrité, les vues et la confidentialité, chaque exercice corrigés explore un de ces concepts.

Enoncé

L’exemple utilisé est celui d’une base de données « bibliothèque » gérant des lecteurs, des livres identifiés par un numéro et appartenant à une certaine catégorie d’ouvrages (roman policier, roman d’aventures, etc.) et les prêts des livres.

LIVRE(Cote,Titre,Auteur,Catégorie)

LECTEUR(Numéro,Nom,Adresse,Consommation)

PRET(Cote,NumLecteur,DateEmprunt,DateRetour,DateRelance)

Exercice 1

Définir en SQL2 les contraintes d’intégrité suivantes :

La consommation d’un lecteur est Forte, Moyenne ou Faible (contrainte de domaine)
Tout prêt doit être fait à un lecteur existant dans la base, concernant un livre existant (contrainte référentielle)
Chaque auteur ne peut être classé que dans une seule catégorie (dép. fonctionnelle : auteur à catégorie).

Solution

ALTER TABLE Lecteur ADD (CONSTRAINT domaine_conso CHECK (Consommation IN (‘Forte’, ‘Moyenne’, ‘Faible’)));
ALTER TABLE Emprunt ADD (CONSTRAINT fk_lecteur FOREYGN KEY NumLecteur REFERENCES Lecteur); ALTER TABLE Emprunt ADD (CONSTRAINT fk_livre FOREYGN KEY Cote REFERENCES Livre);
ALTER TABLE Livre ADD (CONSTRAINT auteur_catégorie CHECK (NOT EXISTS (SELECT Auteur FROM Livre GROUP BY Auteur HAVING COUNT(Catégorie) > 1)));

Exercice 2

Question 1: Définition d’une vue

Donnez les commandes SQL permettant de créer les vues suivantes :

a) les romans policiers, vue définie par le schéma suivant :

POLICIER(Cote, Titre, Auteur)

b) les lecteurs de romans policiers, vue définie par le schéma suivant :

LECTEUR-DE-POLICIER(Numéro,Nom,Adresse,Cote,DateEmprunt,DateRetour)

c) les lecteurs non autorisés à emprunter des livres dans le cas où ils ont oublié de rendre certains de leurs emprunts précédents :

LECTEUR-INTERDIT(Numéro,Nom)

d) une relation STATS-DE-SPRETS décrivant pour chaque lecteur le nombre de ses emprunts depuis la date d.

Question 2 Utilisation d’une vue.

Un utilisateur ayant le droit d’interroger à partir des vues POLICIER et LECTEUR-DE-POLICIER précédentes pose les questions suivantes :

a) lister le nom des lecteurs qui ont emprunté des romans policiers à la date d,

b) donner le nom des lecteurs ayant emprunté plus de trois romans policiers de Simenon le même jour.

Exprimez ces questions en SQL sur les vues précédentes. Exprimez également ces questions sur les relations de base LECTEUR, LIVRE et PRET.

Question 3: Traitement d’une question portant sur une vue

Les vues définissent des relations virtuelles dont le contenu n’est jamais effectivement calculé. Lors de la création d’une vue, seule la définition de la vue est stockée dans une relation de la métabase. Quand un utilisateur pose une question sur une vue, le SGBD transforme celle-ci en une question portant sur les relations correspondantes de la base.

Cette transformation est faite soit directement sur la formulation en LMD de la requête [Stonebraker75], soit en modifiant l’arbre syntaxique algébrique de la question [Astrahan76]. Dans les deux cas, la transformation consiste à faire un ET entre la question de l’utilisateur et les questions de définition des vues.

Décrivez l’algorithme général permettant de transformer une question posée sur des vues en une question exprimée sur la base par modification de l’arbre syntaxique de la question. Montrer son fonctionnement sur la question 2.b.

Question 4: Mise à jour à travers une vue.

Les mises à jour à travers les vues posent différents problèmes suivant la définition de la vue: valeurs indéfinies (par exemple insertion d’un nouveau tuple dans LECTEUR-INTERDIT), incohérences potentielles (par exemple insertion ou suppression d’un tuple de LECTEUR-DE-POLICIER), non-définition de la mise à jour (par exemple suppression d’un tuple dans STATS-DES-PRETS du lecteur n° 1347).

A quel type de définition de vue correspond chacun de ces problèmes ? A quelle condition une mise à jour sur une vue peut-elle être répercutée sur la base sans ambiguïté?

Question 5: Vues concrètes ou clichés

Certains SGBD proposent, outre le mécanisme des vues, la notion de cliché ou vue concrète [Adiba 80] ou vue matérialisée. Par opposition à une vue, le contenu d’une vue matérialisée est calculé à sa définition et stocké dans la base de données. Une vue matérialisée reflète l’état de la base à l’instant t où elle a été calculée.

On appelle plus particulièrement cliché une vue concrète qui est recalculée périodiquement par le système. Les mises à jour dans la base de données doivent être reflétées dans le cliché lors de son rafraîchissement. Comment peut-on éviter de recalculer systématiquement tout le cliché à chaque rafraîchissement?

Solution

a) Définition de la vue POLICIER

create view POLICIER

as select Cote, Titre, Auteur

from LIVRE

where Catégorie = « roman policier »;

Cette vue est un exemple d’une définition de schéma externe où le sous-ensemble de la base de données est défini comme un sous-ensemble au niveau des occurrences.

b) Définition de la vue LECTEUR-DE-POLICIER

create view LECTEUR-DE-POLICIER

as select Numéro, Nom, Adresse, Cote, DateEmprunt, DateRetour

from LIVRE L, LECTEUR E, PRET P

where L.Cote = P.Cote and E.Numéro = P.NumLecteur and L.Catégorie = « roman policier »;

Cette définition de vue est un exemple de restructuration de l’information. L’utilisateur ne voit dans la vue qu’une seule relation alors qu’en réalité la base est composée de trois relations. Cette possibilité permet de simplifier le travail des utilisateurs en leur présentant les informations sous le format qui leur convient le mieux, en leur évitant par exemple la formulation de jointures lors d’interrogations de la vue.

c) Définition de la vue LECTEUR-INTERDIT

create view LECTEUR-INTERDIT(Numéro,Nom)

as select Numéro, Nom

from LECTEUR E, PRET P

where E.Numéro = P.NumLecteur

and (DateEmprunt + 15) < DateSystème

and DateRetour is NULL;

On suppose que le système permet d’obtenir la date du jour en utilisant le mot-clé « date-système ». La définition de la vue est dynamique, en ce sens que son contenu varie tous les jours automatiquement en fonction de la date. Cette définition de vue permet également de changer les noms des attributs pour s’adapter aux habitudes des utilisateurs.

d) Définition de la vue STATS-DES-PRETS

create view STATS-DES-PRETS(NumLecteur,NombrePrêts,Nom)

as select Numéro, count(*)

from LECTEUR E, PRET P

where E.Numéro = P.Numlecteur

and DateEmprunt > « d »

group by NumLecteur;

L’attribut NombrePrêts est une information déduite dans la mesure où elle n’est pas stockée en tant que telle dans la base de données, mais calculée à partir des informations stockées.

Question 2 : Utilisation d’une vue

a) La question utilisateur est

select distinct Nom

from LECTEUR-DE-POLICIER

where DateEmprunt = « d »;

La même question posée sur les relations de la base serait:

select Nom

from LIVRE L, LECTEUR E, PRET P

where L.Cote = P.Cote

and E.Numéro=P.Numlecteur

and L.Catégorie = « roman policier »

and DateEmprunt = « d »;

Cette question est beaucoup plus complexe à formuler car elle comporte deux jointures, alors que la question sur la vue est très simple puisqu’elle ne comporte qu’une restriction. C’est l’un des avantages des vues : simplifier le travail des utilisateurs.

b) La question de l’utilisateur exprimée en SQL est la suivante:

select distinct Nom

from LECTEUR-DE-POLICIER E, POLICIER P

where E.Cote = P.Cote and Auteur = « SIMENON »

group by NumLecteur, DateEmprunt

having count (Numlivre)>3;

La question telle qu’elle aurait dû être posée sur la base de données est la suivante:

select distinct Nom

from LECTEUR E, LIVRE L, PRET P

where P.Cote=L.Cote and Auteur= »Simenon »

and L.Catégorie= »roman policier »

and P.NumLecteur=E.Numéro

group by NumLecteur, DateEmprunt

having count (Numlivre) > 3;

Question 3: Traitement d’une question portant sur une vue

L’algorithme de transformation d’une question posée sur une ou plusieurs vues consiste à « additionner » la question utilisateur et les questions définissant chacune des vues. Le traitement est itératif car une vue peut être construite sur d’autres vues.

Tant que la question comporte l’utilisation de vues

rechercher dans la métabase les arbres de définition des vues
construire l’arbre syntaxique de la question posée
changer les noms des attributs de la vue dans les noms d’attributs correspondants s’il y a re-nomination des attributs dans la vue
transformer les arbres en un seul en faisant coïncider le résultat d’une vue avec le nom de la vue dans la question
simplifier éventuellement l’arbre en éliminant les opérations redondantes

ftq

Passer l’arbre transformé de la question à l’optimiseur de question

Application de l’algorithme sur l’exemple :

1) L’arbre de la question est le suivant :

sql vues

2) Les arbres des deux vues sont les suivants :

sql vues

3) Ajout des arbres en faisant coïncider le résultat d’une vue et le nom de la vue :

sql vues

4) Dans la définition des vues il n’y a pas de renomination des attributs.

5) Simplification de l’arbre.

On utilise deux fois la relation LIVRE pour une jointure sur n°livre. Il y a également deux restrictions identiques avec le critère <catégorie = « roman policier »>. On ne garde qu’une fois chacune de ces opérations.

sql vues

Question 4: Mise à jour à travers une vue

La mise à jour à travers les vues est interdite dans le cas général car elle pose différents problèmes :

(1) Attributs non définis dans la vue: toute insertion d’un tuple dans la vue entraîne l’insertion d’un tuple dans la base ayant une valeur indéterminée pour les attributs non visibles dans la vue. Par exemple l’insertion d’un nouveau tuple dans la vue LECTEUR-INTERDIT implique l’insertion d’un tuple LECTEUR dont l’adresse est inconnue. Toute vue incluant dans sa définition une projection entraîne ce type de problème.

(2) Risques d’incohérence quand une relation d’une vue est obtenue par jointure de plusieurs relations réelles. Par exemple, l’insertion d’un tuple dans LECTEUR-DE-POLICIER signifie-t-elle l’ajout d’un prêt pour un lecteur existant, ou l’insertion d’un prêt et d’un nouveau lecteur, ou encore l’insertion d’un prêt, d’un livre et d’un lecteur ?

L’ambiguïté est la même pour les suppressions de tuples. La répercussion d’une mise à jour dépend de la sémantique de la vue et de l’application. Elle ne peut pas être automatique. Il faudrait décrire pour chaque vue la sémantique des opérations de mises à jour.

(3) Perte de signification de la mise à jour: la suppression, par exemple, du tuple (1347, 45) de la vue STATS-DES-PRETS, ne peut pas être répercutée au niveau des relations de la base. Cette perte de signification est caractéristique des vues construites en utilisant des agrégats et/ou des fonctions de calcul somme ou moyenne.

En général les SGBD interdisent les mises à jour à travers les vues. Certains les autorisent dans le cas où la sémantique des mises à jour peut être définie sans ambiguïté. C’est le cas si la définition de la vue n’utilise que l’opérateur de restriction d’une relation (ni jointure, ni projection, ni agrégat, ni fonction de calcul).

Dans ce cas un tuple de la vue correspond à un seul tuple de la base. On peut autoriser également l’opérateur de projection si le SGBD gère les valeurs indéterminées.

Question 5: Vues concrètes ou clichés

Le temps de calcul et de stockage d’un cliché peut être important si le sous-ensemble de la base de données correspondant est volumineux. Pour réduire ce temps d’exécution, qui pour un cliché est répétitif, le système peut utiliser un mécanisme de mise à jour différentiel. Seuls les tuples insérés, supprimés ou modifiés dans la base depuis le dernier calcul sont à leur tour insérés, supprimés ou modifiés dans le cliché.

Il est nécessaire que le SGBD garde les tuples insérés ou supprimés des relations de la base dans une relation spéciale. Les suppressions de tuples posent un problème particulier dans le cas général : un tuple du cliché peut provenir de plusieurs tuples de la base et la suppression d’un seul de ces tuples ne doit pas entraîner la suppression du tuple du cliché.

Ce problème est étudié dans [Kerhervé 86]. L’idée est d’associer à chaque tuple de la vue un compteur indiquant le nombre de raisons pour sa présence. Lors d’une suppression d’un tuple de la base le compteur correspondant est décrémenté. Quand le compteur devient nul, le tuple du cliché est supprimé.

Exercice 3

Question 1: Exemple d’utilisation

Ecrire la commande permettant de transmettre les droits de lecture et insertion sur la relation LIVRE à l’usager Dupont, en lui garantissant le droit de transmettre ses droits.

Question 2: Vérification de l’attribution des droits

Décrivez les principes de l’algorithme d’octroi de droit (GRANT). Les renseignements concernant la gestion des autorisations sont mémorisés dans une relation système de la métabase appelée DROIT. Spécifier le schéma de cette relation en fonction de l’algorithme de GRANT.

Question 3: Vérification du retrait d’un droit

Dans un système décentralisé, la procédure de retrait des droits est délicate. Il faut en effet retirer le droit à l’usager indiqué, mais aussi le retirer récursivement à tous les usagers auxquels celui-ci l’avait transmis. D’autre part, un usager peut recevoir un même droit de plusieurs donateurs différents. Quand l’un d’entre eux le lui retire, il conserve celui provenant de sources différentes. Spécifier les principes de l’algorithme de REVOKE. Indiquer les modifications éventuelles du schéma de la relation DROIT.

Question 4: Vérification des droits d’accès lors des manipulations

La vérification qu’un usager a le droit de réaliser une certaine opération sur une relation doit être exécutée rapidement. Comment le système peut-il répondre à cette contrainte?

Question 5: Droits sur une vue

Quand un utilisateur crée une vue, quels sont les droits qui lui sont automatiquement attribués sur la relation virtuelle ?

Solution

Question 1: Exemple d’utilisation

grant select insert on LIVRE

to dupont

with grant option

Question 2: Vérification de l’attribution des droits.

Une requête GRANT a les paramètres suivants:

l’usager ayant émis le GRANT, appelé donateur;
l’usager à qui les droits sont accordés, appelé bénéficiaire;
la liste des droits accordés (un droit étant accordé avec ou sans droit de transmission), chacune des deux possibilités est identifiée comme un droit différent;
la relation sur laquelle les droits sont accordés appelée objet.

La relation DROIT permet de mémoriser ces informations. Son schéma peut être le suivant :

DROIT(relation-objet,nom-bénéficiaire,nom-donateur,

droits-non-transmissibles,droits-transmissibles)

Ce schéma n’est pas en première forme normale car les attributs droits-transmissibles et droits-non-transmissibles contiennent plusieurs valeurs, mais il permet un stockage plus compact. Il nécessite inversement un traitement pour analyser les droits présents.

L’algorithme de GRANT comprend les étapes suivantes :

1) vérifier que le donateur possède les droits qu’il veut accorder avec le droit de transmission.

Il faut pour cela extraire de la relation DROIT les droits que l’auteur du GRANT possède sur la relation ‘objet’.

select droits-transmissibles

from droit

where nom-bénéficiaire = « donateur »

and relation-objet = « objet »;

2) si le donateur possède effectivement le droit de transmettre ‘liste-droits’, ces derniers doivent être mémorisés dans la relation DROIT par une requête INSERT, soit comme droits transmissibles soit comme droits non transmissibles suivant la présence ou non de la clause with grant option.

L’algorithme de grant générera la requête suivante:

insert into DROIT

values(« objet », »bénéficiaire », »donateur »,nil, »liste-droits »)

insert into DROIT

values(« objet », »bénéficiaire », »donateur », »liste-droits »,nil)

Question 3: Vérification du retrait d’un droit

Dans un système à gestion des droits décentralisée où les droits sont accordés, vérifiés et retirés dynamiquement, le contrôle du retrait des droits n’est pas trivial. La vérification de la provenance des droits d’un usager nécessite en principe de tracer le graphe de transmission des autorisations pour vérifier la provenance de chaque droit et s’assurer qu’un usager ne s’est pas retransmis un droit à lui-même par une voie détournée.

Une solution plus simple que la construction du graphe a été développée dans [ Lindsay79]. On associe à chaque droit une estampille indiquant la date à laquelle le droit a été accordé. L’estampille permet de reconnaître les droits qui restent à un usager X, quand un droit qui lui avait été accordé à une date t disparaît. Tous les droits issus récursivement de X et postérieurs à t doivent également disparaître. Le format de la relation DROIT devient le suivant:

DROIT ( relation-objet,

nom-bénéficiaire,

nom-donateur,

droits-non-transmissibles,

estampilles-droits-transmissibles )

Chaque droit transmissible est représenté, non plus par un bit mais par l’heure à laquelle il a été accordé. Un droit non accordé a une estampille 0. Un exemple du contenu de la relation (en ne considérant que les droits transmissibles) est le suivant :

relation objet	nom bénéficiaire	nom donateur	select	insert	delete	update
LIVRE	X	A	15	15	0	0
LIVRE	X	B	20	0	20	0
LIVRE	Y	X	25	25	25	0
LIVRE	X	C	30	0	30	0

Supposons qu’à l’instant t = 35, B retire tous les droits qu’il avait accordés à X au temps t = 20. Le tuple (LIVRE, X, B, 20, 0, 20, 0) doit disparaître. Les droits qui restent à X sont alors (LIVRE, X, (A,C), (15, 30), 15, 30, 0). Les droits que X a transmis sont (LIVRE, Y, X, 25, 25, 25, 0).

Le droit DELETE donné par X au temps t = 25 doit disparaître puisque l’on considère à présent que X a reçu ce droit au temps t = 30. En revanche les droits SELECT et INSERT accordés à Y au temps 25 sont conservés car ils proviennent de droits reçus par X avant le temps 20. L’algorithme est le suivant :

proc REVOKE (b: nom-bénéficiaire, da: droit-accès, r: relation-objet, d: nom-donateur)

/* retirer le privilège ‘da’ accordé par ‘d’ à ‘b’ sur ‘r’ */

update DROIT

set da = 0

where nom-bénéficiare = b

and nom-donateur = d

and relation-objet = r;

/* définir l’estampille minimum qui reste à ‘b’ pour le droit ‘da’ sur la relation ‘r’ */

select MIN(da) into min

from DROIT

where nom-bénéficiare = b

and relation-objet = r;

/* retirer tous les droits ‘da’ accordés par ‘b’ sur ‘r’ avant ‘min’ */

select nom-bénéficiaire into liste-retrait

from DROIT

where nom-donateur=’b’

and relation-objet=’r’

and da<‘min’;

Si liste-retrait ¬ vide

alors pour chaque élément ‘l’ de liste-retrait

faire

REVOKE (l, da, r, b)

fpour

fsi

fin proc

L’algorithme est récursif et retire de proche en proche les droits à tous ceux auxquels il ne peut plus avoir été accordé.

Exemple :

sql droits

Si A retire son droit à X, il faut récursivement l’enlever à tous les autres. L’algorithme se déroule ainsi:

1èrepasse : REVOKE (X, da, r, A)

retire à X le droit ‘da’ qui lui vient de A

minimum des estampilles qui restent à X: 15

==> retirer le droit à Y donné en t = 10 (donc avant 15) : REVOKE (Y, da, r, Y)

2èmepasse : REVOKE (Y, da, r, X)

Y n’ a plus le droit ‘da’, donc il faut retirer ce droit à ceux auxquels il l’a transmis :

REVOKE (X, da, r, Y)

3èmepasse : REVOKE (X, da, r, Y)

X n’a plus le droit ‘da’, il faut donc le retirer à ceux auxquels il l’a transmis:

REVOKE (Z, da, r, X)

Question 4: Vérification des droits d’accès lors des manipulations

Lors de chaque requête d’un utilisateur le système vérifie que cet usager a effectivement le droit d’exécuter ce type de requête sur les relations citées. Cette vérification pourrait se faire par un accès à la relation DROIT, mais cet accès génère alors une entrée-sortie par requête ce qui est lourd.

Une meilleure solution consiste à n’accéder à la relation DROIT qu’une fois en début de session pour chaque utilisateur. Quand un utilisateur se connecte au SGBD, après son authentification (vérification qu’il a bien le droit d’utiliser le SGBD), le système lit en mémoire centrale la partie de la relation DROIT qui le concerne. Cet extrait de la relation DROIT pour un usager ‘U’ est défini par:

select * into DROITS-MC

from DROIT

where nom-bénéficiaire = ‘U’;

La relation DROITS-MC doit être stockée en mémoire centrale dans un emplacement réservé au système auquel un utilisateur ne peut jamais avoir accès pour éviter toute modification frauduleuse ou accidentelle de cette relation.

Question 5: Droits d’accès sur une vue

Quand un utilisateur crée une vue, il ne peut obtenir sur celle-ci des droits supérieurs à ceux qu’il a sur les relations de la base servant à construire la vue. Les droits qui sont accordés automatiquement au créateur d’une vue sont égaux à l’ensemble des droits que l’usager possède sur chacune des relations composant la vue.

Les droits acquis sur la vue ne sont transmissibles que s’ils l’étaient pour les relations de la base. Pour créer la vue, l’utilisateur doit avoir le droit de lecture (select) sur les relations servant à composer la vue. Il aura donc au minimum un droit de lecture sur la vue créée.