À propos des jointures

S’abonner

Si vous voulez sélectionner plus d’un tableau quand vous vous connectez à une solution de stockage Big Data ou une source de données SGBDR, vous devez joindre les tableaux en utilisant SQL Designer ou SQL personnalisé (consultez Sélection de plusieurs tableaux à partir d’une connexion de base de données ). Dans Query Blender, vous pouvez utiliser les jointures pour importer des données à partir de plusieurs connexions différentes (consultez Création de jointures avec Query Blender ).

Cet article contient les sections suivantes :

Création de conditions de jointure

Après avoir sélectionné vos connexions ou tableaux, vous pouvez commencer à créer vos jointures. La première étape consiste à ajouter une condition de jointure. Votre jointure peut contenir plusieurs conditions, mais il en faut au moins une.

Quand vous créez une nouvelle jointure, vos connexions ou tableaux doivent avoir une clé de jointure . Une clé de jointure se compose d’attributs qui contiennent des valeurs communes aux deux jeux de données. Votre jointure sera basée sur les attributs utilisés dans la clé de jointure. Si la clé de jointure que vous sélectionnez ne contient pas de valeurs communes, BIME rejettera la jointure. Dans la condition de jointure, vous sélectionnez les attributs de clé de jointure dans les listes déroulantes Sélectionnez un champ .

Par exemple, les deux tableaux ci-dessous contiennent un attribut Account ID commun, donc cet attribut est utilisé comme clé de jointure.

Si vous utilisez SQL Designer, vous pouvez modifier l’opérateur utilisé dans la condition de jointure. L’opérateur calcule la relation entre les champs et change la quantité de données importées. Dans Query Blender, vos champs peuvent uniquement être égaux, mais dans SQL Designer, vous avez le choix entre Supérieur à, Inférieur à et Égal à. Vous pouvez changer l’opérateur en cliquant sur l’icône = .

Il est particulièrement utile de pouvoir changer l’opérateur pour les clés de jointure qui utilisent des attributs de date. Si les attributs utilisent différentes plages de dates, vous pouvez changer d’opérateur pour sélectionner les plages de dates à importer.

Par exemple, le tableau des scores de satisfaction du compte (Account satisfaction scores) inclut les années 2010-2014 et le tableau des données de modules supplémentaires (Add-on data) inclut les années 2011-2013. Si vous ne vouliez importer que les données pour les années 2010-2013, vous devriez changer d’opérateur. Dans cet exemple, le champ Account Satisfaction Scores serait inférieur ou égal au champ Add-on Data, pour que seules les dates avant ou pendant 2013 soient importées. Si vous utilisiez ensuite une jointure interne, vous ne récupéreriez que les données des années 2010-2013.

Après avoir fini de sélectionner vos champs et votre opérateur, vous pouvez cliquer sur Ajouter . Après avoir ajouté la condition, vous pouvez choisir votre type de jointure. La section suivante aborde les types de jointure.

Sélection du type de jointure

Quand vous créez une nouvelle jointure, vous disposez de trois options d’importation de vos données. Chacun de ces types de jointure récupère les données différemment. Dans cette section, vous trouverez la définition de chaque type de jointure et des exemples de la façon dont sont importées les données selon le type de jointure.

Voici les types de jointure disponibles :

Jointures gauches et droites

Vous pouvez utiliser les jointures gauches et droites pour importer toutes les données d’un tableau et seulement les données nécessaires d’un autre. Les jointures gauches récupèrent toutes les données du tableau gauche et seulement les données correspondant à la condition de jointure dans le tableau droit. Les jointures droites récupèrent toutes les données du tableau droit et seulement les données correspondant à la condition de jointure dans le tableau gauche.

Les graphiques de Venn ci-dessous illustrent l’importation de vos données avec les jointures gauche et droite.

Jointure gauche :

Jointure droite :

Exemple de jointures gauche et droite

L’exemple ci-dessous montre comment des jointures gauche et droite importent les données. Cet exemple montre d’abord comment les données s’affichent avant la jointure, puis comment elles sont importées avec une jointure gauche et une jointure droite. Ces jointures sont créées dans Query Blender en utilisant des connexions établies, mais si vous voulez joindre des tableaux d’une base de données, vous pouvez utiliser SQL Designer (consultez Sélection de plusieurs tableaux à partir d’une connexion de base de données ).

La première, Account satisfaction scores, inclut des données sur les comptes qui ont fourni un score de satisfaction. Seuls les ID de compte (Account ID) qui ont envoyé un score de satisfaction sont inclus dans le jeu de données. L’image ci-dessous illustre les données avant la jointure.

La deuxième connexion, Add-on data, contient des informations sur tous les comptes ayant acheté un module supplémentaire. Seuls les ID de compte (Account ID) avec un module supplémentaire sont inclus dans le jeu de données. L’image ci-dessous illustre les données avant la jointure.

Vous pouvez joindre ces connexions pour afficher les scores de satisfaction envoyés par les comptes qui ont acheté un module supplémentaire. Les deux jeux de données contiennent un attribut Account ID commun, donc cet attribut est utilisé comme clé de jointure.

La condition de jointure ressemblera à l’illustration ci-dessous. Notez que la connexion Add-on data est sur la gauche et la connexion Account satisfaction scores sur la droite.

Si vous avez sélectionné l’option de jointure gauche, les résultats ressembleront à l’illustration ci-dessous.

Dans une jointure gauche, tous les Account ID d’Add-on data sont extraits, mais seuls les Account ID correspondants sont extraits d’Account satisfaction scores. Cela crée des valeurs Satisfaction Score vides. Ces valeurs vides représentent les ID de compte qui ont acheté un module supplémentaire, mais n’ont pas envoyé de score de satisfaction.

Si vous avez sélectionné l’option de jointure droite, les résultats ressembleront à l’illustration ci-dessous.

Dans une jointure droite, tous les Account ID d’Account satisfaction score sont extraits, mais seuls les Account ID correspondants sont extraits d’Add-on data. Cela crée une valeur Add-on vide. Cette valeur vide représente les ID de compte qui ont envoyé de score de satisfaction, mais n’ont pas acheté de module supplémentaire.

Jointure interne

Quand vous sélectionnez une jointure interne, seules les données correspondant à la condition de jointure sont récupérées. Le graphique de Venn ci-dessous illustre la façon dont sont importées les données quand vous sélectionnez la jointure interne.

Si vous utilisiez une jointure interne pour les connexions Add-on data et Account satisfaction score, les résultats ressembleraient à ce qui suit.

Avec une jointure interne, seuls les ID de compte qui ont acheté un module supplémentaire et envoyé un score de satisfaction sont inclus aux résultats. Tous les autres ID de compte sont exclus de la requête.

Le choix du type de jointure dépend du nombre et du type de résultats que vous voulez afficher. Dans certains cas, il peut être nécessaire de récupérer toutes les données d’un tableau ou seulement les données correspondantes. N’oubliez pas que votre type de jointure est enregistré dans votre stockage et qu’il affectera toutes les autres requêtes de la connexion à venir.

Vous avez d’autres questions ? Envoyer une demande

0 Commentaires

Veuillez vous connecter pour laisser un commentaire.
Réalisé par Zendesk