À l’endroit ou à l’envers ?

Parfois, certaines personnes recherchent un peu trop de variétés dans la sélection des types d’affichage pour leurs tableaux de bord.

L’exemple suivant fait réfléchir :

Normalement, la portion de pixels utilisées par une couleur devrait correspondre à la portion des données quelle représente. Si c’est 25% du tout, visuellement, on doit pouvoir s’en rendre compte. De plus, pourquoi utiliser un graphique si de toute façon, il est nécessaire de regarder les chiffres pour comprendre ? Ça devient très difficile de voir l’évolution des données.

Un simple graphique à courbes aurait très bien fait l’affaire.

Et oui, il existe une version à l’envers. Difficile de savoir ce qui les distingues l’une de l’autre. Surement pas l’effectivité visuelle.


Vous pouvez retrouver ces affichages et beaucoup d’autres ici. Voir la section Cloud preview.

Des spécialistes; pour quoi faire ?

Les fournisseurs d’outils BI devraient prendre un peu de temps pour se renseigner avant de mettre de l’avant des exemples de graphiques pour vendre leurs produits. Peut-être même devraient-ils consulter des spécialistes pour être certain que leurs graphiques répondent aux meilleures pratiques.

Voici trois graphiques que j’ai trouvés sur le site de SAS, et pour tout dire, il n’y a que trois graphiques sur la page.

Graphique #1

Le premier est une tarte, et oui, encore une !

Je dirais que son principal défaut, c’est que les secteurs du graphique sont eux-mêmes divisés en sous-secteur, ce qui porte à confusion. Il est déjà difficile, dans une tarte, de faire des comparaisons entre les différents secteurs, si ceux-ci sont en plus divisés en plusieurs morceaux, c’est encore pire.

Normalement, dans une tarte, le plus grand secteur doit commencer à midi et les autres (en ordre décroissant) doivent être ajoutés dans le sens des aiguilles d’une montre. Ce n’est visiblement pas le cas ici.

Graphique #2

Deuxième graphique, un histogramme 3D :

Dans un premier temps, nous aurions pu nous passer de la troisième dimension qui n’apporte rien au graphique. Quand on y regarde de plus près, on peut même se demander laquelle de ces lignes représente réellement les données.

L’image en arrière plan n’est pas nécessaire non plus. Nous sommes devant ce qu’Edward Tufte nomme judicieusement « Chart junk », de la pollution visuelle qui n’apporte absolument rien au message du graphique.

Aussi, le fait que les valeurs soient empilées les unes sur les autres par année, nous empêche de pouvoir comparer entre-elles celles qui sont au-dessus.

Par exemple, il est difficile de savoir si la production d’eau est resté la même entre 1987 et 1988. Pourtant, les deux barres sont côte-à-côte.

La ligne représentant la moyenne aurait avantage à être comparée à toutes les valeurs (essence, huile et eau), dans cet affichage, seules les barres représentant l’essence peuvent l’être.

Graphique #3

Pour finir, examinons la carte :

 

À vrai dire, au premier coup d’oeil, je n’avais rien vu. Mais en regardant la légende, j’ai sursauté. Les regroupements de valeurs sont étrange. Pourquoi tant de détail ? Ai-je vraiment besoin de savoir que le premier groupe représente les ventes entre $11,458 et $32,896 ? 11,000 et 33,000 aurait été plus logique.

Un autre détail agaçant, il faudrait que les regroupements soient égaut.

Par exemple :

  • 11,000 à 30,000
  • 31,000 à 50,000
  • 51,000 à 70,000
  • 71,000 à 90,000. 

S’agit-il de millier ou de million de dollars ? Il aurait fallut le spécifier. Si ce sont des millions, la légende pourrait alors ressembler à :

  • 11 à 30
  • 31 à 50
  • 51 à 70
  • 71 à 90.

Ce qui la simplifie beaucoup.

Dans ce graphique, les regroupements semblent avoir été choisis au hasard. En fait, si je voyais ça dans une présentation, je penserais que la personne à définit les groupes selon le classement qu’elle même voulait donner aux différents états.

Des spécialistes en affichage graphique de l’information; pour quoi faire ?

Information vs confusion

J’aime beaucoup ce petit graphique tout simple.

C’est tellement vrai, surtout quand on pense à la dernière campagne de vaccination contre la grippe.

Vous pouvez retrouver ce dessin et plusieurs autres sur le blog indexed.

Faire ressortir l’information qui compte

Dans mon précédent billet, je disais de réduire le plus possible le nombre de couleur dans les graphiques. Voici comment il est possible, avec peu de couleurs, de faire ressortir l’information importante pour nous.

Prenons l’exemple suivant. Ma compagnie est spécialisée dans les ventes d’un produit X et je veux démontrer à mes investisseurs comment celle-ci se positionne face aux compagnies du même type. 

Si je fais un simple histogramme, tel que démontré ci-dessous, ma compagnie est perdue au travers des autres et il faut prendre le temps mentalement pour faire le classement des compagnies impliquées. 

Les graphiques à barres horizontales sont mieux indiqués pour démontrer un classement, je vais donc changer mon type de graphique.

Il est maintenant beaucoup plus facile de voir le classement, mais ma compagnie ne ressort pas parmi les autres. Même que c’est la compagnie A qui semble la plus importante car sa couleur attire plus l’attention.

Une petite modification fera ressortir la performance de ma compagnie tout en maintenant le classement de toutes les compagnies les unes par rapport aux autres. 

Il est ainsi beaucoup plus facile pour le lecteur, d’identifier la compagnie analysée et du même coup, de savoir comment elle se classe par rapport à ses concurrentes, sans toutefois mettre l’accent sur ces dernières.

Un graphique revisité

Depuis que je m’intéresse à la mise en valeur de l’information, je regarde d’un autre oeil les graphiques que je consulte au cours de mes lectures. Si je me réfère aux préceptes de Stephen Few, il y a toujours place à l’amélioration. Je me suis donc dit qu’il serait amusant de voir comment je pouvais améliorer les graphiques disponibles sur le net.

Voici un exemple pris sur le site OAG aviation. Sur l’ensemble des graphiques présents sur la page, je n’ai retenu qu’un seul pour faire mon exercice.

 

Pour les besoins de la cause, j’ai reproduit le graphique dans Excel. Je pense que c’est suffisamment ressemblant pour ma démonstration.

Premier point, les couleurs. Éviter le plus possible l’ajout de couleurs inutiles. Le changement du rouge au jaune dans les barres du graphique n’apporte rien au message.

Retirons donc les couleurs. C’est un peu strict comme affichage, mais ça n’enlève rien du tout au message qui doit être transmis. À la limite, n’utiliser qu’une seule couleur à moins de vouloir faire ressortir une des barres.

Un autre point mineur mais qui peut rendre l’information plus difficile à lire, l’utilisation inutile du gras. Retirons donc un peu de gras pour voir et du même coup, pourquoi ne pas rapetisser la police un peu.

Ensuite, j’enlève les valeurs au-dessus des barres. Un graphique doit donner une image des données, il n’a pas à les détailler. Si les valeurs détaillées sont vraiment nécessaires, il est possible d’ajouter un tableau sous le graphique.

Il faut aussi retirer un peu de tout ces zéros inutiles sur l’échelle contenant le nombre de sièges. Comme les nombres indiqués sont tous en million, allons-y franchement. Par contre, il faudra préciser dans le titre que les nombres sont affichés en million.

Aussi, il y a de la redondance dans les mois qui sont affichés avec les années. Ce sera plus clair en gardant seulement l’année et en précisant le mois dans le titre. Il est également inutile d’inscrire 2001-2010 dans le titre puisque les années sont clairement identifiées sur l’axe.

Pour finir, généralement lorsqu’on veut démontrer une évolution dans les données, c’est un graphique à courbe qu’il faut utiliser. Je vais donc modifier le type du graphique.

Pour améliorer encore l’impact du graphique, il est aussi possible d’ajouter une note près de certains points. C’est ce qui mettra fin à l’exercice.

C’est donc la version finale. Dites-moi si vous êtes d’accord et si non, qu’auriez vous fait de différent ?

Aussi, n’hésitez pas à me transmettre des liens vers des graphiques qui pourraient être améliorés.

Un petit détail…

Vous savez, parfois, un petit détail fait toute la différence.

Dans la construction de graphique, il est toujours important de faire débuter les échelles à zéro. Ceci afin d’éviter de faire ressortir des écarts qui ne sont pas réels.

Il faut garder en tête que les graphiques sont utilisés pour que l’information soit compréhensible au premier coup d’œil. 

Si l’échelle ne débute pas à zéro, le lecteur aura une première impression incorrecte et s’il ne regarde pas le graphique attentivement, cette impression pour lui, deviendra la vérité. 

Voici donc une petite démonstration. Regardez-bien le graphique ci-dessous.

 

En regardant cette image, si le lecteur ne tient pas compte du fait que l’échelle débute à 300, il verra :

  • que les ventes de la Région B représentent le 2/3 de celles de la Région A
  • que les ventes de la Région C représentent seulement le tiers de celles de la Région A et la moitié de celles de la Région B.

Pourtant, avec une échelle correcte (voir l’image ci-dessous),  c’est une toute autre histoire que l’utilisateur retiendra.

Pourtant, dans certains cas, le zéro peut nuire. C’est le cas si les valeurs varient très peu les unes par rapport aux autres. Conserver le zéro pourrait nous empêcher de voir les exceptions dans les données.

Ci-dessous, on voit bien qu’il y a très peu de variance dans les données. C’est difficile de voir si une journée diffère réellement des autres.

Par contre, dans cet autre exemple, le début de l’échelle à 90% permet de bien voir que le vendredi, l’application est moins disponible qu’au cours des autres jours de la semaine.

La construction de graphique, comme pour le reste, c’est une question de gros bon sens.

Qu’est-ce qui cloche ?

J’ai trouvé sur le blogue FlowingData ce matin, une tentative d’affichage graphique qui vaut vraiment le détour. Malheureusement, ce n’est pas parce que c’est particulièrement réussi, c’est plutôt le contraire.

Espérons réellement que c’est une erreur et que ce n’était pas voulu ainsi.

Qu’est-ce qui cloche ? Peu importe le graphique que l’on regarde, les barres blanches et les barres rouge sont toujours identiques.

Dans l’exemple ci-dessous, la plus petite barre a même une valeur plus élevée.

La hauteur de la barre blanche ne change pas, même lorsque la valeur est zéro.

Pour accéder au graphique complet, cliquez ici.

Tableau périodique des méthodes de visualisation

Nous connaissons tous le tableau périodique des éléments, c’est pourquoi lorsque j’ai trouvé ceci, je me suis sentie interpellée. Dans ce cas, c’est un outil de catégorisation des méthodes de visualisation. Chaque type est classé par catégories, celles-ci étant représentées par une couleur différente. En allant sur le site de Visual-literacy pour consulter ce tableau, vous n’aurez qu’à survoler la case de votre choix pour avoir un exemple du type de visualisation en question.

Les types de visualisation illustrés vont du Heatmap au Mindmap, en passant par les graphiques traditionnels. Malheureusement, les tartes y sont aussi !

Les nuages de mots clés

Vous les avez certainement vus, sur certains sites ou blogues, ces nuages-là. La plupart du temps, ils permettent d’identifier rapidement les mots les plus populaires sur ces sites. 

Plus un mot est utilisé souvent dans le moteur de recherche, plus le caractère d’affichage de ce mot sera grossit. De plus, le mot est un hyperlien et permet d’accéder au résultat de la recherche. 

En regardant l’image suivante, il est facile de savoir quels sont les mots les plus populaires sur le site de SQLprof .

En naviguant sur Internet, j’ai trouvé une utilisation très intéressante de ce type d’affichage graphique. En fait, il peut nous permettre, en un coup d’œil, de comprendre les principaux thèmes abordés dans un texte. Ce texte peut être un poème, une chanson, un livre, ou même un discours. 

Ci-dessous, le nuage de mots clés résultant du discours inaugural prononcé par Obama. 

Si vous vous rendez sur le site de ReadWriteWeb, vous pourrez également voir les discours de Bush, Clinton, Reagan et même Lincoln. Vous pourrez donc y voir rapidement les principales préoccupations de chacun au moment de leur discours. On peut même se demander si certains mots ne sont pas prononcés à plusieurs reprises uniquement pour que les auditeurs aient une bonne impression du discours.  

Pour ceux qui aimeraient créer leur propre nuage de mots clés, le site Wordle, est très facile d’utilisation. Il est même possible de sauvegarder vos créations dans leur librairie. 

Voici ce que j’obtiens, en y mettant le lien vers mon blog. Sans grande surprise, le mot qui en émerge principalement est GRAPHIQUE.

N’hésitez pas à nous faire connaître le résultat de vos efforts !

Un peu d’aide dans le choix d’un graphique

On se demande souvent quel type de graphique choisir lorsque le type d’information à afficher nous est peu famillier ou pour sortir des éternelles pointes de tarte. Les gens de Extreme presentation Method  ont conçu un diagramme qui nous permet d’avoir une idée de ce qui est possible de faire, selon nos besoins.

Sans dire que c’est une panacée, je pense que c’est un bon point de départ.

Vous pourrez même télécharger la version PDF originale via le lien suivant : Choosing a good chart

Suivre

Get every new post delivered to your Inbox.