Un autre graphique à revoir

Depuis plusieurs mois déjà, je vous présente et je commente des graphiques de toute provenance. J’aime beaucoup ce petit jeu, mais j’aimerais pour cette fois que vous y participiez.

Que penses-vous du graphique ci-dessous ? Comment vous y prendriez-vous pour en faire un graphique convainquant ? Quelles sont ses lacunes ?

Peut-être le trouvez-vous parfait ? Dites-le moi !

Vous pouvez consulter une version pleine page du graphique et consulter le texte qui y est joint via le blog DéCHIFFRAGE.

Publicités
Publié dans Mauvaise idée. Étiquettes : . 1 Comment »

Des spécialistes; pour quoi faire ?

Les fournisseurs d’outils BI devraient prendre un peu de temps pour se renseigner avant de mettre de l’avant des exemples de graphiques pour vendre leurs produits. Peut-être même devraient-ils consulter des spécialistes pour être certain que leurs graphiques répondent aux meilleures pratiques.

Voici trois graphiques que j’ai trouvés sur le site de SAS, et pour tout dire, il n’y a que trois graphiques sur la page.

Graphique #1

Le premier est une tarte, et oui, encore une !

Je dirais que son principal défaut, c’est que les secteurs du graphique sont eux-mêmes divisés en sous-secteur, ce qui porte à confusion. Il est déjà difficile, dans une tarte, de faire des comparaisons entre les différents secteurs, si ceux-ci sont en plus divisés en plusieurs morceaux, c’est encore pire.

Normalement, dans une tarte, le plus grand secteur doit commencer à midi et les autres (en ordre décroissant) doivent être ajoutés dans le sens des aiguilles d’une montre. Ce n’est visiblement pas le cas ici.

Graphique #2

Deuxième graphique, un histogramme 3D :

Dans un premier temps, nous aurions pu nous passer de la troisième dimension qui n’apporte rien au graphique. Quand on y regarde de plus près, on peut même se demander laquelle de ces lignes représente réellement les données.

L’image en arrière plan n’est pas nécessaire non plus. Nous sommes devant ce qu’Edward Tufte nomme judicieusement « Chart junk », de la pollution visuelle qui n’apporte absolument rien au message du graphique.

Aussi, le fait que les valeurs soient empilées les unes sur les autres par année, nous empêche de pouvoir comparer entre-elles celles qui sont au-dessus.

Par exemple, il est difficile de savoir si la production d’eau est resté la même entre 1987 et 1988. Pourtant, les deux barres sont côte-à-côte.

La ligne représentant la moyenne aurait avantage à être comparée à toutes les valeurs (essence, huile et eau), dans cet affichage, seules les barres représentant l’essence peuvent l’être.

Graphique #3

Pour finir, examinons la carte :

 

À vrai dire, au premier coup d’oeil, je n’avais rien vu. Mais en regardant la légende, j’ai sursauté. Les regroupements de valeurs sont étrange. Pourquoi tant de détail ? Ai-je vraiment besoin de savoir que le premier groupe représente les ventes entre $11,458 et $32,896 ? 11,000 et 33,000 aurait été plus logique.

Un autre détail agaçant, il faudrait que les regroupements soient égaut.

Par exemple :

  • 11,000 à 30,000
  • 31,000 à 50,000
  • 51,000 à 70,000
  • 71,000 à 90,000. 

S’agit-il de millier ou de million de dollars ? Il aurait fallut le spécifier. Si ce sont des millions, la légende pourrait alors ressembler à :

  • 11 à 30
  • 31 à 50
  • 51 à 70
  • 71 à 90.

Ce qui la simplifie beaucoup.

Dans ce graphique, les regroupements semblent avoir été choisis au hasard. En fait, si je voyais ça dans une présentation, je penserais que la personne à définit les groupes selon le classement qu’elle même voulait donner aux différents états.

Des spécialistes en affichage graphique de l’information; pour quoi faire ?

Publié dans Mauvaise idée. Étiquettes : , . Leave a Comment »

Information vs confusion

J’aime beaucoup ce petit graphique tout simple.

C’est tellement vrai, surtout quand on pense à la dernière campagne de vaccination contre la grippe.

Vous pouvez retrouver ce dessin et plusieurs autres sur le blog indexed.

Publié dans Trouvailles. Étiquettes : . Leave a Comment »

Qu’est-ce qui est pire qu’une tarte ?

Et bien, la moitié d’une tarte !

J’ai trouvé le graphique ci-dessous en faisant une recherche sur le mot « Graphe ».  Il semblerait que l’auteur ait voulu s’inspirer des cadrans qui sont utilisés dans les tableaux de bord. Ce n’est vraiment pas le bon type d’affichage.

Ces demi-tartes ont plusieurs lacunes :

Il y a beaucoup trop de secteur. Tellement que les valeurs de certains ne sont pas inscrites.

L’ordre des secteurs me semble chaotique. Ce n’est ni un ordre alphabétique, ni un classement (du plus grand au plus petit ou du plus petit au plus grand).

Est-ce que ce sont des nombres qui sont représentés ou bien des pourcentages ? En y regardant de plus près, on devine qu’il s’agit de pourcentage, mais il est difficile de deviner les valeurs des secteurs auxquels aucune valeur n’est assignée.

Il y a deux teintes de gris qui se ressemblent beaucoup, heureusement, la légende suit l’ordre des secteurs.

Probablement que ces deux graphiques avaient pour but de comparer les divers types d’incendie des deux régions, deux graphiques à barres horizontales affichés côte-à-côte auraient beaucoup mieux performés dans ce cas.

Je n’ai pas pu trouver l’originale du graphique, mais j’ai tout de même découvert que Prométhée est « La banque de données sur les incendies de forêt en région méditerranéenne en France ». En cherchant un peu dans les différents rapports, j’ai trouvé plusieurs graphiques qui pourraient faire l’objet d’un billet ici. 

 

Faire ressortir l’information qui compte

Dans mon précédent billet, je disais de réduire le plus possible le nombre de couleur dans les graphiques. Voici comment il est possible, avec peu de couleurs, de faire ressortir l’information importante pour nous.

Prenons l’exemple suivant. Ma compagnie est spécialisée dans les ventes d’un produit X et je veux démontrer à mes investisseurs comment celle-ci se positionne face aux compagnies du même type. 

Si je fais un simple histogramme, tel que démontré ci-dessous, ma compagnie est perdue au travers des autres et il faut prendre le temps mentalement pour faire le classement des compagnies impliquées. 

Les graphiques à barres horizontales sont mieux indiqués pour démontrer un classement, je vais donc changer mon type de graphique.

Il est maintenant beaucoup plus facile de voir le classement, mais ma compagnie ne ressort pas parmi les autres. Même que c’est la compagnie A qui semble la plus importante car sa couleur attire plus l’attention.

Une petite modification fera ressortir la performance de ma compagnie tout en maintenant le classement de toutes les compagnies les unes par rapport aux autres. 

Il est ainsi beaucoup plus facile pour le lecteur, d’identifier la compagnie analysée et du même coup, de savoir comment elle se classe par rapport à ses concurrentes, sans toutefois mettre l’accent sur ces dernières.

Un graphique revisité

Depuis que je m’intéresse à la mise en valeur de l’information, je regarde d’un autre oeil les graphiques que je consulte au cours de mes lectures. Si je me réfère aux préceptes de Stephen Few, il y a toujours place à l’amélioration. Je me suis donc dit qu’il serait amusant de voir comment je pouvais améliorer les graphiques disponibles sur le net.

Voici un exemple pris sur le site OAG aviation. Sur l’ensemble des graphiques présents sur la page, je n’ai retenu qu’un seul pour faire mon exercice.

 

Pour les besoins de la cause, j’ai reproduit le graphique dans Excel. Je pense que c’est suffisamment ressemblant pour ma démonstration.

Premier point, les couleurs. Éviter le plus possible l’ajout de couleurs inutiles. Le changement du rouge au jaune dans les barres du graphique n’apporte rien au message.

Retirons donc les couleurs. C’est un peu strict comme affichage, mais ça n’enlève rien du tout au message qui doit être transmis. À la limite, n’utiliser qu’une seule couleur à moins de vouloir faire ressortir une des barres.

Un autre point mineur mais qui peut rendre l’information plus difficile à lire, l’utilisation inutile du gras. Retirons donc un peu de gras pour voir et du même coup, pourquoi ne pas rapetisser la police un peu.

Ensuite, j’enlève les valeurs au-dessus des barres. Un graphique doit donner une image des données, il n’a pas à les détailler. Si les valeurs détaillées sont vraiment nécessaires, il est possible d’ajouter un tableau sous le graphique.

Il faut aussi retirer un peu de tout ces zéros inutiles sur l’échelle contenant le nombre de sièges. Comme les nombres indiqués sont tous en million, allons-y franchement. Par contre, il faudra préciser dans le titre que les nombres sont affichés en million.

Aussi, il y a de la redondance dans les mois qui sont affichés avec les années. Ce sera plus clair en gardant seulement l’année et en précisant le mois dans le titre. Il est également inutile d’inscrire 2001-2010 dans le titre puisque les années sont clairement identifiées sur l’axe.

Pour finir, généralement lorsqu’on veut démontrer une évolution dans les données, c’est un graphique à courbe qu’il faut utiliser. Je vais donc modifier le type du graphique.

Pour améliorer encore l’impact du graphique, il est aussi possible d’ajouter une note près de certains points. C’est ce qui mettra fin à l’exercice.

C’est donc la version finale. Dites-moi si vous êtes d’accord et si non, qu’auriez vous fait de différent ?

Aussi, n’hésitez pas à me transmettre des liens vers des graphiques qui pourraient être améliorés.

Un petit détail…

Vous savez, parfois, un petit détail fait toute la différence.

Dans la construction de graphique, il est toujours important de faire débuter les échelles à zéro. Ceci afin d’éviter de faire ressortir des écarts qui ne sont pas réels.

Il faut garder en tête que les graphiques sont utilisés pour que l’information soit compréhensible au premier coup d’œil. 

Si l’échelle ne débute pas à zéro, le lecteur aura une première impression incorrecte et s’il ne regarde pas le graphique attentivement, cette impression pour lui, deviendra la vérité. 

Voici donc une petite démonstration. Regardez-bien le graphique ci-dessous.

 

En regardant cette image, si le lecteur ne tient pas compte du fait que l’échelle débute à 300, il verra :

  • que les ventes de la Région B représentent le 2/3 de celles de la Région A
  • que les ventes de la Région C représentent seulement le tiers de celles de la Région A et la moitié de celles de la Région B.

Pourtant, avec une échelle correcte (voir l’image ci-dessous),  c’est une toute autre histoire que l’utilisateur retiendra.

Pourtant, dans certains cas, le zéro peut nuire. C’est le cas si les valeurs varient très peu les unes par rapport aux autres. Conserver le zéro pourrait nous empêcher de voir les exceptions dans les données.

Ci-dessous, on voit bien qu’il y a très peu de variance dans les données. C’est difficile de voir si une journée diffère réellement des autres.

Par contre, dans cet autre exemple, le début de l’échelle à 90% permet de bien voir que le vendredi, l’application est moins disponible qu’au cours des autres jours de la semaine.

La construction de graphique, comme pour le reste, c’est une question de gros bon sens.