Galeries

Les prix fous du train : ville par ville, les tarifs relevés sur le site de la SNCF

Pour connaître le prix de son billet de train, il a longtemps suffi de faire une simple multiplication : le nombre de kilomètres à parcourir par le prix du kilomètre.  Ce principe de péréquation a duré de la création de la SNCF, en 1938, jusqu’en 1970, quand la compagnie a commencé à moduler les tarifs du train en fonction d’autres critères.

Cette époque semble bien lointaine à l’heure du yield management, un principe de tarification généralisé par la SNCF à partir de 1993, qui permet d’optimiser les revenus, en s’assurant qu’un maximum de sièges sont occupés, et que leurs occupants ont payé la somme maximale qu’il étaient prêt à consacrer à cette dépense.

Résultat : pour beaucoup d’usagers du train, la valse des étiquettes peut sembler folle, tant ils varient d’un train sur l’autre et d’un jour à l’autre – sauf sur certaines liaisons, en vertu d’accords entre la SNCF et les régions. 

L’offre et la demande font leur loi, et les prix s’envolent si la seconde dépasse la première, comme cet automne, quand la compagnie a ouvert à la vente les billets des vacances de Noël, jugés trop chers et trop rares par beaucoup d’usagers.

11 000 tarifs relevés pour une trentaine de villes, en suivant divers scénarios

Mais dans quel mesure évoluent ces prix ? Quels plafonds et quels planchers peuvent-ils atteindre ? Pour répondre, j’ai relevé automatiquement plus de 11 000 tarifs proposés sur le site Oui.sncf pour des trajets entre Paris et une trentaine de villes de France, en fonction de divers scénarios.

J’ai ainsi simulé un voyage prévu la veille pour le lendemain, un week-end prévu longtemps à l’avance, un déplacement dans le creux de la semaine d’autres en période de pointe, comme à la Toussaint ou à Noël. Les résultats montrent des variations de tarifs très fortes.

Selon le chercheur Jean Finez, auteur d’une intéressante « socio-histoire » de la tarification SNCF, le prix pour parcourir 100 kilomètres en deuxième classe était de 84 F en 1944, hors tarifs sociaux (les familles nombreuses, les militaires…) ou opérations commerciales. Soit, si on tient compte de l’inflation, 20 € de 2018. Par exemple, un Paris-Lyon (510 kilomètres de voie ferrée) devait alors coûter 428 F, soit 100 € de 2018. 

Mes relevés semblent montrer que ce prix est un peu moins élevé aujourd’hui, avec une moyenne globale de 18,60 € pour 100 kilomètres. Le Paris-Lyon revient en moyenne à 83,80 €.

Cette moyenne cache de fortes variations : un Paris-Marseille peut passer de 16 € à 212 €. Cet exemple est un peu trompeur cependant : le tarif maximum correspond à un billet de première classe, la seconde classe étant complète. C’est ce que m’indiquait l’économiste Thomas Le Gouezigou sur Twitter peu de temps après la parution de cet article. Le plafond prévu par la loi pour la seconde classe, rappelle-t-il, est de 116 €. 

En tout cas, toutes les villes ne sont pas logées à la même enseigne : un Rémois vivant à Paris et souhaitant rentrer chez lui se voit proposer un prix moyen de 28,50 € pour 100 kilomètres, contre 14,40 € les 100 km pour son compatriote toulonnais.

Le prix au kilomètre parcouru varie fortement selon les destinations

Est-ce un effet de la concurrence de l’avion sur les longues distances  ? Mes pointages montrent que le prix au kilomètre diminue en fonction de la distance parcourue. C’est notamment le cas au bout de la LGV Sud-Est : les Niçois, les Marseillais ou les Perpignanais paient moins cher leur voyage, du moins selon ce critère. 

Le prix au kilomètre diminue avec le nombre de kilomètres parcourus 

En revanche, il ne semble pas y avoir de lien entre le prix au kilomètre affiché et la richesse des villes desservies (estimée ici avec la médiane du niveau de vie que calcule l’Insee pour chaque commune). 

Le prix au kilomètre ne varie pas avec la richesse des villes desservies

Mais voyager dans une vieille voiture de deuxième classe tracté par une poussive micheline, ce n’est pas tout à fait la même chose que de filer plus vite que le vent dans un TGV dernier cri. Pour le fun, j’ai donc aussi calculé un prix au kilomètre/heure (en me basant sur les heures de départ et d’arrivée ainsi que la distance à vol d’oiseau entre les deux villes), et établi un autre classement selon ce critère.

Le prix au km/h est aussi très variable

Si le sujet vous intéresse et que vous souhaitez faire d’autres comparaisons, mes données sont disponibles sous forme de Google Sheet. Les curieux liront aussi ce billet d’Arthur Charpentier sur le site Freakonometrics.

Mise à jour le 17 décembre à 00h30. Sur Twitter, l’économiste Thomas Le Gouezigou fait remarquer que lorsque la seconde classe est complète, le site Oui.sncf propose les places restantes en première classe. J’ai ajouté un passage et corrigé les textes des infographies en conséquence.

Photo en page d’accueil : deux TGV en gare (TGr_79 / Flickr / CC-BY-SA)

Obsessions, marottes et zones d’ombre : voici les sujets préférés de 60 sites d’info français

Dans une rédaction, la ligne éditoriale, c’est comme le dahu : tout le monde en parle, mais personne ne l’a jamais vue. Elle structure pourtant le travail quotidien des journalistes ; c’est en son nom qu’on va accepter ou refuser une idée de sujet ou d’angle. Et quand elle est absente ou bien trop floue, ce n’est souvent pas bon signe.

Pour tenter de représenter ces fameuses lignes, j’ai mis au point ce tableau de bord, qui montre les thématiques les plus présentes sur une soixantaine de sites d’actualité dans les sept derniers jours, le tout rafraîchi trois fois par jour.

Encore expérimentales, ces listes sont générées automatiquement, grâce à la reconnaissance d’entités nommées dans un corpus spécifique à chaque média. Cet agglomérat de texte est formé avec les informations disponibles au sein de son flux RSS principal – je reviens en détail sur la méthodologie utilisée dans un autre post.

Mis à jour le 5/10/2018. L’infographie a pas mal évolué depuis sa publication, voir la liste des changements dans ce post.

Mis à jour le 15/11/2019. Le tableau de bord n’est plus mis à jour.

Bataille de bouffe ! Découvrez les ingrédients et recettes préférés des Français

Mettez deux Français ensemble, et il y a de bonnes chances qu’après quelques minutes, ils se mettent à parler de bouffe, qu’il s’agisse du dernier restaurant à la mode ou de cette recette exclusive de moelleux au chocolat qu’ils sortent du tiroir pour les grandes occasions.

Mais quels sont les aliments et les préparations préférés des Français ? Pour le savoir, j’ai « aspiré » les données d’un des sites de recettes les plus populaires, Marmiton, Vous pouvez découvrir les résultats en lançant des batailles d’ingrédients dans l’infographie ci-dessous.

Pour calculer le score d’un ingrédient, j’ai d’abord récupéré toutes les recettes qui le contiennent, grâce à un script en Python. Ensuite j’ai multiplié, pour chacune de ces dernières, le nombre d’avis d’internautes par la note moyenne obtenue. Et j’ai additionné le tout.

Je n’ai gardé que les 1 130 ingrédients qui apparaissent dans au moins 10 recettes, et opéré pas mal de regroupements pour obtenir des résultats plus pertinents (par exemple, « échine de porc », « côtes de porc » ou « escalope de porc » sont toutes regroupées dans l’ingrédient « porc »). La liste retenue contient finalement 871 entrées, de A comme « abricot » à Y comme « yaourt ».

Il m’a aussi fallu créer une cinquantaine de catégories (de « viandes » à « produits laitiers » en passant par « bonbons » ou « champignons ») afin de générer les classements. N’hésitez pas à me signaler des erreurs ou des bizarreries dans les commentaires ou en me contactant, afin que je les corrige.

Vous pouvez aussi consulter les données sur les ingrédients comme celles sur les catégories, pour les réutiliser si vous le souhaitez.

 

La France de la VO et celle de la VF : les cartes d’une fracture française

La France de la VO
La France de la VF

Ça fait partie de ces combats qui divisent les Français en deux camps irréconciliables. Comme la guerre sans merci du « pain au chocolat » et de la « chocolatine », ou le conflit séculaire entre la tartine au beurre salé et celle au beurre doux.

De même, il y a ceux qui ne jurent que par la version originale sous-titrée (VO) – quitte à passer son temps à lire les sous-titres plutôt qu’à profiter de l’action et des dialogues – et ceux qui ne peuvent pas vivre sans la version française (VF) – quitte à subir des traductions et des doublages pas toujours parfaits.

Histoire de frustrer un peu tout le monde, les cinémas ne proposent pas forcément les deux versions. Sur les deux anamorphoses en haut de cet article, plus un département est gros et plus ses habitants se voient proposer de séances en VO (à gauche, en rouge) ou de la VF (à droite, en vert).

Sur une journée, 20 182 séances de cinéma dans 1 400 salles

Pour les réaliser, j’ai récupéré, grâce à un scraper, l’intégralité des séances disponibles sur un site spécialisé pour la journée du 28 avril 2017. Soit plus de 20 182 séances, dans plus de 1 400 cinémas de France et de Navarre, projetant un total de 981 films différents.

Parmi ces derniers, j’en ai identifié 549 en langue étrangère (non sans mal, comme je l’explique dans un autre post sur site, où je reviens sur la méthode utilisée) pour un total de 14 223 séances, dont 2 964 en VO.

Dans certaines régions, la VO est réservée aux petites salles de centre-ville ou aux cinémas art et essai. Mais certains réseaux de multiplexes programment aussi un nombre important de séances en VO, comme UGC.

Si on passe à l’échelon des villes, c’est bien sûr à Paris que sont proposées le plus de séances en VO. Mais la banlieue et la province se défendent, avec Montreuil, Biarritz et Hérouville-Saint-Clair en tête devant la capitale si on prend compte la part totale des séances en VO.

A l’inverse, il y a des coins de France où on vous recommande pas de déménager si vous êtes #teamvo. Dans cinq départements, aucune séance en VO n’était proposée dans la journée :

  • l’Ariège
  • la Creuse
  • la Haute-Saône
  • l’Indre
  • l’Orne

Les villes avec VO et les villes avec VF

Mais pourquoi les cinémas d’une ville proposent-ils de la VO alors que ceux de la ville d’à côté se contentent de la VF ? Le goût pour la VO est lié à la richesse des habitants, à leur niveau d’éducation, où bien à leur choix politique ?

Sur les 1 133 localités étudiées, plus de 65% ne proposaient aucune séance en VO dans leurs salles de cinéma. Pour explorer mes données, j’ai donc réparti la liste en deux deux camps : les villes avec VO et les villes sans VO.


J’ai ensuite associé mes résultats à une série de statistiques de l’Insee, à commencer par la population (en 2014). Sans surprise, ce sont dans les localités les plus peuplées qu’on a le plus de chances se trouver des séances en VO.

Ça semble logique : comme la majorité des Français préfère la VF, proposer de la VO n’est commercialement intéressant que si la salle se trouve dans une zone suffisamment peuplée pour qu’on y trouve un nombre suffisant d’amateurs de versions sous-titrées.

Dans les deux camps, le niveau de vie médian est proche. On peut faire l’hypothèse que la VO n’est pas « un truc de riches »…

… ce que semble confirmer la comparaison du taux de pauvreté médian des deux séries de villes.

En revanche, si on s’intéresse à la part de la population ayant suivi des études supérieures, la différence est nette.

Je vois au moins une causalité possible à cette corrélation : plus on étudie, plus on est à l’aise avec la lecture, et moins on est gêné quand on doit passer du temps à lire les dialogues en bas de l’écran. Ce qui pourrait inciter les gérants de salle de la localité concernée à privilégier les copies en VO.

J’ai aussi croisé mes données avec les résultats du premier tour de la présidentielle 2017. Les villes sans VO ont tendance à voter davantage pour Le Pen et moins pour Macron et Mélenchon que les autres. Si la présidentielle ne s’était jouée que dans les villes avec VO, Mélenchon aurait été qualifié pour le second tour.


Voilà ! Evidemment, ce travail est très parcellaire, et la méthode que j’ai utilisée sûrement contestable. Je ne suis pas spécialiste de l’étude des pratiques culturelles, et je ne sais pas si cette grande fracture française a fait l’objet d’enquêtes plus poussées. [ajout le 27/7 à 17h20 : Vodkaster a fait un point assez complet sur le sujet en 2016]

Je serais en tout cas ravi d’en savoir plus, donc n’hésitez pas à descendre donner votre avis un peu plus bas dans les commentaires, et à aller explorer ces données, qui sont disponibles dans une Google Sheet.

Corrigé le 21/7 à 10h20. Inversion des barres dans les graphique niveaux de vie et part des diplômés du supérieur.

Mis à jour le 21/7 à 11h45. Ajout du graphique consacré aux réseaux de multiplexes.

Corrigé le 1/10 à 21h10. Inversion des barres dans le graphique population.

Voici comment les médias français voient le monde

Les médias nous donnent-ils une vision déformée du monde qui nous entoure ? La question est vieille comme Théophraste Renaudot, mais j’ai tenté d’y apporter une réponse moderne avec la série de cartes « anamorphosées » publiée ci-dessous – une idée que j’ai piquée à mes petits camarades d’Altermondes.

Elles ont été réalisées en basant la déformation de chaque pays sur le nombre de résultats trouvés par Google quand on le cherche sur le site de l’un des vingt médias étudiés – je reviens plus en détail sur la méthode utilisée (et ses limites) dans un autre post.

Avec l’avènement des réseaux sociaux, devenus pour beaucoup d’entre nous le principal point d’accès à l’information, ces cartes vont-elles se déformer davantage ?

En filtrant selon leur popularité les publications venues de nos amis et des pages auxquelles nous nous sommes abonnés , Facebook est en effet accusé de créer une « bulle » autour de ses utilisateurs, ne les exposant plus qu’à des informations qui les touchent ou les font réagir.

Et comme leur trafic dépend de plus en plus de cette plateforme, les médias sont tentés de « publier pour Facebook », laissant de côté l’actualité des pays trop lointains. Un phénomène qu’on peut observer sur les cartes de Buzzfeed France et du Huffington Post, où les pays du Sud occupent la portion congrue.

Mais ces biais ne sont pas nouveaux, et ils dépendent aussi de la ligne éditoriale des journaux concernés :

  • L’Amérique du Sud et l’Afrique sont nettement enflées sur la carte du Monde diplomatique – logique vu les positions tiers-mondistes de ce mensuel.
  • l’Europe explose sur celle de Contexte – normal, le site suit de près l’actualité législative de l’UE.
  • les Etats-Unis sont bien plus gros que la moyenne sur celle de Slate.fr – pas étonnant, une bonne partie des articles sont des traductions de textes publiés dans la version américaine.
  • Les sites qui reprennent beaucoup l’AFP, par exemple Libération et Le Figaro, ont des cartes assez proches –une part importante des résultats décomptés se trouvent dans les dépêches de cette agence et reprises, sous différentes formes, sur ces sites.

Ces spécificités se retrouvent si on s’intéresse aux pays les plus cités, média par média.

On retrouve bien la loi du « mort-kilomètre », qui veut qu’une tempête de neige à Londres pourra occuper les chaînes infos toute la journée, alors qu’un tsunami en Indonésie peut faire des centaines de victimes sans qu’on chamboule le menu des journaux télévisés.

Mais on peut aussi prendre le problème dans l’autre sens, et s’intéresser aux médias qui s’intéressent plus (ou moins) que la moyenne à un pays donné.

N’hésitez pas à explorer vous-mêmes les données que j’ai récoltées,  et à raconter vos trouvailles ou à signaler des problèmes en me contactant ou en laissant commentaire.

Mis à jour le 26/1 à 10h35. Précision ajoutée concernant les médias reprenant beaucoup l’AFP, après un échange avec @quentingirard sur Twitter.

Ces livres plus chers en version électronique que sur papier

Un eBook ouvert sur un iPhone (Jonas Tana/Flickr/CC-BY-NC-DR)
Un eBook ouvert sur un iPhone (Jonas Tana/Flickr/CC-BY-NC-DR)

Ça coûte combien, une série de 0 et de 1 ? C’est la vertigineuse question à laquelle se confrontent les éditeurs quand il faut fixer le prix de la version électronique d’un de leurs livres.

Et la réponse varie beaucoup d’un titre à l’autre, comme le montre un échantillon d’une cinquantaine de romans et essais, choisi parmi les plus vendus ou signés des auteurs les plus connus.

Pour chacun, j’ai relevé le prix de l’édition originale, celui de l’édition poche et celui des versions iBook d’Apple ou Kindle d’Amazon (données disponibles au format CSV).

A ma grande surprise, l’ebook est dans la plupart des cas plus cher que la version poche.

Le surcoût atteint même 10,90 € pour Boomerang, de Tatiana de Rosnay (éd. Héloïse d’Ormesson) – 17,99 € en version électronique, 7,10 € au Livre de poche (+150%).

De même, Apocalypse Bébé, de Virginie Despentes (éd. Grasset), vous coûtera 13,99 € si vous souhaitez le lire sur votre Kindle, contre 7,10 € seulement si vous voulez feuilleter les 380 pages de la version Livre de poche (+97%).

Ce décalage m’a étonné : d’un côté, un fichier numérique dont la reproduction ne coûte rien ; de l’autre, un objet physique fait de papier et d’encre et qu’il faut acheminer jusqu’au lecteur.

Sans compter que proposer un prix bas pour les ebooks les rend plus accessibles aux lecteurs les plus fauchés, et pourrait éviter de voir certains se tourner avec le piratage.

Si on compare le prix de l’édition originale et celui de l’ebook, le second est toujours moins élevé, mais la décote est très variable selon les titres : de ‑17% à ‑68% (-41% en moyenne).

Parmi les auteurs dont les ebooks sont vendus à prix cassés, on trouve paradoxalement Frédéric Beigbeder, un farouche opposant du livre électronique – c’est la fin « des librairies, des maisons d’édition, des suppléments littéraires dans les journaux et peut-être la fin de la critique littéraire », déclarait-il sur Europe 1 en 2011.

Son Oona & Salinger est vendu 7,10 € en poche mais seulement 6,49 € chez Apple et Amazon, soit une remise de 9%, la plus élevée de mon échantillon. Et pour Windows on the World, l’ebook est « seulement » 39 centimes plus cher que le poche (7,99 € au lieu de 7,60 €, soit +5%).

J’ai donc contacté les maisons d’édition concernées pour mieux comprendre comment ces prix étaient fixés.

La réponse de Fallois m’a beaucoup surpris : si La Vérité sur l’affaire Harry Québert, best-seller surprise de Joël Dicker, coûte 11,99 € en version électronique (contre 9,20 € en poche, soit +30%), c’est pour éviter qu’elle se vende trop bien, m’explique en substance Philippine Cruse :

« Nous voulons soutenir le livre papier. Si vous mettez un prix trop bas pour les ebooks, les gens ne vont acheter que du numérique et vous allez faire mourir les libraires. »

Si le sort des librairies est en jeu, pourquoi ne pas aller plus loin et retirer la version ebook de la vente ? Parce que l’époque est au compromis : « On est obligés de jongler, c’est une période un peu difficile », reconnaît-elle.

Chez Viviane Hamy, qui vend Coule la Seine de Fred Vargas à 9,99 € en ebook alors qu’il coûte 4,30 € en poche (+132%), Maylis Vauterin a bien voulu détailler la politique tarifaire pratiquée.

Quand le livre est une nouveauté, la décote sera de « 30% au minimum », mais le prix pourra même être descendu à 9,99 € dans le cadre d’une offre de lancement si « le potentiel d’un titre est particulièrement fort pour les lecteurs qui lisent en numérique ».

Pour les livres « de fond », le prix est « de 9,99 € pour la collection policière et 6,99 € pour la collection bis », hors périodes et offres de promotion.

Et c’est justement pour pouvoir proposer des promos que le prix de Coule la Seine et des autres romans de cet éditeur est maintenu plus cher que la version poche :

« Je ne connais pas d’autres mécanismes pour mettre en avant nos livres (dans la masse de livres disponibles, en étant un éditeur indépendant face à des groupes) que de participer à des opérations de baisse de prix.

En pratiquant un prix normal de 9,99 €, j’ai ainsi la possibilité de les proposer à 4,99 € en négociant de beaux focus sur notre production. »

Vauterin reconnaît qu’elle « tâtonne » pour « trouver un modèle éditorial » permettant de maintenir en ligne le délicat équilibre entre « best-sellers et découvertes de talents, forcément déficitaires au plan économique ».

Mais s’il est virtuel, un livre électronique engendre des coûts bien réels pour l’éditeur, ajoute-t-elle. Les revendeurs (Apple, Amazon…) gardent 40% du prix payé par l’acheteur. L’éditeur a choisi de verser des droits d’auteurs plus élevés que pour le papier. Et puis il faut prendre en compte « l’interface vers les plate-formes et la gestion des métadonnées, qui supposent de gros investissements ». Sans oublier la réalisation des fichiers epub eux-mêmes.

Elle se défend en tout cas de toute hostilité envers ces nouveaux supports :

« Le numérique est une part importante de la vie de notre catalogue. Nous avons investi afin de rendre disponible près de 80% de notre catalogue en numérique, y compris des ouvrages qui vendent de très petites quantités. »

Et pour vous, quel est le bon prix pour un livre électronique ? Le débat est ouvert dans les commentaires !

On n’a pas les mêmes valeurs : le mariage gay sur les sites de Fox News et MSNBC

L’actualité de ces dernières heures est particulièrement chargée, entre les attaques de l’Etat islamique, le référendum annoncé en Grèce et la décision de la Cour suprême américaine de légaliser le mariage homosexuel.

Dans ces conditions, pas simple de choisir le sujet de couverture d’un quotidien ou l’ordre des sujets affichés en page d’accueil d’un site d’information.

Mais la « hiérarchie de l’info » chère aux journalistes ne dépend pas qu’à des critères objectifs, loin de là. L’importance qu’une rédaction accorde à un sujet dépend aussi de sa vision du monde, de ses priorités éditoriales et de ses valeurs.

Je me suis amusé à comparer les pages d’accueil des sites des chaînes américaines MSNBC (classée pro-démocrate, « libérale » au sens américain, à gauche donc) et Fox News (pro-républicain, conservateur, à droite donc). Les captures d’écran ont été prises ce samedi matin.

Les pages d'accueil de Fox News et de MSNBC ce samedi matin.

Vu l’importance du sujet, je m’attendais à ce qu’il occupe à peu près la même place sur les deux sites, mais on voit que Fox News préfère mettre en avant d’autres actualités (une forme de déni ?), surtout en haut de page d’accueil. De façon plus attendue, les titres choisis par les deux médias donnent clairement la couleur.

Titres de MSNBC.

  • L’Amérique ouvre un nouveau chapitre de son histoire
  • Les mots de la Cour suprême dans sa décision
  • Des émeutes à la célébration
  • L’avis d’une sénatrice gay sur « cette étape capitale »
  • La plus belle semaine de tous les temps pour le camp progressiste

Titres de Fox News, en haut de page :

  • « Une cour de justice n’est pas le législateur », explique le juge John Roberts, qui avait soutenu Obamacare
  • Vidéo : le mariage pour tous a gagné
  • Edito : la cour s’attaque à la vérité du mariage et dresse la foi contre la loi

Titres de Fox News, beaucoup plus bas dans la page, affichés seulement après avoir « scrollé » suffisamment :

  • Mariage gay : pourquoi la Cour suprême a tort.
  • Pourquoi les décisions de la Cour suprême sur Obamacare, le mariage gay, le droit de propriété… vont aider les Républicains à la présidentielle de 2016
  • Cour suprême : les couples de même sexe peuvent se marier dans les 50 Etats
  • Comment le mariage gay va affecter l’Amérique
  • Les avertissements du juge Roberts après la victoire du mariage gay
  • Ben & Jerry sortent une crème glacée spéciale après la victoire du mariage gay.
  • Les réactions des célébrités à la décision de la Cour suprême
  • Mike Huckabee s’en prend au jugement de la Cour suprême
  • Pour Ric Grenell, la décision sur mariage gay est une grande victoire pour les conservateurs.
  • Quel impact aura la décisions sur la course à la Maison-Blanche
  • Lea DeLaria sur l’impact de la décision de la Cour suprême

Le monde selon Bernard Guetta : la carte de ses 500 chroniques

Ça se passe au moment où la tartine beurrée entre en contact avec le café brûlant. Un ronronnement s’échappe du poste de radio. Une voix familière qui chevrote un peu, un phrasé impeccable qui franchit les « premièrement », les « deuxièmement » et les « mais également » sans jamais trébucher. Le texte, lui, glisse sans cahot d’une conférence genevoise à une réunion du G7, en passant par Bruxelles et ses sommets de la dernière chance.

Une chronique quotidienne depuis 1991

Bernard Guetta, 64 ans, est « un majestueux monument à dômes et à coupoles […] installé dans le paysage matinal », s’amusait Daniel Schneidermann. S’il le taquine, le fondateur d’Arrêt sur images voit aussi en lui l’un des rares journalistes qui « dans chaque événement microscopique cherchent par réflexe les racines profondes, les lointaines conséquences, bref la perspective ».

Le chroniqueur a rejoint France Inter en 1991 après une carrière déjà longue et tient depuis la chronique Géopolitique chaque matin, du lundi au vendredi à 8h19. Ce passage obligé de la matinale est inscrit dans la routine des auditeurs, sur le mode « déjà Guetta, faut y aller, Matteo va être en retard à l’école ».

Lire l’article

Les pays les plus cités dans la chronique Géopolitique de France Inter

0 1–10 10–50 50–100 100–200 +200
           

Cliquez ou tapotez sur un pays pour plus d’infos, double-cliquez ou pincez pour zoomer.

Mais à quoi ressemble la carte du monde que Guetta raconte à près de 4 millions de Français mal réveillés ?

C’est à cette question que j’ai tenté de répondre en analysant 520 chroniques publiées sur le site de France Inter entre août 2012 et mai 2015 – pour ceux que ça intéresse, je reviens sur les outils utilisés dans un autre article de ce site.

Un tiers de plus que le Nouveau Testament

Près de trois saisons de chroniques pour un imposant corpus de plus de 300 000 mots (pour vous donner une idée, ça fait un tiers de plus que le Nouveau Testament), soit 1,6 million de signes ou encore plus de 1 000 feuillets.

La carte en haut de cette page montre le résultat de ses recherches (contactez-moi ou laissez un commentaire si vous avez remarqué une erreur ou une bizarrerie). Je les ai également rassemblées sous forme de classements.

En se promenant sur la planète de Bernard Guetta, on remarque bien sûr la domination des Etats-Unis, cités dans un près d’une chronique sur deux. Mais la Russie, le Proche-Orient et le Moyen-Orient sont aussi bien servis par le chroniqueur. Logique, vu l’actualité de ces trois dernières années en Ukraine, en Syrie et dans le reste du monde arabe.

Les pays émergents sont moins bien lotis : la Chine n’a été citée que 61 fois, et l’Inde (21 ) comme le Brésil (6) ne semblent guère passionner le chroniqueur.

Même relatif désintérêt pour l’Afrique, surtout si on met de côté les pays où la France est intervenue militairement (Libye, Mali, Centrafrique) – le Nigéria, devenu pourtant la première économie d’Afrique n’est cité que sept fois. Ou pour l’ensemble Amérique latine, malgré les remuants dirigeants du Venezuela, de la Bolivie et de l’Equateur.

« Eclairer les événements, les hiérarchiser »

Loin des yeux, loin du cœur de Guetta ? L’Indonésie, malgré ses 250 millions d’habitants, n’est mentionnée qu’une seule fois, l’Australie et l’Afrique du Sud trois fois seulement.

A l’inverse, de petits pays sont l’objet d’une plus grande attention, comme le Liban, présent dans 35 chroniques, l’Arménie (7) et bien sûr le Vatican (7).

Devant ces chiffres parfois étonnants, Bernard Guetta m’explique qu’il n’est « pas un universitaire », qu’il n’a pas vocation « à passer en revue les plus de 200 pays présents l’ONU », mais qu’il entend, en bon journaliste, « éclairer les événements les plus marquants et les hiérarchiser ».

Le chroniqueur explique ne pas chercher, au fil de ses interventions, un équilibre entre les différentes régions du monde. « C’est l’actualité qui commande », résume-t-il, ajoutant :

« Je vous mets en garde contre la tentation de tirer des conclusions basées seulement sur le nombre d’occurrences, pour moi ce n’est pas pertinent. » 

Thaïlande, Maroc, Birmanie : rien

Mais ce qui m’a le plus surpris, ce sont les trous du gruyère : en effet, la liste des pays qui n’ont jamais cités en plus de 500 chroniques comprend quelques poids lourds.

C’est le cas de la Thaïlande, qui a pourtant connu, sur la période étudiée, une crise politique majeure débouchant sur une reprise en main du pays par l’armée. Mais aussi de la Birmanie, dont le régime donne des signes d’ouverture depuis la libération d’Aung San Suu Kyi en 2010.

Plus frappant encore, le cas du Maroc, où Guetta a pourtant passé une partie de sa jeunesse – l’Algérie voisine est elle mentionnée 22 fois. Ces absences ne perturbent cependant pas l’intéressé :

« Tout dépend de la période que vous étudiez. Il n’était pas illogique que je n’aie pas parlé du Maroc ces derniers temps, il n’y avait pas d’actualité importante dans ce pays.

La brouille avec la France [après que le chef du contre-espionnage marocain Abdellatif Hammouchi a été convoqué par un juge français lors d’un voyage à Paris, ndlr] n’a pas duré très longtemps.

J’en aurais peut-être parlé si personne ne l’avait fait, mais j’ai considéré que ça ne faisait pas le poids, à ce moment-là, face à d’autres événements. »

C’est la limite de mon petit travail : comme tous les journalistes, Guetta parle d’abord des pays dont on parle, ceux qui sont « dans l’actualité », aussi mouvante soit la définition qu’on donne à ce mot. Mais je reste convaincu que sur une si longue période et un si grand nombre de textes, mon exploration du « monde de Bernard Guetta » a malgré tout du sens.

Plus un pays est riche, plus il est cité

Si on met de côté l’actu, quel critère peut expliquer qu’un pays s’impose ou non sur cette drôle de mappemonde ? En croisant ces relevés avec les données de la Banque mondiale, j’ai cherché des corrélations. J’ai fait chou blanc avec la superficie, la population, le PIB par habitant ou le nombre de décès dans des conflits armés.

En revanche, plus un pays est globalement riche, et plus il a de chances d’être cité dans les chroniques de Guetta – pour les matheux, le coefficient de corrélation est de 0,64.  Ce n’est pas illogique : une économie importante va souvent de pair avec des dépenses militaires significatives et une diplomatie plus active.

La liste des personnalités les plus citées réserve elle peu de surprises, même si on notera que Jacques Delors et Charles de Gaulle font de fréquentes apparitions – le premier est plus souvent cité qu’Hugo Chavez.

Enfin, je me suis aussi intéressé au contexte dans lequel ces pays et ces personnalités étaient citées, grâce à un logiciel de « lexicométrie ». J’ai cherché par exemple les adjectifs les qualifiant, notamment ceux qui peuvent dénoter un jugement de valeur voire un parti-pris (par exemple, « populiste » pour Chavez ou « intransigeant » pour Poutine).

L’Europe et le « divorce » des Européens

On peut voir ainsi que Guetta associe très souvent le mot « Europe » (et ses dérivés) au mot « divorce », dans des phrases comme : « Le divorce croissant entre les Européens et l’Europe menace jusqu’à l’idée même d’unité européenne. » Européiste convaincu, il a fait activement (outrageusement pensent certains, comme Acrimed) campagne pour le oui au référendum sur le traité constitutionnel de 2005.

Mais ces quelques coup de sonde n’ont pas donné grand chose : les « cooccurrences » (soit les mots qu’on relève souvent au voisinage d’un autre dans le texte) détectées m’ont semblé assez neutres – en y passant plus de temps, un spécialiste ferait peut-être davantage de trouvailles.

La preuve d’une prudence très diplomatique dans le choix des formulations ? Bernard Guetta explique en tout cas « sa très grande méfiance à l’égard de mots qui ne veulent plus rien dire, comme islamiste » : « Je préfère utiliser un langage plus précis, un mot qui décrit ce qui se passe. »

Mis à jour le 8 mai à 8h20. Erreur d’unité dans le classement et la carte corrigée, merci à @florenchev de l’avoir signalée.

Mis à jour le 11 mai à 8h30. Erreur dans le nombre de citations d’Erdogan, merci à Sibel Fuchs de l’avoir signalée sur Facebook.

Illustration utilisée sur la page Facebook Dans mon labo d’après photo David Monniaux (CC BY-SA)

Airbnb : la carte des prix de location à Paris (et ce qu’on y apprend)

Ça fait un petit moment que j’avais envie de me coltiner aux données du service de location de logements entre particuliers Airbnb, après avoir vu la série de cartes réalisées par Tom Slee dans différentes villes du monde.

Et voilà que le site du Temps publie une enquête sur les loueurs d’Airbnb à Genève, en montrant qu’une part importante des offres publiées proposent des appartements qui ne sont pas ou plus habités à l’année.

Lire l’article

Les prix des locations Airbnb à Paris

Plus la couleur d’un appartement est foncée, plus son tarif est élevé. Pour voir des exemples de prix pratiqués, zoomez en double-cliquant, approchez la souris sur un des cercles ou tapez-le.

Autrefois modèle de « l’économie du partage », Airbnb est ainsi accusé de « siphonner » le marché locatif, les propriétaires y multipliant les locations courte durée plutôt que de choisir un occupant pérenne.

Un scraper pour récupérer les données

Pour mener leur enquête, les journalistes ont récupéré les données au moyen d’un scraper, une sorte de robot qui va visiter une à une les pages du site pour y récupérer des informations repérées au préalable. dans le code source.

Avec quelques manipulations simples sur les données ainsi récupérées, ils ont pu repérer de gros loueurs – telle Jasmina, qui gère 120 biens sur Airbnb – puis les faire témoigner.

Jean Abbiateci, co-auteur de cette enquête avec Julie Conti, raconte cette démarche pas à pas dans le blog Data Le Temps et a eu la bonne idée de mettre à disposition le script mis au point pour Outwit Hub, le logiciel qui a servi au scraping, que j’utilise aussi.

J’ai ainsi pu récupérer un échantillon de 2 000 offres parisiennes, proposant uniquement la location d’un logement entier (et pas d’une chambre privée ou une chambre partagée). Ça m’a servi à dresser la carte publiée en haut de cet article.

J’ai veillé à répartir les annonces choisies pour couvrir un maximum de terrain et obtenir une carte harmonieuse – par exemple, je n’ai gardé que 27 points dans le IIIe arrondissement, alors que c’est celui où les offres sont les plus nombreuses (3,2 par hectare).

Si on en tient pas compte de ce critère, la répartition des offres dans la capitale est en effet très inégale, comme le montre cette carte de chaleur (heat map).  

Carte de chaleur des annonces Airbnb à Paris. Plus la couleur d'une rue est vive, plus il y a d'annonces dans le quartier.
Carte de chaleur des annonces Airbnb à Paris. Plus la couleur d’une rue est vive, plus il y a d’annonces dans le quartier.

« Au final, ta carte va être la même que celle du marché de l’immobilier à Paris », m’a prévenu un confrère qui travaille dans un newsmagazine bien connu pour ses marronniers sur le sujet.

Sa remarque est vraie, mais pas entièrement : un arrondissement peut être plus cher sur Airbnb (c’est le cas du VIIIe et du VIe) que dans une agence traditionnelle, ou au contraire moins cher (le XIXe et le XVIIInotamment).

Et les gros poissons, alors ? Je ne donnerai pas leur profil, histoire de ne pas faciliter le travail du fisc ou du service dédié de la mairie de Paris, mais j’ai repéré des utilisateurs qui ont plusieurs dizaines d’annonces sur le site – des loueurs qui ne ressemblent donc pas beaucoup à ceux en photo sur la page d’accueil, mais plus à des professionnels ayant trouvé un bon filon.

Le phénomène semble assez circonscrit cependant : en cherchant parmi plus de 2 500 annonces, je n’ai trouvé que  9 inscrits avec plus de cinq annonces.

Mais il est possible que les professionnels d’Airbnb se créent plusieurs profils pour gérer leur pool d’annonces et dans ce cas, ils ne peuvent être détectés par cette méthode.

Bonus pour ceux qui ont lu jusqu’ici. Afin d’avoir une idée des expressions les plus utilisés pour convaincre les touristes, voilà un nuage de mots créés avec les titres des annonces de l’échantillon.

worldle
Les mots les plus utilisés dans les titres des annonces d’Airbnb à Paris.