← Projets

Start 1 to finish 1 explained

2025-12-18 · University of Kentucky
Data Visualization R Python Formula 1 Ergast API

Contexte

Ce travail de visualisation de données a été réalisé dans le cadre de mes études à l’University of Kentucky. L’objectif était d’explorer dans le temps et par circuit dans quelle mesure la position sur la grille de départ structure réellement le classement à l’arrivée en Formule 1 — au-delà du cliché « pole = victoire ».

Les données historiques proviennent de l’Ergast Developer API (résultats, grilles, circuits, saisons), agrégées et nettoyées pour produire des indicateurs comparables sur plusieurs décennies.

Analyse 1 — Probabilité de victoire par position de départ

Un graphique en barres présente la probabilité de victoire selon la position de départ (positions 1 à 10). Les barres pleines représentent le taux observé ; le haut est atténué pour suggérer l’intervalle de confiance à 95 %. La pole (P1) domine nettement, avec une probabilité de l’ordre de 42 %, puis la courbe décroît rapidement vers les positions suivantes.

Analyse 2 — Corrélations par circuit

Une visualisation en points classe les circuits selon une corrélation de Spearman entre position sur la grille et position à l’arrivée. On y lit des écarts marqués : certains tracés (ex. Monaco, Hungaroring) montrent une dépendance plus forte à la qualification, d’autres des corrélations plus modérées selon les opportunités de dépassement et la dégradation des pneus.

Analyse 3 — Matrice grille vs arrivée

Une heatmap 20×20 croise position de départ et position d’arrivée (top 20) sur l’historique : la diagonale — cases encadrées pour « position maintenue » — concentre une part importante de la masse, avec un pic marqué sur le couple (1, 1). Les cases hors diagonale traduisent gains ou pertes de places au fil de la course.

Analyse 4 — Tendance temporelle

Une série temporelle annuelle trace l’évolution de la corrélation grille–arrivée (1950–2023), avec une courbe lissée. Une zone seuil autour de 0,5 et une étiquette d’« ère pole position » mettent en évidence un renforcement durable de l’importance du classement en qualification depuis le milieu des années 2000, cohérent avec l’évolution du règlement, de l’aéro et des stratégies de course.

Livrable

Livrable académique : rapport / notebook reproductible (R et Python) avec figures exportées, chaîne de données documentée depuis l’Ergast API, et cette planche de synthèse « Start 1 to finish 1 explained » pour communication des résultats.