Aller au contenu principal

BLUP — Vue d'ensemble

BeePass utilise le modèle BLUP (Best Linear Unbiased Prediction) couplé à la matrice de parenté haplo-diploïde de Brascamp & Bijma (2014) pour estimer les valeurs génétiques de vos reines. Le pipeline intègre également une correction environnementale par machine learning (XGBoost) et un modèle à seuil (threshold) pour les traits ordinaux.

Le pipeline ONE SHOT

L'évaluation génétique est réalisée en une seule séquence automatisée, appelée ONE SHOT. Chaque étape alimente la suivante :

  1. Snapshot — Sauvegarde complète de la base de données avant calcul (pg_dump + empreintes SHA256). En cas de problème, on peut toujours revenir en arrière.
  2. Environnement — Géocodage des lieux d'évaluation (code postal + pays), récupération de l'altitude et des données météo saisonnières (pluviométrie, température moyenne, jours chauds >30 °C) sur la fenêtre 15 mars - 30 septembre.
  3. XGBoost Train — Entraînement d'un modèle de correction environnementale sur la production de miel, à partir des variables altitude, pluie, température et jours chauds.
  4. XGBoost Apply — Correction des mesures de miel : y_corr = log1p(miel_kg) - prediction_env. Le rendement corrigé reflète le potentiel génétique, indépendamment du lieu.
  5. BLUPF90+ — Estimation des valeurs génétiques pour le miel (trait continu) avec estimation simultanée des composantes de variance (REML). Modèle mixte reine + ouvrières.
  6. THRGIBBS — Estimation des valeurs génétiques pour les traits ordinaux (douceur, vigueur, hivernage, non-essaimage, tenue de cadre) et les traits hygiéniques (HYG 6h, HYG 24h) via un échantillonneur de Gibbs à seuil (threshold probit).
  7. Normalisation — Mise à l'échelle de tous les EBV au format BeeBreed : moyenne = 100, écart-type = 10.
  8. Stockage — Écriture atomique en base de données. Les résultats ne sont visibles que si toute la chaîne a réussi.
Pipeline automatique

Le pipeline est déclenché par un administrateur. Les résultats apparaissent sur la page de détail de chaque reine, onglet Évaluations.

Le pipeline en détail

Voici les 8 étapes du pipeline ONE SHOT, expliquées simplement :

1. Snapshot (sauvegarde de sécurité) Avant tout calcul, BeePass réalise une sauvegarde complète de la base de données avec des empreintes SHA-256. En cas de problème, les données sont restaurables.

2. Environnement (enrichissement géographique) Chaque lieu d'évaluation est géocodé (code postal, pays). BeePass récupère ensuite l'altitude et les données météo saisonnières : pluviométrie, température moyenne et nombre de jours chauds (>30 C) sur la période 15 mars -- 30 septembre.

3. XGBoost Training (modèle de correction) Un modèle d'apprentissage automatique est entraîné pour comprendre comment l'environnement influence la production de miel. Il apprend la relation entre altitude, pluie, température, jours chauds et rendement.

4. XGBoost Apply (suppression de l'effet environnemental) Le modèle est appliqué pour retirer l'influence de l'environnement sur chaque mesure de miel. Le rendement corrigé reflète le potentiel génétique pur de la reine, quel que soit son emplacement.

5. BLUP Analysis (estimation génétique) Le logiciel BLUPF90+ calcule les valeurs génétiques pour le miel (trait continu). Le modèle mixte sépare l'effet de la reine et l'effet des ouvrières, en estimant simultanément les composantes de variance (REML).

6. Traits comportementaux (analyse a seuil) Les traits notés de 1 a 4 (douceur, vigueur, hivernage, non-essaimage, tenue de cadre) sont traités par un modèle a seuil (threshold probit) via un échantillonneur de Gibbs, adapté aux données ordinales.

7. Hygiène (analyse binomiale) Les tests hygiéniques (HYG 6h et HYG 24h) sont analysés avec une pondération par la qualité des observations. Les reines avec des évaluations plus fiables pèsent davantage dans le calcul.

8. Normalisation (échelle BeeBreed) Tous les EBV sont convertis sur une échelle standardisée : 100 = moyenne de la population, ±10 = un écart-type. Un EBV de 110 signifie que la reine est un écart-type au-dessus de la moyenne.

Correction environnementale en bref

XGBoost isole le mérite génétique des effets environnementaux. Une reine en montagne a 1 200 m et une reine en plaine ne disposent pas des mêmes ressources florales. Sans correction, on comparerait des environnements, pas des génétiques. XGBoost modélise l'impact de l'altitude, de la pluviométrie et de la température pour ne conserver que la part génétique du rendement.

Pourquoi corriger l'environnement ?

La production de miel varie considérablement selon le lieu : une reine en montagne à 1 200 m n'a pas les mêmes ressources florales qu'une reine en plaine. Sans correction, on comparerait des environnements, pas des génétiques.

XGBoost modélise l'influence de l'altitude, de la pluviométrie, de la température moyenne et du nombre de jours chauds sur le rendement en miel. En soustrayant cette prédiction environnementale, on isole la part génétique du rendement.

Spécificités abeilles

L'évaluation génétique chez l'abeille diffère fondamentalement des espèces d'élevage classiques :

  • Haplo-diploïdie — Les mâles (faux-bourdons) sont haploïdes : ils n'ont qu'un jeu de chromosomes. Les formules standard de parenté ne s'appliquent pas.
  • Polyandrie — La reine s'accouple avec de nombreux faux-bourdons (10-20). On modélise les pères comme un "groupe de mâles" (sire group).
  • Double effet génétique — Les performances d'une colonie dépendent à la fois des gènes de la reine et des gènes des ouvrières (filles de la reine). Le modèle BLUP sépare ces deux effets.

Référence : Brascamp, E. W. & Bijma, P. (2014). Methods to compute optimum contribution to simultaneously infer the genetic trend and the genetic merit of animals from a crossbred population. Genetics Selection Evolution, 46:56.


Voir aussi :