BLUP — Panoramica
BeePass utilizza il modello BLUP (Best Linear Unbiased Prediction) accoppiato alla matrice di parentela aplo-diploide di Brascamp & Bijma (2014) per stimare i valori genetici delle vostre regine. La pipeline integra inoltre una correzione ambientale tramite machine learning (XGBoost) e un modello a soglia (threshold) per i tratti ordinali.
La pipeline ONE SHOT
La valutazione genetica viene eseguita in un'unica sequenza automatizzata, chiamata ONE SHOT. Ogni fase alimenta la successiva:
- Snapshot — Backup completo del database prima del calcolo (pg_dump + impronte SHA256). In caso di problemi, è sempre possibile tornare indietro.
- Ambiente — Geocodifica dei luoghi di valutazione (codice postale + paese), recupero dell'altitudine e dei dati meteo stagionali (precipitazioni, temperatura media, giorni caldi >30 °C) nella finestra 15 marzo - 30 settembre.
- XGBoost Train — Addestramento di un modello di correzione ambientale sulla produzione di miele, a partire dalle variabili altitudine, pioggia, temperatura e giorni caldi.
- XGBoost Apply — Correzione delle misure di miele:
y_corr = log1p(miel_kg) - prediction_env. La resa corretta riflette il potenziale genetico, indipendentemente dal luogo. - BLUPF90+ — Stima dei valori genetici per il miele (tratto continuo) con stima simultanea delle componenti di varianza (REML). Modello misto regina + operaie.
- THRGIBBS — Stima dei valori genetici per i tratti ordinali (dolcezza, vigore, svernamento, non-sciamatura, tenuta del favo) e i tratti igienici (HYG 6h, HYG 24h) tramite un campionatore di Gibbs a soglia (threshold probit).
- Normalizzazione — Riscalatura di tutti gli EBV nel formato BeeBreed: media = 100, deviazione standard = 10.
- Archiviazione — Scrittura atomica nel database. I risultati sono visibili solo se l'intera catena ha avuto successo.
La pipeline viene avviata da un amministratore. I risultati appaiono nella pagina di dettaglio di ogni regina, scheda Valutazioni.
La pipeline nel dettaglio
Ecco le 8 fasi della pipeline ONE SHOT, spiegate in modo semplice:
1. Snapshot (backup di sicurezza) Prima di ogni calcolo, BeePass esegue un backup completo del database con impronte SHA-256. In caso di problemi, i dati sono ripristinabili.
2. Ambiente (arricchimento geografico) Ogni luogo di valutazione viene geocodificato (codice postale, paese). BeePass recupera poi l'altitudine e i dati meteo stagionali: precipitazioni, temperatura media e numero di giorni caldi (>30 C) nel periodo 15 marzo -- 30 settembre.
3. XGBoost Training (modello di correzione) Un modello di apprendimento automatico viene addestrato per comprendere come l'ambiente influenza la produzione di miele. Apprende la relazione tra altitudine, pioggia, temperatura, giorni caldi e resa.
4. XGBoost Apply (rimozione dell'effetto ambientale) Il modello viene applicato per rimuovere l'influenza dell'ambiente da ogni misura di miele. La resa corretta riflette il potenziale genetico puro della regina, indipendentemente dalla sua posizione.
5. BLUP Analysis (stima genetica) Il software BLUPF90+ calcola i valori genetici per il miele (tratto continuo). Il modello misto separa l'effetto della regina e l'effetto delle operaie, stimando contemporaneamente le componenti di varianza (REML).
6. Tratti comportamentali (analisi a soglia) I tratti valutati da 1 a 4 (dolcezza, vigore, svernamento, non-sciamatura, tenuta del favo) vengono elaborati da un modello a soglia (threshold probit) tramite un campionatore di Gibbs, adattato ai dati ordinali.
7. Igiene (analisi binomiale) I test igienici (HYG 6h e HYG 24h) vengono analizzati con una ponderazione basata sulla qualità delle osservazioni. Le regine con valutazioni più affidabili pesano maggiormente nel calcolo.
8. Normalizzazione (scala BeeBreed) Tutti gli EBV vengono convertiti su una scala standardizzata: 100 = media della popolazione, ±10 = una deviazione standard. Un EBV di 110 significa che la regina è una deviazione standard sopra la media.
XGBoost isola il merito genetico dagli effetti ambientali. Una regina in montagna a 1.200 m e una regina in pianura non dispongono delle stesse risorse floreali. Senza correzione, si confronterebbero gli ambienti, non la genetica. XGBoost modella l'impatto dell'altitudine, delle precipitazioni e della temperatura per conservare solo la componente genetica della resa.
Perché correggere l'ambiente?
La produzione di miele varia considerevolmente in base al luogo: una regina in montagna a 1.200 m non ha le stesse risorse floreali di una regina in pianura. Senza correzione, si confronterebbero gli ambienti, non la genetica.
XGBoost modella l'influenza dell'altitudine, delle precipitazioni, della temperatura media e del numero di giorni caldi sulla resa in miele. Sottraendo questa previsione ambientale, si isola la componente genetica della resa.
Specificità delle api
La valutazione genetica nell'ape differisce fondamentalmente dalle specie di allevamento classiche:
- Aplo-diploidia — I maschi (fuchi) sono aploidi: possiedono un solo set di cromosomi. Le formule standard di parentela non si applicano.
- Poliandria — La regina si accoppia con numerosi fuchi (10-20). I padri vengono modellati come un "gruppo di maschi" (sire group).
- Doppio effetto genetico — Le prestazioni di una colonia dipendono sia dai geni della regina sia dai geni delle operaie (figlie della regina). Il modello BLUP separa questi due effetti.
Riferimento: Brascamp, E. W. & Bijma, P. (2014). Methods to compute optimum contribution to simultaneously infer the genetic trend and the genetic merit of animals from a crossbred population. Genetics Selection Evolution, 46:56.
Vedi anche:
- Leggere i vostri EBV — Interpretare i risultati
- Affidabilità (r²) — Comprendere la precisione delle stime
- Consanguineità — Matrice di parentela e diversità genetica