BLUP — Visao geral
O BeePass utiliza o modelo BLUP (Best Linear Unbiased Prediction) associado a matriz de parentesco haplo-diploide de Brascamp & Bijma (2014) para estimar os valores geneticos das suas rainhas. A pipeline integra tambem a correcao ambiental por machine learning (XGBoost) e um modelo de limiar para caracteristicas ordinais.
A Pipeline ONE SHOT
A avaliacao genetica e realizada numa unica sequencia automatizada chamada ONE SHOT. Cada etapa alimenta a seguinte:
- Snapshot — Copia de seguranca completa da base de dados antes do calculo (pg_dump + impressoes digitais SHA256). Se algo correr mal, podemos sempre reverter.
- Ambiente — Geocodificar localizacoes de avaliacao (codigo postal + pais), obter altitude e dados meteorologicos sazonais (precipitacao, temperatura media, dias quentes >30 C) na janela de 15 de marco a 30 de setembro.
- XGBoost Train — Treinar um modelo de correcao ambiental sobre a producao de mel, com altitude, precipitacao, temperatura e numero de dias quentes como caracteristicas.
- XGBoost Apply — Corrigir medicoes de mel:
y_corr = log1p(honey_kg) - predicted_env. A producao corrigida reflete o potencial genetico, independentemente da localizacao. - BLUPF90+ — Estimar valores geneticos para o mel (caracteristica continua) com estimacao simultanea de componentes de variancia por REML. Modelo misto com efeitos de rainha e operaria.
- THRGIBBS — Estimar valores geneticos para caracteristicas ordinais (mansidao, vitalidade, invernagem, nao-enxameacao, fixacao nos quadros) e caracteristicas de higiene (HYG 6h, HYG 24h) com um amostrador de Gibbs de limiar (modelo probit de limiar).
- Normalizacao — Escalar todos os EBV para formato compativel com BeeBreed: media = 100, desvio padrao = 10.
- Armazenamento — Escrita atomica na base de dados. Os resultados so ficam visiveis se toda a pipeline for bem-sucedida.
A pipeline e ativada por um administrador. Os resultados aparecem na pagina de detalhe de cada rainha, sob o separador Avaliacoes.
Porque corrigir o ambiente?
A producao de mel varia enormemente por localizacao: uma rainha a 1.200 m de altitude nao tem a mesma riqueza floral que uma na planicie. Sem correcao, estariamos a comparar ambientes, nao genetica.
O XGBoost modela a influencia da altitude, precipitacao, temperatura media e numero de dias quentes sobre a producao de mel. Ao subtrair esta previsao ambiental, isolamos a componente genetica da producao.
Desafios especificos das abelhas
A avaliacao genetica em abelhas difere fundamentalmente das especies pecuarias convencionais:
- Haplo-diploidia — Os machos (zangoes) sao haploides: carregam apenas um conjunto de cromossomas. As formulas de parentesco padrao nao sao aplicaveis.
- Poliandria — A rainha acasala com muitos zangoes (10-20). Os pais sao modelados como um "grupo de zangoes" em vez de individualmente.
- Duplo efeito genetico — O desempenho da colonia depende tanto dos genes da rainha como dos genes das operarias (filhas da rainha). O modelo BLUP separa estes dois efeitos.
Referencia: Brascamp, E. W. & Bijma, P. (2014). Methods to compute optimum contribution to simultaneously infer the genetic trend and the genetic merit of animals from a crossbred population. Genetics Selection Evolution, 46:56.
Ver tambem:
- Ler os seus EBV — Interpretar os resultados
- Fiabilidade (r2) — Compreender a precisao da estimativa
- Consanguinidade — Matriz de parentesco e diversidade genetica