Ir para o conteudo principal

BLUP — Visao geral

O BeePass utiliza o modelo BLUP (Best Linear Unbiased Prediction) associado a matriz de parentesco haplo-diploide de Brascamp & Bijma (2014) para estimar os valores geneticos das suas rainhas. A pipeline integra tambem a correcao ambiental por machine learning (XGBoost) e um modelo de limiar para caracteristicas ordinais.

A Pipeline ONE SHOT

A avaliacao genetica e realizada numa unica sequencia automatizada chamada ONE SHOT. Cada etapa alimenta a seguinte:

  1. Snapshot — Copia de seguranca completa da base de dados antes do calculo (pg_dump + impressoes digitais SHA256). Se algo correr mal, podemos sempre reverter.
  2. Ambiente — Geocodificar localizacoes de avaliacao (codigo postal + pais), obter altitude e dados meteorologicos sazonais (precipitacao, temperatura media, dias quentes >30 C) na janela de 15 de marco a 30 de setembro.
  3. XGBoost Train — Treinar um modelo de correcao ambiental sobre a producao de mel, com altitude, precipitacao, temperatura e numero de dias quentes como caracteristicas.
  4. XGBoost Apply — Corrigir medicoes de mel: y_corr = log1p(honey_kg) - predicted_env. A producao corrigida reflete o potencial genetico, independentemente da localizacao.
  5. BLUPF90+ — Estimar valores geneticos para o mel (caracteristica continua) com estimacao simultanea de componentes de variancia por REML. Modelo misto com efeitos de rainha e operaria.
  6. THRGIBBS — Estimar valores geneticos para caracteristicas ordinais (mansidao, vitalidade, invernagem, nao-enxameacao, fixacao nos quadros) e caracteristicas de higiene (HYG 6h, HYG 24h) com um amostrador de Gibbs de limiar (modelo probit de limiar).
  7. Normalizacao — Escalar todos os EBV para formato compativel com BeeBreed: media = 100, desvio padrao = 10.
  8. Armazenamento — Escrita atomica na base de dados. Os resultados so ficam visiveis se toda a pipeline for bem-sucedida.
Pipeline automatica

A pipeline e ativada por um administrador. Os resultados aparecem na pagina de detalhe de cada rainha, sob o separador Avaliacoes.

Porque corrigir o ambiente?

A producao de mel varia enormemente por localizacao: uma rainha a 1.200 m de altitude nao tem a mesma riqueza floral que uma na planicie. Sem correcao, estariamos a comparar ambientes, nao genetica.

O XGBoost modela a influencia da altitude, precipitacao, temperatura media e numero de dias quentes sobre a producao de mel. Ao subtrair esta previsao ambiental, isolamos a componente genetica da producao.

Desafios especificos das abelhas

A avaliacao genetica em abelhas difere fundamentalmente das especies pecuarias convencionais:

  • Haplo-diploidia — Os machos (zangoes) sao haploides: carregam apenas um conjunto de cromossomas. As formulas de parentesco padrao nao sao aplicaveis.
  • Poliandria — A rainha acasala com muitos zangoes (10-20). Os pais sao modelados como um "grupo de zangoes" em vez de individualmente.
  • Duplo efeito genetico — O desempenho da colonia depende tanto dos genes da rainha como dos genes das operarias (filhas da rainha). O modelo BLUP separa estes dois efeitos.

Referencia: Brascamp, E. W. & Bijma, P. (2014). Methods to compute optimum contribution to simultaneously infer the genetic trend and the genetic merit of animals from a crossbred population. Genetics Selection Evolution, 46:56.


Ver tambem: