Перейти к основному содержимому

BLUP -- Обзор

BeePass использует модель BLUP (Best Linear Unbiased Prediction -- наилучший линейный несмещённый прогноз) в сочетании с гапло-диплоидной матрицей родства по Brascamp & Bijma (2014) для оценки племенной ценности ваших маток. Конвейер также включает коррекцию на окружающую среду с помощью машинного обучения (XGBoost) и пороговую модель для ординальных признаков.

Конвейер ONE SHOT

Генетическая оценка выполняется за одну автоматизированную последовательность, называемую ONE SHOT. Каждый этап передаёт результаты на следующий:

  1. Снимок -- Полное резервное копирование базы данных перед вычислением (pg_dump + SHA256-отпечатки). Если что-то пойдёт не так, всегда можно откатиться.
  2. Среда -- Геокодирование мест оценки (почтовый индекс + страна), получение данных о высоте над уровнем моря и сезонной погоде (осадки, средняя температура, жаркие дни >30 °C) за период с 15 марта по 30 сентября.
  3. Обучение XGBoost -- Обучение модели коррекции на среду для медосбора, используя высоту, осадки, температуру и количество жарких дней как признаки.
  4. Применение XGBoost -- Коррекция показателей мёда: y_corr = log1p(honey_kg) - predicted_env. Скорректированный медосбор отражает генетический потенциал независимо от местоположения.
  5. BLUPF90+ -- Оценка племенной ценности по мёду (непрерывный признак) с одновременной REML-оценкой компонентов дисперсии. Смешанная модель с эффектами матки и рабочих пчёл.
  6. THRGIBBS -- Оценка племенной ценности для ординальных признаков (миролюбие, весенняя сила, зимовка, неройливость, стабильность сотов) и гигиенических признаков (HYG 6ч, HYG 24ч) с помощью порогового сэмплера Гиббса (пороговая пробит-модель).
  7. Нормализация -- Масштабирование всех EBV в формат, совместимый с BeeBreed: среднее = 100, стандартное отклонение = 10.
  8. Сохранение -- Атомарная запись в базу данных. Результаты становятся видимыми только если весь конвейер завершился успешно.
Автоматический конвейер

Конвейер запускается администратором. Результаты отображаются на странице каждой матки, во вкладке Оценки.

Зачем корректировать на среду?

Медосбор сильно варьируется в зависимости от местоположения: матка на высоте 1200 м не имеет тех же цветочных ресурсов, что и матка на равнине. Без коррекции мы бы сравнивали среды, а не генетику.

XGBoost моделирует влияние высоты, осадков, средней температуры и количества жарких дней на медосбор. Вычитая этот средовой прогноз, мы выделяем генетическую составляющую продуктивности.

Особенности медоносных пчёл

Генетическая оценка у медоносных пчёл принципиально отличается от традиционных видов сельскохозяйственных животных:

  • Гапло-диплоидия -- Самцы (трутни) гаплоидны: они несут только один набор хромосом. Стандартные формулы родства неприменимы.
  • Полиандрия -- Матка спаривается со множеством трутней (10-20). Отцы моделируются как «группа отцов» (sire group), а не индивидуально.
  • Двойной генетический эффект -- Продуктивность семьи зависит как от генов матки, так и от генов рабочих пчёл (дочерей матки). Модель BLUP разделяет эти два эффекта.

Литература: Brascamp, E. W. & Bijma, P. (2014). Methods to compute optimum contribution to simultaneously infer the genetic trend and the genetic merit of animals from a crossbred population. Genetics Selection Evolution, 46:56.


Смотрите также: