BLUP -- Обзор
BeePass использует модель BLUP (Best Linear Unbiased Prediction -- наилучший линейный несмещённый прогноз) в сочетании с гапло-диплоидной матрицей родства по Brascamp & Bijma (2014) для оценки племенной ценности ваших маток. Конвейер также включает коррекцию на окружающую среду с помощью машинного обучения (XGBoost) и пороговую модель для ординальных признаков.
Конвейер ONE SHOT
Генетическая оценка выполняется за одну автоматизированную последовательность, называемую ONE SHOT. Каждый этап передаёт результаты на следующий:
- Снимок -- Полное резервное копирование базы данных перед вычислением (pg_dump + SHA256-отпечатки). Если что-то пойдёт не так, всегда можно откатиться.
- Среда -- Геокодирование мест оценки (почтовый индекс + страна), получение данных о высоте над уровнем моря и сезонной погоде (осадки, средняя температура, жаркие дни >30 °C) за период с 15 марта по 30 сентября.
- Обучение XGBoost -- Обучение модели коррекции на среду для медосбора, используя высоту, осадки, температуру и количество жарких дней как признаки.
- Применение XGBoost -- Коррекция показателей мёда:
y_corr = log1p(honey_kg) - predicted_env. Скорректированный медосбор отражает генетический потенциал независимо от местоположения. - BLUPF90+ -- Оценка племенной ценности по мёду (непрерывный признак) с одновременной REML-оценкой компонентов дисперсии. Смешанная модель с эффектами матки и рабочих пчёл.
- THRGIBBS -- Оценка племенной ценности для ординальных признаков (миролюбие, весенняя сила, зимовка, неройливость, стабильность сотов) и гигиенических признаков (HYG 6ч, HYG 24ч) с помощью порогового сэмплера Гиббса (пороговая пробит-модель).
- Нормализация -- Масштабирование всех EBV в формат, совместимый с BeeBreed: среднее = 100, стандартное отклонение = 10.
- Сохранение -- Атомарная запись в базу данных. Результаты становятся видимыми только если весь конвейер завершился успешно.
Конвейер запускается администратором. Результаты отображаются на странице каждой матки, во вкладке Оценки.
Зачем корректировать на среду?
Медосбор сильно варьируется в зависимости от местоположения: матка на высоте 1200 м не имеет тех же цветочных ресурсов, что и матка на равнине. Без коррекции мы бы сравнивали среды, а не генетику.
XGBoost моделирует влияние высоты, осадков, средней температуры и количества жарких дней на медосбор. Вычитая этот средовой прогноз, мы выделяем генетическую составляющую продуктивности.
Особенности медоносных пчёл
Генетическая оценка у медоносных пчёл принципиально отличается от традиционных видов сельскохозяйственных животных:
- Гапло-диплоидия -- Самцы (трутни) гаплоидны: они несут только один набор хромосом. Стандартные формулы родства неприменимы.
- Полиандрия -- Матка спаривается со множеством трутней (10-20). Отцы моделируются как «группа отцов» (sire group), а не индивидуально.
- Двойной генетический эффект -- Продуктивность семьи зависит как от генов матки, так и от генов рабочих пчёл (дочерей матки). Модель BLUP разделяет эти два эффекта.
Литература: Brascamp, E. W. & Bijma, P. (2014). Methods to compute optimum contribution to simultaneously infer the genetic trend and the genetic merit of animals from a crossbred population. Genetics Selection Evolution, 46:56.
Смотрите также:
- Интерпретация EBV -- Чтение результатов
- Достоверность (r²) -- Понимание точности оценки
- Инбридинг -- Матрица родства и генетическое разнообразие