9¶
Задание для получения сертификата с отличием
Помимо самого по себе соотношения $\frac{dN}{dS}$, часто можно встретить значение $Z=\frac{dN - dS}{\sqrt{Var(dN-dS)}}$, где Var(dN-dS)Var(dN−dS) оценивается из данных с использованием выборок по принципу Jackknife. Интерпретируется это значение аналогично dN/dS, но нейтральная эволюция соответствует Z = 0, а не dN/dS = 1.
Допустим, Вы проанализировали большое количество последовательностей одного белок-кодирующего гена у представителей некоторого вида. Результат множественного выравнивания последовательностей представлен в файле sequences_to_dNdS.fa.
Используя графический интерфейс MEGAX (или другой инструмент по вашему выбору) рассчитайте значение Z(dN−dS) для этого гена. Находится ли ген под действием отбора? Если да, то в каком направлении действует отбор?
Приведите в ответе значение статистики Z(dN-dS), округленное до сотых, и ответ на вопрос о давлении отбора (один вариант из трех: "нет", "да,положительный" или "да,отрицательный"). Используйте при расчете большое количество повторений bootstrap (1,000 и более). Пользуйтесь рассмотренным нами в видео методом - "Nei-Gojobori (Jukes-Cantor)"
import pandas as pd
import numpy as np
import dnds as dn
Решение:
- Используем и запускаем MegaX.
- Открываем файл - Data-> open File/Session -> Align Data
- Сохраняем файл - с расширением .mas
- Открываем его
- Distanse -> Compute Overall Mean Distance
- Выбираем: - Bootstrap Replications: 1000 - Substitutions Types: Syn-Nonsynonymous - Model/Method: Nei-Gojobor (Jukes-Cantor) - Substitutions to include: Deffirence (n-s) - Gaps/Missing Data Treatment: Pairwise deletion
- ok - ждем результат
- Ниже расчёт по формуле и результат
dnds = -0.00831
se = 0.00216
z=dnds/se
print(z)
-3.847222222222222