9¶

Задание для получения сертификата с отличием

Помимо самого по себе соотношения $\frac{dN}{dS}$, часто можно встретить значение $Z=\frac{dN - dS}{\sqrt{Var(dN-dS)}}$, где Var(dN-dS)Var(dN−dS) оценивается из данных с использованием выборок по принципу Jackknife. Интерпретируется это значение аналогично dN/dS, но нейтральная эволюция соответствует Z = 0, а не dN/dS = 1.

Допустим, Вы проанализировали большое количество последовательностей одного белок-кодирующего гена у представителей некоторого вида. Результат множественного выравнивания последовательностей представлен в файле sequences_to_dNdS.fa.

Используя графический интерфейс MEGAX (или другой инструмент по вашему выбору) рассчитайте значение Z(dN−dS) для этого гена. Находится ли ген под действием отбора? Если да, то в каком направлении действует отбор?

Приведите в ответе значение статистики Z(dN-dS), округленное до сотых, и ответ на вопрос о давлении отбора (один вариант из трех: "нет", "да,положительный" или "да,отрицательный"). Используйте при расчете большое количество повторений bootstrap (1,000 и более). Пользуйтесь рассмотренным нами в видео методом - "Nei-Gojobori (Jukes-Cantor)"

In [11]:
import pandas as pd
import numpy as np
import dnds as dn

Решение:

  1. Используем и запускаем MegaX.
  2. Открываем файл - Data-> open File/Session -> Align Data
  3. Сохраняем файл - с расширением .mas
  4. Открываем его
  5. Distanse -> Compute Overall Mean Distance
  6. Выбираем: - Bootstrap Replications: 1000 - Substitutions Types: Syn-Nonsynonymous - Model/Method: Nei-Gojobor (Jukes-Cantor) - Substitutions to include: Deffirence (n-s) - Gaps/Missing Data Treatment: Pairwise deletion
  7. ok - ждем результат
  8. Ниже расчёт по формуле и результат
In [1]:
dnds = -0.00831
se = 0.00216
z=dnds/se
print(z)
-3.847222222222222