2.5 Анализ генетического смешения

2.5 Анализ генетического смешения

модуль 2.5 шаг 4


Если популяция A появилась как результат смешения B и C с коэффициентами смешения (admixture proportion) \(\alpha = 0.2\) и \(\beta = 0.8\), а частота аллели X в этих популяциях была равна \(p_B=0.9\), \(p_C=0.3\), то чему равна ожидаемая частота аллели X в популяции A?

Ответ: 0.42

модуль 2.5 шаг 6


Соотнесите различные \(f_x\) статистики с их смысловым значением.Выберите верные утверждения о вероятности коалесценции одной пары аллелей.

  1. \(f_2(A,B)\) - Анализ генетического расстояния между A и B
  2. \(f_3(A;B,C)\) - Проверка гипотез об эволюционном положении A относительно B и C
  3. \(f_4(A,B,C,D)\) - Анализ взаимосвязей в эволюции четырех популяций

модуль 2.5 шаг 8


Ответ: -0.063

модуль 2.5 шаг 9


Есть ли в предыдущем задании свидетельства того, что популяция C произошла от генетического смешения A и B?

При ответе на вопрос руководствуйтесь точечной оценкой \(f_3\), не учитывая стандартное отклонение.

Ответ: да

модуль 2.5 шаг 11


Допустим, Вы изучили частоты аллелей в 10 локусах в трех популяциях (AA, BB, CC). Результаты исследования приведены ниже: Рассчитайте значение D(seq1,seq2,seq3,seq4). Округлите ответ до сотых.

1
2
3
4
5
n = 18
seq1 = ['A', 'T', 'G', 'C', 'T', 'G', 'A', 'C', 'C', 'A', 'G', 'G', 'A', 'C', 'C', 'T', 'G', 'A']
seq2 = ['A', 'T', 'G', 'C', 'A', 'G', 'G', 'C', 'C', 'T', 'G', 'G', 'A', 'A', 'C', 'T', 'G', 'A']
seq3 = ['A', 'T', 'G', 'C', 'T', 'G', 'G', 'C', 'G', 'A', 'G', 'G', 'A', 'A', 'C', 'T', 'G', 'A']
seq4 = ['A', 'T', 'G', 'C', 'A', 'G', 'A', 'C', 'C', 'T', 'G', 'G', 'A', 'C', 'C', 'T', 'G', 'A']
\[D=\frac{N_{ABBA}-N_{BABA}}{N_{ABBA}+N_{BABA}}\]
1
2
3
4
5
6
7
8
9
10
11
12
abba = 0
baba = 0
for i in range(n):
    if seq3[i]!=seq4[i]:
        if seq1[i]==seq4[i] and seq2[i]==seq3[i]:
            abba+=1
        if seq1[i]==seq3[i] and seq2[i]==seq4[i]:
            baba+=1
print("abba=", abba)
print("baba=", abba)
D = (abba-baba)/(abba+baba)
print("Ответ:", D)
1
2
3
abba= 2
baba= 2
Ответ: 0.0
1

Ответ: 0.0

модуль 2.5 шаг 12


Задание для получения сертификата с отличием

В некотором исследовании проанализировали генотипы четырех индивидов, принадлежащих к разным популяциям (A,O,D,N). Аутгруппой является популяция N. Образец Ind1 соответствует популяция A, Ind2 - O, Ind3 - D, Ind4 - N.

Результаты генотипирования представлены в файле data_for_dtrio.vcf.

Используя инструмент Dsuite (доступен по ссылке), рассчитайте D(A,O,D,N). Чему равно это значение? Какая популяция (A или O) содержит избыток производных аллелей, общих с популяцией D? Является ли результат значимым, исходя из результатов анализа Dsuite?

Приведите в ответе значение D-статистики, округленное до тысячных долей, название популяции, которая содержит избыток общих производных аллелей с D, и ответ на вопрос о значимости результата.

Пример ответа: 0.121,A,нет

Ответ: 0.002,O,нет

модуль 2.5 шаг 14


Ответ: 0.23

модуль 2.5 шаг 15


Рассмотрите предложенный результат работы ADMIXTURE. Отметьте верные утверждения:

drawing
  • Наибольший вклад в формирование сегодняшней популяции Ближнего Востока внесла предковая африканская популяция
  • Африканская популяция формирует отдельный генетический кластер, слабо похожий на остальные
  • Сегодняшняя популяция Африки произошла от одной предковой популяции
  • Предковая популяция сегодняшних обитателей Южной Азии также внесла вклад в развитие сегодняшнего населения Кавказа
  • Современное население Кавказа формирует отдельный кластер, который не имеет общего происхождения с европейцами