🟡 ԴՆԹ Վերլուծություն
Ժամանակակից աշխարհում ծրագրավորումը կիրառվում է ամենատարբեր ոլորտներում։ Վերջին մի քանի տասնամյակներում անգամ առաջացել են գիտության նոր բնագավառներ, որոնք համակցում են գիտության այս կամ այն ոլորտը և տեղեկատվական տեխնոլոգիաները։ Բիոինֆորմատիկան այդպիսի համակցման վառ օրինակ է։ Այս բնագավառում ծրագրավորումը և տեղեկատվական տեխնոլոգիաները օգտագործվում է կենսաբանական տվյալները մշակելու և վերլուծելու համար։
🧑🔬
Այս խնդրում մենք կփորձեք գրել ծրագիր, որը կվերլուծի մարդու ԴՆԹ տվյալները և կպարզի նրա հակումը դեպի այս կամ այն հիվանդություն։
Այսօր արդեն յուրաքանչյուր մարդ կարող է հանձնել ԴՆԹ-թեստ և ստանալ մանրակրկիտ ինֆորմացիա իր գենետիկ կոդի վերաբերյալ։ Օրինակ, այս ֆայլը իրական մարդու ԴՆԹ-թեստի արդյունք է։
Վերլուծելով այս ֆայլը հնարավոր է պարզել տվյալ մարդու հակումը դեպի այս կամ այն հիվանդություն։ Բայց մինչ բուն խնդրին անցնելը, նախ եկեք փորձենք մատների վրա հասկանալ բիոինֆորմատիկայի հիմնական գաղափարներից մի քանիսը։
Մեր օրգանիզմի գրեթե բոլոր բջիջները պարունակում են այսպես կոչված բջջակորիզ, որը պարունակում է մեր գենետիկ կոդը և որոշում է մեր ֆիզիկական բնութագրերը։ Ամբողջ այս գենետիկ ինֆորմացիան պահվում է քրոմոսոմներում։ Քրոմոսոմները իրենց հերթին կազմված են ԴՆԹ-ից։
ԴՆԹ-ի մոլեկուլները բաղկացած են երկու իրար հետ հյուսված պարույրներից (տե՛ս ներքևի նկարում կանաչ և կարմիր պարույրները), և
4
նուկլեոտիդներից։ ԴՆԹ տողային նկարագրության մեջ նրա 4
նուկլեոտիդները նշվում են A
(Adenine),
C
(Cytosine),
G
(Guanine) և
T
(Thymine)
տառերով։ ԴՆԹ երկու պարույրները իրար «միացված» են այս նուկլեոտիդների զույգերով՝ A
նուկլեոտիդները հանդիսանում է T
-ի զույգը, C
նուկլեոտիդը՝ G
-ի (և հակառակը)։ 💡
Ինչպես ծրագրավորման մեջ ցանկացած տվյալ ներկայացվում է 0-ների և 1-երի հաջորդականությամբ, այնպես էլ բջիջը մեր գենետիկ տվյալները պահում է
A T G C
նուկլեոտիդների հաջորդականությամբ։ Օրինակ, "ATTGC"
- տողը ներկայացնում է ԴՆԹ- ի մի փոքր հատված։Զարմանալիորեն, մարդկային գենոմի
99.6%
(A, T, G, C հաջորդականությունները) ընդհանուր է բոլոր մարդկանց մոտ, անկախ նրանց սեռից և ռասայական պատկանելությունից։ Այնուամենայնիվ, ԴՆԹ այս երկար շղթաներում հանդիպում են կետեր, որտեղ նուկլեոտիդները տարբեր մարդկանց մոտ տարբերվում են։ Հենց այս տարբերություններ են, որ դարձնում են մեզ ունիկալ։ Տարբերության այս կետերը գրականության մեջ հայտնի են SNP (single nucleotide polymorphism) անունով։ Տարիների ընթացքում հայտնաբերվել են և այժմ էլ շարունակվում են հայտնաբերվել բազմաթիվ SNP կետեր, որոնք բնութագրում են մարդկանց տարբեր ֆիզիկական հատկություններ, կամ հակումը դեպի այս կամ այն հիվանդություն։ Հայտնաբերված SNP-ներին տրվում է ունիկալ համար (rsid) և դրանց մասին ինֆորմացիան պահվում է տարբեր տվյալների բազաներում։ www.snpedia.com կայքը այդպիսի բազայի օրինակ է։
Այս խնդրում մենք կդիտարկենք 3 SNP բնութագրիչներ։
rs7754840
ունիկալ համարով SNP-ն բնութագրում է մարդու հակումը դեպի երկրորդ տիպի շաքարային դիաբետ հիվանդություն։- Եթե ԴՆԹ այս կետում հանդիպում է
GG
զույգը, ապա մարդը գտնվում է նորմալ ռիսկի գոտում։ - Երկրորդ տիպի շաքարային դիաբետի ռիսկը
1.3
ավելի մեծ է, եթե ԴՆԹ այս կետում հանդիպում էCC
կամCG
նուկլեոդիտների զույգը։
rs2383207
ունիկալ համարով SNP-ն բնութագրում է մարդու հակումը դեպի սրտանոթային հիվանդություն։- Եթե ԴՆԹ այս կետում հանդիպում է
AA
զույգը, ապա մարդը գտնվում է նորմալ ռիսկի գոտում։ - Սրտանոթային հիվանդության ռիսկը
2
անգամ ավելի մեծ է, եթե ԴՆԹ այս կետում հանդիպում էAG
զույգը։ - Սրտանոթային հիվանդության ռիսկը
2.1
անգամ ավելի մեծ է, եթե ԴՆԹ այս կետում հանդիպում էGG
զույգը։
rs1426654
ունիկալ համարով SNP-ն բնութագրում է մարդու մաշկի գույնը։- Եթե ԴՆԹ այս կետում հանդիպում է
AA
զույգը, ապա ամենայն հավանականությամբ տվյալ մարդը ունի բաց գույնի մաշկ։ - Եթե ԴՆԹ այս կետում հանդիպում է
GG
զույգը, ապա ամենայն հավանականությամբ տվյալ մարդը ունի մուգ գույնի մաշկ։ - Եթե ԴՆԹ այս կետում հանդիպում է
AG
զույգը, ապա ամենայն հավանականությամբ տվյալ մարդը ունի բաց և մուգ մաշկի գույնի խառնուրդ։
Եթե բացեք ԴՆԹ թեստի ֆայլի օրինակը, կտեսնեք, որ այն պարունակում է գրեթե մեկ միլիոն տող ինֆորմացիա մարդու ԴՆԹ-շղթայում հանդիպող տարբեր SNP կետերի մասին։ Եթե այս ֆայլում փնտրեք
rs7754840
համարի SNP-ն, կտեսնեք, որ տվյալ մարդու մոտ SNP այդ կետում հանդիպում է CG
նուկլեոտիդների զույգը, ինչը նշանակում է, որ այս մարդու մոտ երկրորդ տիպի շաքարային դիաբետով հիվանդանլու ռիսկը 1.3
անգամ ավելի մեծ է։ Դե ինչ, ժամանակն է գրել ծրագիր, որը կվերլուծի ԴՆԹ թեստի արդյունքը և կպատասխանի հետևյալ հարցերին՝
- Արդյո՞ք ունի տվյալ մարդը հակում դեպի 2-րդ տիպի շաքարային դիաբետ հիվանդության։ Էկրանին հարկավոր է տպել հետևյալ տարբերակներից որևէ մեկը՝
1.3x Increased risk for Type-2 Diabetes
, եթեrs7754840
համարի SNP -ում հանդիպում էCC
կամCG
նուկլեոդիտների զույգը։Normal risk for Type-2 Diabetes
եթեrs7754840
համարի SNP -ում հանդիպում էGG
զույգը։No DNA info on Type-2 Diabetes
(եթե տվյալը բացակայում է)
- Արդյո՞ք ունի տվյալ մարդը հակում դեպի սրտանոթային հիվանդություններ։ Էկրանին հարկավոր է տպել հետևյալ տարբերակներից որևէ մեկը՝
Normal risk of heart disease
, եթեrs2383207
համարի SNP -ում հանդիպում էAA
զույգը։2x increased risk for heart disease
, եթեrs2383207
համարի SNP -ում հանդիպում էAG
զույգը։2.1x increased risk for heart disease
, եթեrs2383207
համարի SNP -ում հանդիպում էGG
զույգը։No DNA info on heart disease
, եթե տվյալը բացակայում է։
- Մաշկի գույնը։ Էկրանին հարկավոր է տպել հետևյալ տարբերակներից որևէ մեկը՝
Probably light-skinned, European ancestry
, եթեrs1426654
համարի SNP -ում հանդիպում էAA
զույգը։Probably mixed African/European ancestry
, եթեrs1426654
համարի SNP -ում հանդիպում էAG
զույգը։Probably darker-skinned, Asian or African ancestry
, եթեrs1426654
համարի SNP -ում հանդիպում էGG
զույգը։No DNA info on Skin Type
Ծրագիրը որպես մուտք ստանում է inputDna.txt անունով տեքստային ֆայլ, որը պարունակում է ԴՆԹ թեստի արդյունքը։ Տեքստային ֆայլը ունի հետևյալ ֆորմատը (այս ֆորմատը հայտնի է նաև CSV անունով) ՝
- Առաջին մի քանի տողերը սկսկվում են
#
սիմվոլով և հանդիսանում են մեկնաբանություններ։ Այդ տողերը անհրաժեշտ է բաց թողնել։
- Հաջորդ տողերը բաժանված են սյուների։ Առաջին սյունը պարունակում է SNP ունիկալ համարը, իսկ վերջին սյունը՝ համապատասխան նուկլեոդիտների զույգը։
Ծրագիրը լոկալ թեստավորելու համար կարող եք օգտնվել հետևյալ ֆայլերից։ Այս ֆայլերը պարունակում են իրական մարդկանց ԴՆԹ թեստի արդյունքներ։
www.snpedia.com կայքում կարող եք գտնել ինֆորմացիային ամենատարբեր SNP բնութագրերի մասին։
Եթե www.snpedia.com կայքում փնտրեք Ալզերհերմերի հիվանդություն։(Alzheimer's disease) հիվանդությունը, կգտնենք մի քանի տասնյակ SNP-ներ, որոնք կապված են այս հիվանդության հետ և նկարագրում են դրա հնարավոր ռիսկերը։
Սեղմելով կոնկրետ SNP համարի վրա, կգտնեք մանրակրիրտ ինֆորմացիա, ձեր օրգանիզմի վրա տվյալ SNP-ի ազդեթության վերաբերյալ։ Օրինակ, եթե ձեր ԴՆԹ-ում
rs63750847
ունիկալ համարով SNP կետում հանդիպում են AA
զույգը, ապա ամենայն հավնականությամբ դուք այս հիվանդության նկատմամբ բարձր դիմադրություն։ Constraints
Time limit: 3 seconds
Memory limit: 512 MB
Output limit: 1 MB