🟡 ԴՆԹ Վերլուծություն

Ժամանակակից աշխարհում ծրագրավորումը կիրառվում է ամենատարբեր ոլորտներում։ Վերջին մի քանի տասնամյակներում անգամ առաջացել են գիտության նոր բնագավառներ, որոնք համակցում են գիտության այս կամ այն ոլորտը և տեղեկատվական տեխնոլոգիաները։ Բիոինֆորմատիկան այդպիսի համակցման վառ օրինակ է։ Այս բնագավառում ծրագրավորումը և տեղեկատվական տեխնոլոգիաները օգտագործվում է կենսաբանական տվյալները մշակելու և վերլուծելու համար։
🧑‍🔬
Այս խնդրում մենք կփորձեք գրել ծրագիր, որը կվերլուծի մարդու ԴՆԹ տվյալները և կպարզի նրա հակումը դեպի այս կամ այն հիվանդություն։
Այսօր արդեն յուրաքանչյուր մարդ կարող է հանձնել ԴՆԹ-թեստ և ստանալ մանրակրկիտ ինֆորմացիա իր գենետիկ կոդի վերաբերյալ։ Օրինակ, այս ֆայլը իրական մարդու ԴՆԹ-թեստի արդյունք է։
Վերլուծելով այս ֆայլը հնարավոր է պարզել տվյալ մարդու հակումը դեպի այս կամ այն հիվանդություն։ Բայց մինչ բուն խնդրին անցնելը, նախ եկեք փորձենք մատների վրա հասկանալ բիոինֆորմատիկայի հիմնական գաղափարներից մի քանիսը։
Մեր օրգանիզմի գրեթե բոլոր բջիջները պարունակում են այսպես կոչված բջջակորիզ, որը պարունակում է մեր գենետիկ կոդը և որոշում է մեր ֆիզիկական բնութագրերը։ Ամբողջ այս գենետիկ ինֆորմացիան պահվում է քրոմոսոմներում։ Քրոմոսոմները իրենց հերթին կազմված են ԴՆԹ-ից։
Բջջի կառուցվածք
Բջջի կառուցվածք
 
ԴՆԹ-ի մոլեկուլները բաղկացած են երկու իրար հետ հյուսված պարույրներից (տե՛ս ներքևի նկարում կանաչ և կարմիր պարույրները), և 4 նուկլեոտիդներից։ ԴՆԹ տողային նկարագրության մեջ նրա 4 նուկլեոտիդները նշվում են A (Adenine), C (Cytosine), G (Guanine) և T (Thymine) տառերով։ ԴՆԹ երկու պարույրները իրար «միացված» են այս նուկլեոտիդների զույգերով՝ A նուկլեոտիդները հանդիսանում է T-ի զույգը, C նուկլեոտիդը՝ G-ի (և հակառակը)։
ԴՆԹ մոլեկուլ
ԴՆԹ մոլեկուլ
💡
Ինչպես ծրագրավորման մեջ ցանկացած տվյալ ներկայացվում է 0-ների և 1-երի հաջորդականությամբ, այնպես էլ բջիջը մեր գենետիկ տվյալները պահում է A T G C նուկլեոտիդների հաջորդականությամբ։ Օրինակ, "ATTGC"- տողը ներկայացնում է ԴՆԹ- ի մի փոքր հատված։
Զարմանալիորեն, մարդկային գենոմի 99.6% (A, T, G, C հաջորդականությունները) ընդհանուր է բոլոր մարդկանց մոտ, անկախ նրանց սեռից և ռասայական պատկանելությունից։ Այնուամենայնիվ, ԴՆԹ այս երկար շղթաներում հանդիպում են կետեր, որտեղ նուկլեոտիդները տարբեր մարդկանց մոտ տարբերվում են։ Հենց այս տարբերություններ են, որ դարձնում են մեզ ունիկալ։ Տարբերության այս կետերը գրականության մեջ հայտնի են SNP (single nucleotide polymorphism) անունով։
SNP կետ ԴՆԹ շղթայում
SNP կետ ԴՆԹ շղթայում
Տարիների ընթացքում հայտնաբերվել են և այժմ էլ շարունակվում են հայտնաբերվել բազմաթիվ SNP կետեր, որոնք բնութագրում են մարդկանց տարբեր ֆիզիկական հատկություններ, կամ հակումը դեպի այս կամ այն հիվանդություն։ Հայտնաբերված SNP-ներին տրվում է ունիկալ համար (rsid) և դրանց մասին ինֆորմացիան պահվում է տարբեր տվյալների բազաներում։ www.snpedia.com կայքը այդպիսի բազայի օրինակ է։
Այս խնդրում մենք կդիտարկենք 3 SNP բնութագրիչներ։
  • rs7754840 ունիկալ համարով SNP-ն բնութագրում է մարդու հակումը դեպի երկրորդ տիպի շաքարային դիաբետ հիվանդություն։
    • Եթե ԴՆԹ այս կետում հանդիպում է GG զույգը, ապա մարդը գտնվում է նորմալ ռիսկի գոտում։
    • Երկրորդ տիպի շաքարային դիաբետի ռիսկը 1.3 ավելի մեծ է, եթե ԴՆԹ այս կետում հանդիպում է CC կամ CG նուկլեոդիտների զույգը։
  • rs2383207 ունիկալ համարով SNP-ն բնութագրում է մարդու հակումը դեպի սրտանոթային հիվանդություն։
    • Եթե ԴՆԹ այս կետում հանդիպում է AA զույգը, ապա մարդը գտնվում է նորմալ ռիսկի գոտում։
    • Սրտանոթային հիվանդության ռիսկը 2 անգամ ավելի մեծ է, եթե ԴՆԹ այս կետում հանդիպում է AG զույգը։
    • Սրտանոթային հիվանդության ռիսկը 2.1 անգամ ավելի մեծ է, եթե ԴՆԹ այս կետում հանդիպում է GG զույգը։
  • rs1426654 ունիկալ համարով SNP-ն բնութագրում է մարդու մաշկի գույնը։
    •  Եթե ԴՆԹ այս կետում հանդիպում է AA զույգը, ապա ամենայն հավանականությամբ տվյալ մարդը ունի բաց գույնի մաշկ։
    • Եթե ԴՆԹ այս կետում հանդիպում է GG զույգը, ապա ամենայն հավանականությամբ տվյալ մարդը ունի մուգ գույնի մաշկ։
    • Եթե ԴՆԹ այս կետում հանդիպում է AG զույգը, ապա ամենայն հավանականությամբ տվյալ մարդը ունի բաց և մուգ մաշկի գույնի խառնուրդ։
Եթե բացեք ԴՆԹ թեստի ֆայլի օրինակը, կտեսնեք, որ այն պարունակում է գրեթե մեկ միլիոն տող ինֆորմացիա մարդու ԴՆԹ-շղթայում հանդիպող տարբեր SNP կետերի մասին։ Եթե այս ֆայլում փնտրեք rs7754840 համարի SNP-ն, կտեսնեք, որ տվյալ մարդու մոտ SNP այդ կետում հանդիպում է CG նուկլեոտիդների զույգը, ինչը նշանակում է, որ այս մարդու մոտ երկրորդ տիպի շաքարային դիաբետով հիվանդանլու ռիսկը 1.3 անգամ ավելի մեծ է։
 
notion image
 
Դե ինչ, ժամանակն է գրել ծրագիր, որը կվերլուծի ԴՆԹ թեստի արդյունքը և կպատասխանի հետևյալ հարցերին՝
  1. Արդյո՞ք ունի տվյալ մարդը հակում դեպի 2-րդ տիպի շաքարային դիաբետ հիվանդության։ Էկրանին հարկավոր է տպել հետևյալ տարբերակներից որևէ մեկը՝
    1. 1.3x Increased risk for Type-2 Diabetes, եթե rs7754840 համարի SNP -ում հանդիպում է CC կամ CG նուկլեոդիտների զույգը։
    2. Normal risk for Type-2 Diabetes եթե rs7754840 համարի SNP -ում հանդիպում է GG զույգը։
    3. No DNA info on Type-2 Diabetes (եթե տվյալը բացակայում է)
  1. Արդյո՞ք ունի տվյալ մարդը հակում դեպի սրտանոթային հիվանդություններ։ Էկրանին հարկավոր է տպել հետևյալ տարբերակներից որևէ մեկը՝
    1. Normal risk of heart disease, եթե rs2383207 համարի SNP -ում հանդիպում է AA զույգը։
    2. 2x increased risk for heart disease, եթե rs2383207 համարի SNP -ում հանդիպում է AG զույգը։
    3. 2.1x increased risk for heart disease, եթե rs2383207 համարի SNP -ում հանդիպում է GG զույգը։
    4. No DNA info on heart disease, եթե տվյալը բացակայում է։
  1. Մաշկի գույնը։ Էկրանին հարկավոր է տպել հետևյալ տարբերակներից որևէ մեկը՝
    1. Probably light-skinned, European ancestry, եթե rs1426654 համարի SNP -ում հանդիպում է AA զույգը։
    2. Probably mixed African/European ancestry, եթե rs1426654 համարի SNP -ում հանդիպում է AG զույգը։
    3. Probably darker-skinned, Asian or African ancestry, եթե rs1426654 համարի SNP -ում հանդիպում է GG զույգը։
    4. No DNA info on Skin Type
Ծրագիրը որպես մուտք ստանում է inputDna.txt անունով տեքստային ֆայլ, որը պարունակում է ԴՆԹ թեստի արդյունքը։ Տեքստային ֆայլը ունի հետևյալ ֆորմատը (այս ֆորմատը հայտնի է նաև CSV անունով) ՝
  • Առաջին մի քանի տողերը սկսկվում են # սիմվոլով և հանդիսանում են մեկնաբանություններ։ Այդ տողերը անհրաժեշտ է բաց թողնել։
  • Հաջորդ տողերը բաժանված են սյուների։ Առաջին սյունը պարունակում է SNP ունիկալ համարը, իսկ վերջին սյունը՝ համապատասխան նուկլեոդիտների զույգը։
notion image
 
Ծրագիրը լոկալ թեստավորելու համար կարող եք օգտնվել հետևյալ ֆայլերից։ Այս ֆայլերը պարունակում են իրական մարդկանց ԴՆԹ թեստի արդյունքներ։

www.snpedia.com կայքում կարող եք գտնել ինֆորմացիային ամենատարբեր SNP բնութագրերի մասին։

 
Եթե www.snpedia.com կայքում փնտրեք Ալզերհերմերի հիվանդություն։(Alzheimer's disease) հիվանդությունը, կգտնենք մի քանի տասնյակ SNP-ներ, որոնք կապված են այս հիվանդության հետ և նկարագրում են դրա հնարավոր ռիսկերը։
notion image
 
Սեղմելով կոնկրետ SNP համարի վրա, կգտնեք մանրակրիրտ ինֆորմացիա, ձեր օրգանիզմի վրա տվյալ SNP-ի ազդեթության վերաբերյալ։ Օրինակ, եթե ձեր ԴՆԹ-ում rs63750847 ունիկալ համարով SNP կետում հանդիպում են AA զույգը, ապա ամենայն հավնականությամբ դուք այս հիվանդության նկատմամբ բարձր դիմադրություն։
notion image

Constraints

Time limit: 3 seconds

Memory limit: 512 MB

Output limit: 1 MB

To check your solution you need to sign in
Sign in to continue