Feature engineering-ը հում տվյալները մոդելների համար ավելի «խելացի» մուտքային տվյալների վերածելու արվեստն է: Այն ներառում է մուտքային տվյալների մաքրում, ձևափոխում և ստեղծում, որպեսզի օրինաչափություններն ավելի հեշտ ուսուցանվեն։ Մարդիկ այն օգտագործում են ճշգրտությունը բարձրացնելու, սխալը նվազեցնելու և մոդելներն ավելի կայուն (robust) դարձնելու համար՝ մշակելով բաց թողնված արժեքները, ուղղելով մասշտաբը (օրինակ՝ նորմալացում), նվազեցնելով ասիմետրիան (լոգարիթմական ձևափոխություններ), կոդավորելով կատեգորիկ փոփոխականները և ստեղծելով տվյալ ոլորտին հատուկ ազդանշաններ (հարաբերություններ, ուշացումներ, փոխազդեցություններ)։ Լավ հատկանիշները հաճախ թույլ են տալիս, որ ավելի պարզ մեքենայական ուսուցման մոդելներն ավելի լավ արդյունք ցույց տան, քան բարդերը։ Դրանք նաև բարելավում են մեկնաբանելիությունը (interpretability) (հստակ, անվանական ազդանշաններ) և արտադրական համակարգերն ավելի կայուն են դարձնում վերարտադրելի փոխակերպումների շղթաների (reproducible pipelines) միջոցով։
Միասնական սանդղակ բոլորի համար
Դասական քայլերից է չափման միավորների ստանդարտացումը, որպեսզի յուրաքանչյուր արժեք ունենա նույն իմաստը։ Այսօր դուք կվերածեք խառը միավորներով ներկայացված ջերմաստիճանների ցանկը մեկ, միասնական սանդղակի՝ Կելվինի։
Կլիմայական լաբորատորիան ջերմաստիճանի չափումներ է հավաքում տարբեր սենսորներից։ Որոշները տվյալները տրամադրում են Ցելսիուսի, որոշները՝ Ֆարենհայթի, իսկ մի քանիսն էլ՝ Կելվինի սանդղակով։ Ցուցատախտակը կարող է աշխատել միայն մեկ սանդղակով, ուստի ձեր խնդիրն է յուրաքանչյուր չափումը փոխակերպել Կելվինի։
Մուտքի առաջին տողում տրված է n ամբողջ թիվը՝ չափումների քանակը։
Հաջորդ n տողերից յուրաքանչյուրը պարունակում է ջերմաստիճանի արժեք, որին հաջորդում է բացատ և չափման միավորը (C, F կամ K՝ մեծատառերով)։ Արժեքը կարող է լինել ինչպես ամբողջ, այնպես էլ կոտորակային թիվ։
Ելքում պետք է տպել Կելվինի փոխակերպված ջերմաստիճանները՝ յուրաքանչյուրը նոր տողում, ստորակետից հետո ճիշտ երկու նիշի ճշտությամբ։