Kurset er tredje kursus af i alt fire statistikkurser i R. Store mængder data medfører udfordringer. Kurset er til dig, der ønsker at komme i gang med din Big Data analyse. Du lærer at bruge R til at modellere data i to poplære machine learning algoritmer: Random Forest og Boosting. Efter ønske kan kurset følges online som et webinar på dagen.
Efter kurset har du lært, at machine learning dækker over algoritmer udviklet til prædiktion og data mining særligt i store datamængder. Du har lært om the curse of dimensionality og the variance-bias-trade-off, som grundlæggende problemer i enhver data analyse og særligt i en data analyse af store datamængder. Du har lært rationalet i krydsvalideringsproceduren og lært at gennemføre en krydsvalidering i R. Du har lært to populære machine learning algoritmer at kende og anvende i R: Random Forest og Boosting.
Du skal medbringe egen PC. Du skal have kendskab til R og en forståelse af statistiske grundprincipper svarende til niveauet i kurset R1 - Introduktion til statistikprogrammet R og R2 - Introduktion til lineære modeller i R.
Programmet består af flere oplæg fra underviseren og en række Hands-on forløb bestående af et udleveret R-script, som deltageren kører igennem under underviserens vejledning.
10:00 Velkomst
10:15 Big data og machine learning - en ny æra begynder: Nye algoritmer til nye udfordringer, Machine learning og predictive modelling, Krydsvalidering, Et eksempel
11:00 Pause
11:10 Hands-on 1: Krydsvalidering i en lineær model i R
12:00 Frokost
12:30 Machine learning 1: Random Forest, Random Forest algoritmen, Et eksempel
13:00 Hands-On 2: Random Forest model i R
13:50 Pause
14:00 Machine learning 2: Boosting, Bosting algoritmen, Et eksempel
14:50 Pause
15:00 Hands-On 3: Boosting i R
15:50 Afrunding
16:00 Slut
Frokostbuffet er inkluderet i prisen.
8. Teknologisk Institut forbeholder sig retten til at aflyse kurset såfremt der er færre end det minimale antal deltager.
Gareth, J., Witten, D., Hastie, T., Tibshirani, R. 2013. An Introduction to Statistical Learning with Applications in R. Springer, NY.
Gratis online version her.
Unikke tilbud, relevante artikler og nyt om vores kurser og uddannelser.
Der er desværre en systemfejl på nuværende tidspunkt. Du kan alternativt skrive en mail til kurser@teknologisk.dk
På baggrund af algoritmer kan computeren nu lære at identificere mønstrer i data, for derefter at lave forudsigelser ud fra disse data. Bliv klogere på Machine Learn...
Læs mereMachine Learning er et felt inden for datalogi, hvor der arbejdes med at gøre computere i stand til at ”lære” og progressivt forbedre deres læring og res...
De fleste har nok hørt om Robotic Proces Automation. RPA er en robot, som kan arbejde efter automatiserede indstillinger. Men hvad er fordelene?
Det populære programmeringssproget R har mange fordele. Men hvad er R egentlig, og hvorfor er det en god investering at have kompetencer inden for netop dette progra...