Veel data zijn complex en gevarieerd. Door de juiste analysemethoden te gebruiken kan de impact die dat heeft op processen en wetenschap worden vergroot. In een hedendaagse data science workflow worden machine learning methoden steeds vaker ingezet om de waarde van big data te benutten. Tijdens de opleiding Data Science & Predictive Machine Learning leer je de laatste ontwikkelingen op het terrein van voorspellen, modelleren en analyse en leer je hoe je de informatie uit data op waarde kunt schatten. Je gaat de theorie zelf toepassen in het programma R.
Meer informatie en details zijn te vinden op deze cursus pagina
Alle cursusdagen zijn in het gebouw van de VNAB. Een online live stream is beschikbaar voor alle deelnemers binnen de MS Teams omgeving van de cursus.
When? | What? | |
---|---|---|
09.30 | 10.15 | Lecture |
10:15 | 11.00 | Practical |
11.00 | 11.30 | Discussion |
break | ||
11.45 | 12.30 | Lecture |
Lunch | ||
13:30 | 14.15 | Practical |
14:15 | 14.45 | Discussion |
break | ||
15:00 | 15:45 | Lecture |
15:45 | 16.30 | Practical |
16:30 | 17:00 | Discussion |
Dear all,
To realize a steeper learning curve, we will use some functionality that is not part of the base installation for R
. The below steps guide you through installing both R
as well as the necessary additions.
I look forward to see you all in Rotterdam.
Gerko
Bring a laptop computer to the course and make sure that you have full write access and administrator rights to the machine. We will explore programming and compiling in this course. This means that you need full access to your machine. Some corporate laptops come with limited access for their users, we therefore advice you to bring a personal laptop computer, if you have one.
R
R
can be obtained here. We won’t use R
directly in the course, but rather call R
through RStudio
. Therefore it needs to be installed.
RStudio
DesktopRstudio is an Integrated Development Environment (IDE). It can be obtained as stand-alone software here. The free and open source RStudio Desktop
version is sufficient.
Execute the following lines of code in the console window:
install.packages(c("ggplot2", "tidyverse", "magrittr", "knitr", "rmarkdown",
"plotly", "ggplot2", "shiny", "devtools", "boot", "class",
"car", "MASS", "ggplot2movies", "ISLR", "DAAG", "mice",
"purrr", "furrr", "future", "rpart", "ranger", "xgboost",
"caret"), dependencies = TRUE)
If you are not sure where to execute code, use the following figure to identify the console - ignore the outdated version in the example:
Just copy and paste the installation command and press the return key. When asked
Do you want to install from sources the package which needs /no/cancel) compilation? (Yes
type Yes
in the console and press the return key.
If all fails and you have insufficient rights to your machine, the following web-based service will offer a solution.
RStudio
environment there.Naturally, you will need internet access for these services to be accessed. Wireless internet access will be available at the course location.
Ik pas mijn onderwijs meestal aan de doelgroep aan. Daardoor kunnen onderwijsmaterialen soms zelfs gedurende de dag veranderen of uitgebreid worden. Om er zeker van te zijn dat je de laatste iteratie van de cursusmaterialen hebt, adviseer ik om de materialen online te bekijken.
Alle lectures zijn in html
format. Practicals zijn walkthrough files die je door de oefeningen heen helpen.
R
wilt lerenZie onderstaande links.
R
R
-cursus die ik de afgelopen 10 jaar heb ontwikkeldDe bovenstaande referenties zijn nuttig en linken aan de cursusmaterialen voor vandaag.
Ik pas mijn onderwijs meestal aan de doelgroep aan. Daardoor kunnen onderwijsmaterialen soms zelfs gedurende de dag veranderen of uitgebreid worden. Om er zeker van te zijn dat je de laatste iteratie van de cursusmaterialen hebt, adviseer ik om de materialen online te bekijken.
Alle lectures zijn in html
format. Practicals zijn walkthrough files die je door de oefeningen heen helpen.
De bovenstaande referentie is nuttig en linked aan de cursusmaterialen voor vandaag.
Hieronder links naar antwoorden op gestelde vragen:
rlm
’s M-estimation - en nog veel meer - wordt hier besproken. De schrijver - Brian Ripley - is de auteur van veel R
functionaliteit en een voorvechter van robust statistics.Mijn voorstel is om deze dag iets anders in te delen met ’s ochtends een technische sessie gericht op ridge regressie en ’s middags een meer praktische sessie gericht op Lasso regressie en het Elastic Net.
Alle lectures zijn in html
format. Practicals zijn walkthrough files die je door de oefeningen heen helpen. Ik heb ook Impracticals gemaakt; dit zijn alleen de opdrachten, zonder de antwoorden.
Wil je de technieken liever toepassen op je eigen data, dan is daar ook alle mogelijkheid toe.
De bovenstaande referentie vormen een mooie praktische toevoeging op de materialen van vandaag.
Vandaag behandelen we support vector machines en klassificatie en regressie bomen. Aan het eind van de middag is er een vrij programma. Hierin kunnen we vragen bespreken over de lesstof, persoonlijke casuistiek inbrengen en op eigen data werken.
Alle lectures zijn in html
format. Practicals zijn walkthrough files die je door de oefeningen heen helpen. Ik heb ook Impracticals gemaakt; dit zijn alleen de opdrachten, zonder de antwoorden.
Wil je de technieken liever toepassen op je eigen data, dan is daar ook alle mogelijkheid toe.
De bovenstaande referenties vormen een mooie praktische toevoeging op de materialen van vandaag.
Zie onderstaande links: