Från http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
Matstat-kurser fokuserar oftast helt på Model-steget, denna kurs har ambitionen att beröra de övriga.
Bild från: http://r4ds.had.co.nz/introduction.html
Ger grundläggande träning och förberedelse inför lektion. Inte betygsgrundande, men lektioner och handledning kommer förutsätta att de är gjorda.
NA
/“missing values”?Reproducibility is the ability to get the same research results or inferences, based on the raw data and computer programs provided by researchers. (Wikipedia)
Allt skrivet i kod (inget klickande eller klippande/klistrande av resultat/tabeller/figurer)
Portabelt (koden skall vara körbar, inte bara på din dator idag)
Tillgängligt (andra skall enkelt kunna ta del av och reproducera din analys)
Automatiserat från rådata till rapport (en knapptyckning skall räcka för att generera slutprodukten)
summary(mtcars$mpg) summary(mtcars$"mpg") summary(mtcars[, "mpg"]) summary(mtcars["mpg"]) summary(mtcars[["mpg"]]) summary(mtcars[1]) summary(mtcars[, 1]) summary(mtcars[[1]]) with(mtcars, summary(mpg)) attach(mtcars); summary(mpg) summary(subset(mtcars, select=mpg))
En serie R-paket från RStudio. Design filosofi: Snabba, konsistenta, ändamålsenliga funktioner. Fokus i denna kurs.
Vi behöver automatiskt kombinera text, resultat, tabeller och figurer.
Bild från https://rosannavanhespenresearch.files.wordpress.com/
Ett märkspråk (markup language) för typsättning.
En utveckling av Markdown som inkluderar körbar kod.
En viktig aspekt för att göra kod tillgänglig är att göra den läsbar
I den här kursen kommer vi att använda The tidyverse style guide av Hadley Wickham
styler
-paketet har ett bekvämt Rstudio-Addin som hjälper dig transformera din kod enligt stilguiden
Bild från http://phdcomics.com/comics/archive.php?comicid=1531
Inte nödvändigt för reproducerbarhet, men ett måste för stora projekt under lång tid. En bieffekt av att vi använder GitHub.
Versionshantering stöder arbetet med kodprojekt i team
Ger även .Rproj för ökad portabilitet.
Allt skrivet i kod: R
Portabelt: .Rproj (RStudio)
Tillgängligt: GitHub
Automatiserat: R Markdown
2021-11-29: Benjamin Allévius - Senior Data scientist