Navigation

Etusivu Ennakko Workshop Mainos Yhteenveto

1 Ennakkotehtävät

Alla on muutama konkreettinen tehtävä, muutama teksti luettavaksi ja video katsottavaksi sekä lopussa lyhyt kysely. Toivoisin että ehditte tehdä tehtävät ja sitten vastata kyselyyn viimeistään perjantaina 8. helmikuuta virka-ajan puitteissa.

Kyselyn tarkoitus on antaa tietoa osallistujien lähtötasosta, etten turhaa käy läpi turhia perusasioita ja samalla muistan käydä tarpeelliset perusasiat läpi.

2 Orientoivat videot ja tekstit

2.1 R-kieli

Courseran tuoreen Computing for Data Analysis -kurssin johdantovideo R-kieleen. Mikäli haluat katsoa enemmän näitä erinomaisia ja ajantasaisia videoita, löytyvät ne lajiteltuna neljän luentoviikon mukaan youtubesta: http://www.youtube.com/user/rdpeng/videos?view=1&flow=grid

Lisää linkkejä ja sovelluksia voi katsoa esim. minun omalta r-sivustolta: markuskainu.fi/r-tutorial/

2.2 Toistettava analyysi (Reproducible research)

Toistettavan tutkimukseen liittyvistä teoreettisista asioista on hyvä ainakin selata läpi kaksi seuraavaa paperia:

Lähtökohta ei ole yhteiskuntatieteellinen, mutta monet avainasiat pätevät myös yhteiskuntatieteissä. Varoittava esimerkki ei-toistettavasta tutkimuksesta ja sen seurauksista: The Duke Saga Starter Set.

Yhteiskuntatieteellinen tieto ei onneksi (valitettavasti) ohjaa yhtä sitovasti politiikan harjoittamista kuin mitä lääketieteellinen tieto hoitokäytäntöjä, mutta periaatteessa samankaltainen skenaario voisi olla mahdollinen. Yksi vastaava kohu oli vuosituhannen alussa julkaistun Maailmanpankin paperin Growth is Good for the Poor(Kray and Dollar 2001) ympärillä käyty keskustelu datan ja analyysin luotettavuudesta (ks. esim Guardian: Growth is good for the poor )

2.3 Markdown-merkintäkieli

Tulemme käyttämään Markdown-merkintäkieltä kaikessa kirjoittamisessa. Helpointa päästä käsiksi markdowniin on katsoa alla oleva 12 minuutin screencast. Videolla markdownia käytetään webbisisällön tekemiseen. Tässä workshopissa käytämme markdownia tieteellisen asiakirjan tekemiseen, joka voidaan julkaista sekä sähköisesti (.html, .epub) että paperille.

Markdownin "kotisivu" on daringfireball.net/projects/markdown/, josta löytyy ohje markdownin syntaksiin. Me tulemme käyttämään vain otsikoita, leipätekstiä, luetteloita, kuvia, taulukoita ja koodia, jotka ei vaadi suurta perehtymistä.

2.4 Toistettava tutkimus R:ssä

Tämän workshopin tavoite on tehdä toistettavaa analyysiä R-ympäristössä. Käytännössä se tarkoittaa markdown-merkintäkielen sekä R-kielisten koodikimpaleiden yhdistämistä R-Markdown -merkintäkieleksi, joka voidaan kutoa helposti eri asiakirjaformaatteihin.

Lue ajatuksella seuraavat lyhyet tekniset tekstit:

Moni asia voi tuntia vieraalta, mutta voit katsoa vielä kertauksena tekemäni videon siitä, miten nämä kaikki yhdistetään asiakirjaksi:

R Markdown, RStudio & knitr ja pandoc tekstiasiakirjan muotoilussa from Markus Kainu on Vimeo.

Alla lisäksi muutama linkki erinonmaisiin teksteihin siitä, miten tutkimuksen data-analyysi kannattaa rakentaa:

2.5 Pandoc-dokumentinkääntäjä R Markdownin jatkeena

Pandoc on Berkeleyn yliopiston filosofian professorin John MacFarlanen kehittämä ohjelma, joka kääntää asiakirjoja eri formaattien välillä.

Alla olevat videot ovat perusteellinen kuvaus sen toiminnasta sekä rakenteesta. Perjantai-illan elokuvan voi hyvin korvata näillä:

Osa1

Osa2

3 Ohjelmistoympäristön asentaminen

Asennettuna pitää olla R, RStudio sekä pandoc sekä latex. Seuraavassa ohjeet miten se tapahtuu eri käyttöjärjestelmiin:

Teknisten ongelmien välttämiseksi olisi hyvä että kaikilla olisi asennettua R versio 2.15.2, Rstudio versio 0.97.309 tai uudempi, Pandoc 1.9 tai uudempi.

3.1 Tarvittava r-paketit

Asenna R:n seuraavat paketit seuraavin komennoin:

install.packages("ggplot2")
install.packages("survey")   
install.packages("reshape")
install.packages("reshape2")
install.packages("knitr")
install.packages("markdown")
install.packages("WDI")

Muista ladata paketit R:ään ennen kyselyn viimeisen kohdan 'sessionInfo()':n käyttöä

4 Unix-tunnukset users.utu.fi:hin

Tulemme julkaisemaan workshopin puitteissa materiaalia nettiin. Kaikki kurssin osallistujat ovat Turun yliopiston opiskelijoita tai henkilökuntaa ja kaikilla on siten mahdollisuus saada käyttöön www-palvelintilaa osoitteessa: users.utu.fi.

Miten saan käyttööni henkilökohtaisen verkkosivun

  1. Tarvitset siihen unix-salasanan. Klikkaa: Miten saan unix-käyttäjätunnuksen?
  2. Ohjeet kotisivutiilan saamiseksi käyttöön: Henkilökohtaiset verkkosivut (users.utu.fi)

Mikäli haluat graafisen käyttöliittymän tiedostojen siirtämiseen www-palvelimelle suosittelen lataamaan ja asentamaan Filezilla-clientin

Seuraavassa lyhyt video siitä, miten filezillalla otetaan yhteys users.utu.fi:hin ja siirretään www-palvelimelle muutama tiedosto. (Näkyy: Firefox/Chrome - Klikkaa oikeaa alakulmaa fullscreeniin)

5 Kysely

Viimeisen kysymyksen sessionInfo() -komennon tulos on muotoa:

R version 2.15.2 (2012-10-26)
Platform: x86_64-pc-linux-gnu (64-bit)

locale:
 [1] LC_CTYPE=fi_FI.UTF-8       LC_NUMERIC=C               LC_TIME=fi_FI.UTF-8       
 [4] LC_COLLATE=fi_FI.UTF-8     LC_MONETARY=fi_FI.UTF-8    LC_MESSAGES=fi_FI.UTF-8   
 [7] LC_PAPER=C                 LC_NAME=C                  LC_ADDRESS=C              
[10] LC_TELEPHONE=C             LC_MEASUREMENT=fi_FI.UTF-8 LC_IDENTIFICATION=C       

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] markdown_0.5.4 kaRski_0.0.1   knitr_1.0.5   

loaded via a namespace (and not attached):
[1] digest_0.6.2   evaluate_0.4.3 formatR_0.7    stringr_0.6.2  tools_2.15.2