Datan esikäsittelyLaajuus (4 op)
Opintojakson tunnus: C-02504-TTC8030
Opintojakson perustiedot
- Laajuus
- 4 op
- Opetuskieli
- suomi
- Korkeakoulu
- Jyväskylän ammattikorkeakoulu
Osaamistavoitteet
Opintojakson jälkeen ymmärrät data-analytiikka prosessin ja sen tuomat haasteet. Osaat tunnistaa erilaiset dataformaatit, yleisimmät rajapintaratkaisut ja datan esikäsittelyssä käytetyt työkalut ja menetelmät. Lisäksi osaat soveltaa datan esikäsittelyssä tarvittavia menetelmiä. EUR-ACE-osaamiset: Tieto ja ymmärrys Tekniikan soveltaminen käytäntöön
Sisältö
o Erilaiset datalähteet ja -formaatit, JSON, APIt, SQL:stä taulujen haku jne o Muuttujatyypit o Datan esikäsittely ennen analysointiohjelmaan tuomista o Datan esikäsittely Pandasissa (Pandasin/DataFramen perusteet) o Eri datalähteiden yhdistäminen
Esitietovaatimukset
Tietotekniikan peruskäyttätaidot, ohjelmoinnin perusosaaminen, Python-ohjelmointikielen tunteminen ja osaaminen.
Arviointikriteerit, tyydyttävä (1)
Tyydyttävä 2: Hallitset datan hakemisen valitusta lähteestä. Osaat toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä. Osaat arvioida omia ratkaisujasi datan esikäsittelyssä. Välttävä 1: Tiedät ja ymmärrät datan merkityksen ja sen tuomat edut. Tiedät datan esikäsittelyn merkityksen ja yleisimmät menetelmät. Osaat soveltaa saamaasi dataan esikäsittelyssä käytettyjä yksinkertaisia menetelmiä.
Arviointikriteerit, hyvä (3)
Kiitettävä 4: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä laajasti. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä. Hyvä 3: Hallitset datan hakemisen useammasta lähteestä. Osaat suunnitella ja toteuttaa datan esikäsittelyn datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä. Osaat arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.
Arviointikriteerit, kiitettävä (5)
Erinomainen 5: Hallitset datan hakemisen erilaisista lähteistä. Osaat suunnitella ja toteuttaa datan esikäsittelyn erilaisille datajoukoille. Osaat soveltaa datan esikäsittelyssä käytettyjä menetelmiä erittäin laajasti. Osaat kriittisesti arvioida ja perustella omia ratkaisujasi datan esikäsittelyssä.