DAT110 Innføring i dataanalyse og -visualisering

Studiepoeng:10

Ansvarlig fakultet:Fakultet for realfag og teknologi

Emneansvarlig:Alexander Johannes Stasik

Campus / nettbasert:Undervises campus Ås

Undervisningens språk:Engelsk, norsk

Frekvens:Årlig

Forventet arbeidsmengde:Undervisning 78 timer, øvelser 26 timer, forberedelse av presentasjoner 96 timer, kollokvier og egenstudier m.m. 50 timer.

Undervisnings- og vurderingsperiode:Emnet starter i vårparallellen. Emnet har undervisning/vurdering i vårparallellen.

Om dette emnet

Innføring i grunnleggende dataanalyse med moderne analyseverktøy

- Datatyper og innlesing av data fra ulike filformater.

- Visualisering og eksplorativ analyse for identifikasjon av struktur og trender (histogrammer, scatterplott, box-plott m.m.).

- Ulike mål på middeltall og spredning (gjennomsnitt, median, varians m.m.).

- Korrelasjon og kovarians (på enkeltvariable og data på matriseform).

- Krysstabeller.

- Enkel normalfordelingsteori, normaliserende transformasjoner og test av normalitet.

- Geometriske fordelinger, binomiske fordelinger, Poisson-fordelinger.

- Inferens (parametriske og ikke-parametriske for undersøkelse av ett og to utvalg) og enkel variansanalyse.

- Minste kvadraters metode (lineære modeller og polynomtilpasninger)

- Logistisk regresjon (klassifikasjon med to grupper).

- Glatting av tidsavhengige data.

- Klusteranalyse (k-means, hierarkisk klusteranalyse m.m.).

Dette lærer du

Ferdigheter og innsikt i grunnleggende teknikker for dataanalyse generert via moderne datafangst. I tillegg vil fokus gies til ferdigheter som er relevant for arbeidslivet som gruppearbeid og presentasjoner.

Studenten skal lære om hvilke analysemetoder som passer til

1) Eksplorativ dataanalyse (plotting/visualisering og enkle beskrivende statistiske måltall),

2) Visualisering,

3) Inferens,

4) Modellering og prediksjon med kontinuerlige og kategoriske responser (regresjon (enkel og multippel) og klassifikasjon) og validering av prediktive modeller.

5) Innføring i klusteranalyse og glatting av tidsseriedata.

  • Læringsaktiviteter
    Undervisningen består av forelesninger, og øvinger med og uten datamaskin (med bistand fra øvingslærere og emneansvarlig). Det er obligatorisk oppmøte 4 timer per uke. Det anvendes student-aktiv læring.
  • Læringsstøtte
    Veiledning under øvingstimer.
  • Pensum
    Pensumlitteratur, hjelpelitteratur, pensumoversikt m.m. oppgis på kursets hjemmeside.
  • Forutsatte forkunnskaper

    MATH111/MATH121 Kalkulus 1

    INF120 Programmering og databehandling

  • Vurderingsordning, hjelpemiddel og eksamen
    Skriftlig eksamen, 3,5 timer. A-F.

    Skriftlig eksamen Karakterregel: Bokstavkarakterer Hjelpemiddel: B1 Utdelt kalkulator, ingen andre hjelpemidler
  • Sensorordning
    Ekstern sensor deltar sammen med intern sensor ved utformingen av eksamensoppgavene og sensorveiledningen. Ekstern sensor kontrollerer intern sensors vurdering av et tilfeldig utvalg kandidater som en kalibrering med visse mellomrom i henhold til instituttets retningslinjer for sensur.
  • Obligatorisk aktivitet
    Obligatoriske innleveringsoppgaver og 2 dobbelttimer obligatorisk oppmøte per uke. Regler for godkjenning av obligatorisk aktivitet kunngjøres ved kursstart.
  • Undervisningstider
    Forelesninger: 2 timer/uke. Forelesning/øving: 2 timer/uke. Øvinger: 2 timer/uke
  • Overlapp

    5 stp med STAT100

    10 stp med MATH-INF110

  • Opptakskrav
    Realfag