Data Mining and Statistical Learning, 15 hp

Data Mining and Statistical Learning, 15 credits

732A33

Kursen är nedlagd.
Alla nedanstående kurstillfällen är inställda.

Huvudområde

Statistik

Utbildningsnivå

Avancerad nivå

Kurstyp

Fristående- och programkurs
VOF = Valbar / Obligatorisk / Frivillig
Kursen ges för Termin Veckor Språk Ort/Campus VOF Obs!
Fristående kurs (Helfart, Dagtid) HT 2014 201444-201403 Engelska Linköping INSTÄLLD

Huvudområde

Statistik

Utbildningsnivå

Avancerad nivå

Fördjupningsnivå

A1X

Förkunskapskrav

För tillträde till kursen krävs det att den studerande har ett kandidatexamen med lägst 90 hp, dvs. 18 månader heltidsstudier, i matematik, tillämpad matematik, statistik eller datavetenskap. Matematikkurserna på grundnivå bör inkludera såväl kalkyl som linjär algebra. Utöver detta, erfordras kurser på grundnivå i grundläggande statistik och datavetenskap. Engelska B eller motsvarande.

Lärandemål

Kursen lägger grunden för ett professionellt arbete och forskning där stora datavolymer undersöks, modifieras, modelleras och utvärderas för att upptäcka tidigare okända mallar och trender.

Efter avslutad kurs skall den studerande kunna:
- redovisa principer av statistisk modellering, speciellt för analyser av stora datamängder
- använda redskap i SAS miljö för att utforska stora och komplexa datamängder, skapa datadrivna modeller, utvärdera deras utfall och använda sådana modeller för prediktion.
- jämföra prestanda av statistiska och data mining modeller för att välja den mest relevanta modellen i ett givet sammanhang.

Kursinnehåll

- grundläggande begrepp i statistical learning, speciellt inom övervakad inlärning
- modellvalsstrategier som använder tränings- validerings- och testmängder och modellvalet med hjälp av korsvalidering
- linjär regression och krympningsmetoder
- splines och kernelmetoder
- beslutsträd och klassificeringsmetoder såsom diskriminantanalys och logistisk regression
- neurala nätverk, supportvektormaskiner och generaliserade additiva modeller
- samspelsmetoder, inklusive bagging och boosting
- Bayesianska metoder i data mining

Undervisnings- och arbetsformer

Kursen består av föreläsningar, datorövningar och seminarier. Föreläsningarna ägnas åt genomgång av teori, koncept och metodik. Datorövningarna ägnas åt praktisk dataanalys i SAS miljö (som regel) eller i andra miljöer (i undantagsfall). Seminarier ägnas åt studentpresentationer och diskussioner av uppgifter.
Språk: Engelska

Examination

Skriftlig redovisning av labbuppgifter. Obligatorisk närvaro på seminarierna. En skriftlig tentamen.

Betygsskala

ECTS, EC

Övrig information

Planering och genomförande av kurs skall utgå från kursplanens formuleringar. Den kursvärdering som skall ingå i varje kurs skall därför behandla frågan om hur kursen överensstämmer med kursplanen. Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.

Institution

Institutionen för datavetenskap

Det finns inga examinationsmoment att visa.

Det finns ingen kurslitteratur tillgänglig på studieinfo för den här kursen.

Denna flik innehåller det material som är publikt i Lisam. Den information som publiceras här är inte juridiskt bindande, sådant material hittar du under övriga flikar på denna sida.

Det finns inga filer att visa.