Data Mining and Statistical Learning, 15 hp
Data Mining and Statistical Learning, 15 credits
732A33
Huvudområde
StatistikUtbildningsnivå
Avancerad nivåKurstyp
Fristående- och programkursKursen ges för | Termin | Veckor | Språk | Ort/Campus | VOF | Obs! | |
---|---|---|---|---|---|---|---|
Fristående kurs (Helfart, Dagtid) | HT 2014 | 201444-201403 | Engelska | Linköping | INSTÄLLD |
Huvudområde
StatistikUtbildningsnivå
Avancerad nivåFördjupningsnivå
A1XFörkunskapskrav
För tillträde till kursen krävs det att den studerande har ett kandidatexamen med lägst 90 hp, dvs. 18 månader heltidsstudier, i matematik, tillämpad matematik, statistik eller datavetenskap. Matematikkurserna på grundnivå bör inkludera såväl kalkyl som linjär algebra. Utöver detta, erfordras kurser på grundnivå i grundläggande statistik och datavetenskap. Engelska B eller motsvarande.Lärandemål
Kursen lägger grunden för ett professionellt arbete och forskning där stora datavolymer undersöks, modifieras, modelleras och utvärderas för att upptäcka tidigare okända mallar och trender.
Efter avslutad kurs skall den studerande kunna:
- redovisa principer av statistisk modellering, speciellt för analyser av stora datamängder
- använda redskap i SAS miljö för att utforska stora och komplexa datamängder, skapa datadrivna modeller, utvärdera deras utfall och använda sådana modeller för prediktion.
- jämföra prestanda av statistiska och data mining modeller för att välja den mest relevanta modellen i ett givet sammanhang.
Kursinnehåll
- grundläggande begrepp i statistical learning, speciellt inom övervakad inlärning
- modellvalsstrategier som använder tränings- validerings- och testmängder och modellvalet med hjälp av korsvalidering
- linjär regression och krympningsmetoder
- splines och kernelmetoder
- beslutsträd och klassificeringsmetoder såsom diskriminantanalys och logistisk regression
- neurala nätverk, supportvektormaskiner och generaliserade additiva modeller
- samspelsmetoder, inklusive bagging och boosting
- Bayesianska metoder i data mining
Undervisnings- och arbetsformer
Kursen består av föreläsningar, datorövningar och seminarier. Föreläsningarna ägnas åt genomgång av teori, koncept och metodik. Datorövningarna ägnas åt praktisk dataanalys i SAS miljö (som regel) eller i andra miljöer (i undantagsfall). Seminarier ägnas åt studentpresentationer och diskussioner av uppgifter.
Språk: Engelska
Examination
Skriftlig redovisning av labbuppgifter. Obligatorisk närvaro på seminarierna. En skriftlig tentamen.
Betygsskala
ECTS, ECÖvrig information
Planering och genomförande av kurs skall utgå från kursplanens formuleringar. Den kursvärdering som skall ingå i varje kurs skall därför behandla frågan om hur kursen överensstämmer med kursplanen. Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.Institution
Institutionen för datavetenskapDet finns inga examinationsmoment att visa.
Denna flik innehåller det material som är publikt i Lisam. Den information som publiceras här är inte juridiskt bindande, sådant material hittar du under övriga flikar på denna sida.
Det finns inga filer att visa.