Big Data Analytics, 6 hp

Big Data Analytics, 6 credits

TDDE31

Huvudområde

Informationsteknologi Datateknik Datavetenskap

Utbildningsnivå

Avancerad nivå

Kurstyp

Programkurs

Examinator

Patrick Lambrix

Studierektor eller motsvarande

Patrick Lambrix

Undervisningstid

Preliminär schemalagd tid: 42 h
Rekommenderad självstudietid: 118 h

Tillgänglig för utbytesstudenter

Ja
VOF = Valbar / Obligatorisk / Frivillig
Kursen ges för Termin Period Block Språk Ort/Campus VOF
6CDDD Civilingenjör i datateknik 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CDDD Civilingenjör i datateknik (AI och maskininlärning) 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CDDD Civilingenjör i datateknik (Medicinsk informatik) 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CITE Civilingenjör i informationsteknologi 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CITE Civilingenjör i informationsteknologi (AI och maskininlärning) 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CITE Civilingenjör i informationsteknologi (Medicinsk informatik) 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CMJU Civilingenjör i mjukvaruteknik 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6CMJU Civilingenjör i mjukvaruteknik (AI och maskininlärning) 8 (VT 2019) 2 3 Engelska Linköping, Valla V
6MICS Computer Science, masterprogram 2 (VT 2019) 2 3 Engelska Linköping, Valla V
6MICS Computer Science, masterprogram (Artificiell intelligens och data mining) 2 (VT 2019) 2 3 Engelska Linköping, Valla V
6MDAV Datavetenskap, masterprogram 2 (VT 2019) 2 3 Engelska Linköping, Valla V

Huvudområde

Informationsteknologi, Datateknik, Datavetenskap

Utbildningsnivå

Avancerad nivå

Fördjupningsnivå

A1X

Kursen ges för

  • Masterprogram i datavetenskap
  • Masterprogram i Computer Science
  • Civilingenjör i datateknik
  • Civilingenjör i informationsteknologi
  • Civilingenjör i mjukvaruteknik

Rekommenderade förkunskaper

Grundläggande databaskurs. Data mining eller maskininlärning. 

Lärandemål

Efter avslutad kurs skall den studerande på en avancerad nivå kunna:
- samla och lagra Big Data i en distribuerad datormiljö
- genomföra grundläggande förfrågningar till en databas som opererar på ett distribuerat filsystem
- redovisa grundläggande principer för parallella beräkningar
- använda MapReduce begreppet för att parallellisera vanliga databearbetningsalgoritmer
- redovisa hur vanliga maskininlärningsmodeller bör modifieras för att bearbeta Big Data
- använda redskap för maskininlärning av Big Data

Kursinnehåll

Kursen fokuserar på huvudbegrepp och huvudredskap för lagring, bearbetning och analys av Big Data som är nödvändiga för ett professionellt arbete och forskning inom dataanalys. 

- Introduktion till Big Data: begrepp och verktyg
- Grundläggande principer av parallella beräkningar
- Filsystem och databaser för Big Data
- Förfrågningar för Big Data
- Resurshantering i en klustermiljö
- Parallella beräkningar för Big Data
- Maskininlärning för Big Data

Undervisnings- och arbetsformer

Kursen består av föreläsningar och laborationer. Föreläsningarna behandlar teori, begrepp och metoder.  Laborationerna ger praktisk erfarenhet i hantering av big data.
 

Examination

LAB1Laborationer3 hpU, G
TEN1Skriftlig tentamen3 hpU, 3, 4, 5

Betygsskala

Fyrgradig skala, LiU, U, 3, 4, 5

Kurslitteratur

Artikelsamling.

Övrig information

Fortsättningskurser/kompletterande kurser: Svensk översättning saknas

Om undervisningsspråk

Undervisningsspråk visas på respektive kurstillfälle på fliken "Översikt".

  • Observera att även om undervisningsspråk är svenska kan delar av kursen ges på engelska.
  • Om undervisningsspråk är Svenska/Engelska kan kursen i sin helhet ges på engelska vid behov.
  • Om undervisningsspråk är Engelska ges kursen i sin helhet på engelska. 

Övrigt

Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.

Planering och genomförande av kurs skall utgå från kursplanens formuleringar. Den kursvärdering som ingår i kursen skall därför genomföras med kursplanen som utgångspunkt. 

Institution

Institutionen för datavetenskap

Studierektor eller motsvarande

Patrick Lambrix

Examinator

Patrick Lambrix

Kurshemsida och andra länkar

http://www.ida.liu.se/~TDDE31/

Undervisningstid

Preliminär schemalagd tid: 42 h
Rekommenderad självstudietid: 118 h

Kurslitteratur

Övrigt

  • Artikelsamling 2018.
Kod Benämning Omfattning Betygsskala
LAB1 Laborationer 3 hp U, G
TEN1 Skriftlig tentamen 3 hp U, 3, 4, 5

Övrigt

Artikelsamling 2018.
I = Introducera, U = Undervisa, A = Använda
I U A Moduler Kommentar
1. ÄMNESKUNSKAPER
1.1 Kunskaper i grundläggande matematiska och naturvetenskapliga ämnen (kurser på G1X-nivå)
X
Grundläggande matematiska begrepp
1.2 Kunskaper i grundläggande teknikvetenskapliga ämnen (kurser på G1X-nivå)
X
X
LAB1
TEN1
Programmering, modellering, databasteknik
1.3 Fördjupade kunskaper, metoder och verktyg inom något av: matematik, naturvetenskap, teknik (kurser på G2X-nivå)
X
X
LAB1
TEN1
databaser, parallelprogrammering, maskininlärning
1.4 Väsentligt fördjupade kunskaper, metoder och verktyg inom något av: matematik, naturvetenskap, teknik (kurser på A1X-nivå)

                            
1.5 Insikt i aktuellt forsknings- och utvecklingsarbete

                            
2. INDIVIDUELLA OCH YRKESMÄSSIGA FÄRDIGHETER OCH FÖRHÅLLNINGSSÄTT
2.1 Analytiskt tänkande och problemlösning
X
X
LAB1
TEN1
Modellering, algoritmdesign
2.2 Experimenterande och undersökande arbetssätt samt kunskapsbildning
X
X
LAB1
Datorlaborationer
2.3 Systemtänkande
X
X
LAB1
TEN1
Utifrån ett problem välja modell och lösning
2.4 Förhållningssätt, tänkande och lärande
X
X
LAB1
TEN1
Kreativt och kritiskt tänkande
2.5 Etik, likabehandling och ansvarstagande
X
TEN1
Research-related content
3. FÖRMÅGA ATT ARBETA I GRUPP OCH ATT KOMMUNICERA
3.1 Arbete i grupp
X
LAB1
LabLaborationer i grupps in pairs
3.2 Kommunikation
X
LAB1
Skriftlig rapport för varje laboration
3.3 Kommunikation på främmande språk

                            
4. PLANERING, UTVECKLING, REALISERING OCH DRIFT AV TEKNISKA PRODUKTER OCH SYSTEM MED HÄNSYN TILL AFFÄRSMÄSSIGA OCH SAMHÄLLELIGA BEHOV OCH KRAV
4.1 Samhälleliga villkor, inklusive ekonomiskt, socialt och ekologiskt hållbar utveckling
X
LAB1
Laborationsdata  från SMHI
4.2 Företags- och affärsmässiga villkor

                            
4.3 Att identifiera behov samt strukturera och planera utveckling av produkter och system
X
X
LAB1
TEN1
Modelering
4.4 Att konstruera produkter och system
X
X
LAB1
algoritmdesign
4.5 Att realisera produkter och system
X
X
LAB1
implementation
4.6 Att ta i drift och använda produkter och system

                            
5. PLANERING, GENOMFÖRANDE OCH PRESENTATION AV FORSKNINGS- ELLER UTVECKLINGSPROJEKT MED HÄNSYN TILL VETENSKAPLIGA OCH SAMHÄLLELIGA BEHOV OCH KRAV
5.1 Samhälleliga villkor, inklusive ekonomiskt, socialt och ekologiskt hållbar utveckling inom forsknings- och utvecklingsprojekt

                            
5.2 Ekonomiska villkor för forsknings- och utvecklingsprojekt

                            
5.3 Att identifiera behov samt strukturera och planera forsknings- eller utvecklingsprojekt

                            
5.4 Att genomföra forsknings- eller utvecklingsprojekt

                            
5.5 Att redovisa och utvärdera forsknings- eller utvecklingsprojekt

                            

Denna flik innehåller det material som är publikt i Lisam. Den information som publiceras här är inte juridiskt bindande, sådant material hittar du under övriga flikar på denna sida.

Det finns inga filer att visa.