Text Mining, 6 hp
Text Mining, 6 credits
732A92
Huvudområde
StatistikUtbildningsnivå
Avancerad nivåKurstyp
Fristående- och programkursExaminator
Marco KuhlmannKursansvarig
Marco KuhlmannStudierektor eller motsvarande
Peter DaleniusTillgänglig för utbytesstudenter
JaKontaktinformation
Isak Hietala
Kostas Mitropoulos, international coordinator
Kursen ges för | Termin | Veckor | Block | Språk | Ort/Campus | VOF | |
---|---|---|---|---|---|---|---|
Fristående kurs (Halvfart, Dagtid) | HT 2022 | 202244-202302 | 2 | Engelska | Linköping, Valla | ||
Fristående kurs (Halvfart, Dagtid) | HT 2022 | 202244-202302 | 2 | Engelska | Linköping, Valla |
Huvudområde
StatistikUtbildningsnivå
Avancerad nivåFördjupningsnivå
A1NSärskild information
Kursen är nedlagd. Gavs sista gången HT22. Ersätts av 732A81.
Examination erbjuds vid sammanlagt minst fem tillfällen per examinationsmoment.
Dessa tillfällen fördelas under minst två terminer från det sista ordinarie kurstillfället. Dessa finns i kursens sista aktuella Lisamrum.
Kontakta institutionen för att bli insläppt i kursens Lisamrum.
Förkunskapskrav
- 180 hp avslutade kurser varav 90 hp inom något av följande ämnen:
- statistik
- matematik
- tillämpad matematik
- datavetenskap
- teknik
- Godkända kurser i:
- kalkyl
- linjär algebra
- statistik
- programmering
- Engelska 6
Undantag ges för svenska
Lärandemål
Efter avslutad kurs skall den studerande på en avancerad nivå kunna:
- använda standardmetoder för informationssökning och informationsutvinning,
- tillämpa textbehandlingsmetoder för att förbereda dokument för statistisk modellering,
- tillämpa relevanta statistiska modeller för analys av textinformation och tolka resultat på ett korrekt sätt,
- använda statistiska modeller för prediktion av textinformation,
- utvärdera prestanda av statistiska modeller för textmaterialet.
Kursinnehåll
Kursen behandlar hur textinformation kan utvinnas, lingvistiskt bearbetas och därefter analyseras kvantitativt med formella statistiska metoder och modeller. Kursen utnyttjar expertkunskaper från databashantering, beräkningslingvistik och statistik.
Följande ämnen är inkluderade:
Introduktion till och överblick av kvantitativ textanalys och dess tillämpningar; Informationsutvinning; Webbcrawling; Informationssökning; Tf-idf; Vektorrymdsmodeller; Textbehandling; Bag of Words modellen; N-grams; Gleshet och utjämning för text; Dokumentklassificering; Sentimentanalys; Modellutvärdering; Topic modeller.
Undervisnings- och arbetsformer
Kursen består av föreläsningar, datorövningar och ett projekt. Föreläsningarna ägnas åt genomgång av koncept och metodik. Datorövningarna ägnas åt praktisk tillämpning av Text Mining redskapen. Projektarbetet ger praktisk erfarenhet av lösning av ett specifikt Text Mining problem. Utöver detta ska den studerande utöva självstudier.
Undervisningsspråk: engelska.
Examination
Skriftlig redovisning av projektarbetet. Skriftliga laborationsuppgifter. Detaljerad information återfinns i studiehandledningen.
Om det finns särskilda skäl, och om det med hänsyn till det obligatoriska momentets karaktär är möjligt, får examinator besluta att ersätta det obligatoriska momentet med en annan likvärdig uppgift.
Om LiU: s koordinator för studenter med funktionsnedsättning har beviljat en student rätt till anpassad examination vid salstentamen har studenten rätt till det.
Om koordinatorn har gett studenten en rekommendation om anpassad examination eller alternativ examinationsform, får examinator besluta om detta om examinator bedömer det möjligt utifrån kursens mål.
Examinator får också besluta om anpassad examination eller alternativ examinationsform om examinator bedömer att det finns synnerliga skäl och examinator bedömer det möjligt utifrån kursens mål.
Studerande, vars examination underkänts två gånger på kursen eller del av kursen, har rätt att begära en annan examinator vid förnyat examinationstillfälle.
Den som godkänts i prov får ej delta i förnyat prov för högre betyg.
Betygsskala
ECTS, ECÖvrig information
Planering och genomförande av kurs ska utgå från kursplanens formuleringar. Den kursvärdering som ska ingå i varje kurs ska därför behandla frågan om hur kursen överensstämmer med kursplanen.
Kursen bedrivs på ett sådant sätt att både mäns och kvinnors erfarenhet och kunskaper synliggörs och utvecklas.
Om det föreligger synnerliga skäl får rektor i särskilt beslut ange förutsättningarna för, och delegera rätten att besluta om, tillfälliga avsteg från denna kursplan.
Institution
Institutionen för datavetenskapKod | Benämning | Omfattning | Betygsskala |
---|---|---|---|
PRA1 | Examination | 3 hp | EC |
LAB1 | Laboration | 3 hp | EC |
Denna flik innehåller det material som är publikt i Lisam. Den information som publiceras här är inte juridiskt bindande, sådant material hittar du under övriga flikar på denna sida.
Det finns inga filer att visa.