Analýza signálů II

4. úloha - Klasifikace EEG

V této části využijete příznaky vypočtené v úloze č. 3 Extrakce popisných příznaků z EEG a k nim příslušné klasifikační třídy. Nad těmito daty vytvoříte klasifikační model, který poté využijete k odhadu klasifikačních tříd pro osobu č. 5, pro kterou klasifikační třídy k dispozici nemáte.

Doporučený postup řešení

  1. Vyberte si 3 různé typy klasifikátorů, viz https://www.mathworks.com/help/stats/classification.html. Experimentovat můžete případně také s nástrojem Classification Learner.
  2. Data pro osoby 1 až 4 budou využita pro nalezení optimálního typu klasifikátoru a případně i pro nastavení jeho parametrů (týká se pouze některých typů klasifikátorů, u kterých je možné měnit různé parametry modelu). Toto lze provést např. skrze tzv. leave-one-out crosvalidaci (LOOCV), což znamená, že data jedné osoby vždy použijeme jako testovací sadu a data všech zbývajících osob jako sadu trénovací. Takto postupně projdeme všechny osoby. Alternativou je spojit data ze všech 4 osob a poté využít krosvalidaci a rozdělit je do N skupin. Pro oba případy platí, že na trénovací sadě naučíme klasifikátor, který poté otestujeme na sadě testovací, a spočítáme výslednou přesnost klasifikace. Toto postupně provedeme pro všechny testovací části a spočítáme průměrnou klasifikační přesnost. Takto zjistíme, který z testovaných klasifikátorů se nejlépe hodí pro náš problém a jakou můžeme očekávat výslednou přesnost klasifikace nad posledním záznamem (osoba č. 5).
  3. U nejlepšího typu klasifikátoru je možné zkoušet měnit jeho nastavení (pokud to příslušný typ klasifikátoru umožňuje) a takto optimalizovat jeho výkonnost.
  4. Jeden výsledný klasifikátor použijeme pro finální klasifikaci. Nejdříve jej naučíme na příznaky osob č. 1 až 4 (všechny příznaky spojíme do jedné matice, to stejné provedeme i pro klasifikační třídy) a tak získáme jeden generalizovaný klasifikační model. Ten poté použijeme na příznaky osoby č. 5 a získáme výsledný vektor klasifikačních tříd.

Výstup

Výsledné predikované klasifikační třídy pro osobu č. 5 prosím uložte do textového CSV souboru, např. s využitím funkce writematrix, a odešlete na adresu vaclav.gerla@cvut.cz

Odeslaný soubor by měl obsahovat přesně 903 řádků a na každém z nich bude hodnota 0, nebo 1. Příklad výstupu (pouze náhodné hodnoty) je zobrazen v souboru klasifikace.csv.

Nad výsledky bude poté spočtena přesnost klasifikace (shoda vaší predikce a skutečné třídy od spánkového experta). Finální výsledky budou uvedeny v souboru výsledky.xlsx. Pokud nebudete s výsledkem spokojeni, můžete provést nový odhad a opět jej zaslat na adresu vaclav.gerla@cvut.cz (k dispozici máte maximálně 10 pokusů).

Pro získání plného počtu bodů je potřeba dosáhnout přesnosti klasifikace alespoň 75%. Dále by jste měli být schopni své řešení popsat - zejména jaký jste použili klasifikátor a jak jste řešení validovali (např. jak jste data rozdělili na trénovací a testovací část).

Všechna řešení budou v závěru semestru vizuálně porovnána společně s hodnocením od spánkového experta.