Bevezetés a gépi tanulás feladataiba és fajtáiba

Bevezetés a gépi tanulás feladataiba és fajtáiba

Gépi tanulás lényege

A feladat konkrét megoldási algoritmusának ismerete nélkül tanuljuk meg megoldani a feladatot.

Mintapéldák segítségével adjuk meg, hogy mi a feladat helyes megoldása
Egy paraméteres modellhez keresünk olyan paramétereket melyekkel a modell helyesen oldja meg a feladatot.

Milyen feladatokra alkalmazható?

Ha közelítően optimális megoldás is megfelelő.
Ha nem ismert konkrét algoritmus, ami megoldja a feladatot.
Ha nem gazdaságos egyedi algoritmust fejleszteni a problémára.
Ha a feladatot csak mintapéldák segítségével tudjuk formálisan definiálni.

Példa: Különböző objektumok pozíciójának detektálása fényképen.

Milyen feladatokra nem ideális?

Ha a probléma hatékony megoldása ismert és könnyen algoritmizálható.
Ha a közelítő eredmény nem elégséges.

Példák:

Veszteségmentes tömörítés
Rendezés
A legtöbb pontosan definiált szabályrendszer szerint működő szoftver.

Gépi tanulási módszerek

Módszerek három főbb csoportja:

Felügyelt tanulás
Felügyeletlen tanulás
Megerősítéses tanulás

Felügyelt tanulás

Adott: A tanítóminta (training set), input-címke párok halmaza

${(x^{(1)}, y^{(1)}), \dots, (x^{(m)}, y^{(m)})} x \in X \subset R^{n}, y \in Y \subset R^{k}$ (a zárójeles felső index nem hatvány, hanem az elemeinek indexe)

Feladat: A címke (az elvárt output) minél jobb becslése az inputból.

Azaz, keresünk olyan $h_{θ}$ függvényt (hipotézisfüggvény), melyre:

$h_{θ} (x) = \overset{y}{^} \approx y$ (a hipotézisfüggveny x inputból becsli az y címkét.)

Példa 1

Becsüljük meg az autók számát egy adott városban, ha ismerjük a város lakosságának számát.

$x$ : egy adott város lakosságának száma
$y$ : egy adott városban megtalálható autók száma

Milyen hipotézisfüggvényt keressünk? Az autók száma közel arányos a város lakosságának számával

$⟹$ lineáris hipotézisfüggvény:

$y \approx \overset{y}{^} = h_{θ} (x) = θ x$

$θ$ a hipotézisfüggvény paramétere, ebben az esetben az egyenes meredeksége lesz...

Példa 2

A mintaelemek nem feltétlenül egy input és egy címkéből állnak... Becsüljük meg a képen látható emberek életkorát.

$x$ : egy kép (színes, rögzített felbontás) $y$ : a fényképen található személy életkora.

Milyen hipotézisfüggvényt keressünk?

A lineáris hipotézisfüggvény nem biztos, hogy a legjobb választás...

Helyette, használjunk egy igazán bonyolult függvényt, egy konvolúciós mély neuronhálót!

A felügyelt tanulás két fő feladata

Regresszió: Folytonos értékű címke (a címkehaémaz végtelen) \ver Y \vert = \infty Példa: Autók számának, vagy életkor becslése

Klasszifikáció: Diszkrét értékű címke (véges címkehaémaz) $∣ Y ∣ \leq \infty$ Példa: Mintaelemek kategorizálása, mi a foglalkozása a képen szereplő személynek?

Hogyan állapítjuk meg mennyire jó a becslés?

$J$ költségfüggvény segítségével. $J : θ \to R_{\geq 0}$

A költségfüggvény megadja, hogy mennyire tér el a valódi címke és a becslésük adott paraméter értékek esetén.

Például: $J (θ) = ∣ h_{θ} (x) - y ∣$

Keressük azokat a $θ^{*}$ paramétereket, melyekkel a $h_{θ} (x)$ hipotézisfüggvényünk jól közelíti meg a velódi címkét, azaz a $J$ költségünk minimális.

$θ^{*} = ar g θ min J (θ)$

Megkeressük (tanuljuk) az optimális paramétereket a tanítóhalmazon, majd új, címkézetlen adathoz is tudunk becsülni címkét a betanított modellel.

A felügyelt tanulás alkalmazásai

Objektumdetektálás, képszegmentálás
- $x$ : egy fénykép
- $y$ : A képen található objektumok köré írt téglalap koordinátái, az objektum kategóriái, vagy pixel szintű kategóriatérkép.
2D / 3D humán pózbecslés képről
- $x$ : egy fénykép
- $y$ : A képen található személyek ízületeinek 2D vagy 3D koordinátái
Optical Flow becslés - két képkocka pixeleinek megfeleltetése egymással
- $x$ : Egy videó két egymást követő képkockája
- $y$ : Az első képkocka minden pixeléreegy-egy elmozdulásvektor, amely a második képkocka valamelyik pixelére mutat.

A felügyelt tanulás problémája:

Az állatok / emberek általában nem szorulnak ra konkrét ${(x, y)}$ input-output párok jelenlétére, ahhoz, hogy tanuljanak.
A címkézett adat előállítása nagy mértékű humán munkát igényelhet, címkézetlen adat viszont rengeteg van.

Felügyeletlen tanulás

Címke hiányában a feladat nem egyértelmű...

Többféle konkrét feladat lehetséges:

Klaszterezés: Valamilyen hasonlósági reláció alapján a mintaelemek csoportosítása.
Tömörítés: Az adat jellegének ismeretében sokkal jobb tömörítési ráták érhetőek el, mint a hagyományos algoritmusokkal.
Példagenerálás: Új, az adatbázishoz hasonló mintaelemek generálása (a minta eloszlásának tanulása)

Klaszterezés

Marketing, célzott reklám, ajánlórendszerek: hasonló ügyfelek csoportosítása célozott ajánlatokhoz.
Klasszikus computer vision, pl. képszegmentálás
Anomális (outlier) detektálás

Tömörtés / dimenziócsökkentés

Bizonyos fajta adat jellegéhez illeszkedő tömörítés
Kevesebb tárhely, sávszélesség használat.
Tömörebb reprezentációval sokszor könnyebb dolgozni és könnyebb lehet megtalálni a hasonló elemeket.
2-3 dimenziós reprezentációban a mintaelemek elhelyezése még vizualizálható is.

A tömörítés / dimenzió redukció feladata jól definiált, azonban a hatékony tömörítés kihasználja, hogy a tömörített adatok hasonló jellegűek. Sok különböző fajta adat tömörítéséhez nehéz lenne egyedi algoritmusokat írni.

Feladat formális megadása

$x$ : Az input $h$ ? A tömörítést végző hipotézisfüggvény, pl. egy autoenkoder neuronháló.

$h_{θ} (x) = \overset{x}{^} \approx x$

$J$ költség: $\overset{x}{^}$ közelítse meg minél jobban $x$ -et (jó rekonstrukció)

Felügyeletlen tanulás alkalmazásai

Zajcsökkentés
Intelligens felskálázás
Példagenerálás
DeepFake
Kódgenerálás
Szöveggenerálás

Megerősítéses tanulás

Markov Döntési Folyamat (MDP)

$(x, y)$ input-címke párok helyett $(s, a)$ állapot-akció párok.
Az akciónk nagyban befolyásolja a következő állapotunkat.
$J$ költség helyett $r$ jutalom (nem feltétlen azonnal)
Cél: hosszútávon maximalizáljuk a jutalmak összegét

Példa: Automata autó

$s$ - állapot: Az autó sebessége, az autó környezete $\dots$
$a$ - akció: Gázpedás, fékpedál, kormény forgása $\dots$
$r$ - jutalom:
- Eljutottunk a célhoz $\to$ nagy jutalom
- Elütöttünk valakit $\to$ nagy büntetés
- Nem tartottuk be a sebességhatárt $\to$ kisebb büntetés

A mesterséges intelligencia főbb kérdései

Általánosító képesség: A betanult modellünk memorizálja a tanító példákat egyenként, vagy valóban “hasznos” dolgokat tanul?

Magyarázhatóság: A kritikus alkalmazásokban használt szoftvereket behatóan tesztelik, formálisan verifikálják sokszor.
A deep learning módszerei csak tapasztalati úton tesztelhetők, nem tudjuk róluk megmondani, hogy “logikus módon” hozták-e a döntéseiket $\dots$
Boztonság - adversarial attack: Akár a neuronháló architektúrája és paramétereinek ismerete nélkül kereshető kismértékű speciális zaj, mellyel módosítva az inputot, a becslés drasztikusan változik.

Szoftver

Python

Magas szintű
Automatikus memóriakezelés
Futásidejű típushozzárendelés és ellenőrzés
Interpretált nyelv
Egyszerű szintaxis
Hordozható
Rengeteg eszköz, könyvtár

Szóval kényelmes és gyors fejlesztést tesz lehetővé, de lassú végrehajtás és futásidőben kiderülő hibák.

A számításigényes műveleteinket hatékony, más nyelven írt könyvtárak segítségével valósítjuk meg. A Python-t csak a szkriptelésükre használjuk!

NumPy

Vektorizált programozás, vektorműveletek.
- A grafikus kártyák a vektorizált műveletekre optimalizáltak.
- A gépi tanulásban használt műveletek szinte mindig vektorizálhatóak.
- A vektorizált programozással írt kód általában sokkal tömörebb.
Egy tömb elemének hivatkozása
$N$ dimenziós tömbök
Broadcasting

4. félévi jegyzetek