8. Előadás

8. Előadás
- Multilayer perceptron
- Források

Multilayer perceptron

Az előző előadáson leírt neuronokat rétegekbe rendezzük, így egy komplexebb modell hozva létre.
$Θ = {W_{1}, b_{1}, W_{2}, b_{2}, \dots}$ : súlymátrixok és bias vektorok halmaza.
- $W_{k} \in R^{S_{k} \times S_{k - 1}}$
- $b_{k} \in R^{S_{k}}$
- ahol $S_{k}$ a $k .$ rétegben található neuronok száma.

Kétrétegű neuronháló hipotézisfüggvénye

$h (x) = g_{2} (W_{2} g_{1} (W_{1} x + b 1) + b_{2}) = \overset{y}{^} \approx y$

Költségfüggvények egyelőre maradnak.
- Klasszifikáció: logistic loss
- Regresszió: MSE
A $g_{1}$ és $g_{2}$ aktivációs függvények fontosak, mert nemlinearitást adnak a hipotézisfüggvényhez, amely lehetővé teszi a tanulást. (különben nem nől a kifelyező erő, csak bonyolultabb lineáris regressziót kapunk)

Aktivációs függvények

sigmoid
tanh
ReLU

Mit tanul egy neuronháló?

Mit tanul egyetlen neuron?
- Egyetlen lineáris döntési felületet (hiszen logisztikus regresszióról van szó)
A neuronháló ezen lineáris döntési felületek valamilyen kombinációját tanulja

Multiclass

Ebben az esetben az $y$ nem egy skalár, hanem egy vektor.
Multiclass klasszifikációnál használjuk a softmax függvényt az utolsó rétegen

Források

Diasor