8. Előadás

Multilayer perceptron

  • Az előző előadáson leírt neuronokat rétegekbe rendezzük, így egy komplexebb modell hozva létre.
  • : súlymátrixok és bias vektorok halmaza.
    • ahol a rétegben található neuronok száma.

Kétrétegű neuronháló hipotézisfüggvénye

  • Költségfüggvények egyelőre maradnak.
    • Klasszifikáció: logistic loss
    • Regresszió: MSE
  • A és aktivációs függvények fontosak, mert nemlinearitást adnak a hipotézisfüggvényhez, amely lehetővé teszi a tanulást. (különben nem nől a kifelyező erő, csak bonyolultabb lineáris regressziót kapunk)

Aktivációs függvények

  • sigmoid
  • tanh
  • ReLU

Mit tanul egy neuronháló?

  • Mit tanul egyetlen neuron?
    • Egyetlen lineáris döntési felületet (hiszen logisztikus regresszióról van szó)
  • A neuronháló ezen lineáris döntési felületek valamilyen kombinációját tanulja

Multiclass

  • Ebben az esetben az nem egy skalár, hanem egy vektor.
  • Multiclass klasszifikációnál használjuk a softmax függvényt az utolsó rétegen

Források