Többváltozós lineáris regresszió, klasszifikáció, logisztikus regresszió

Több input-változós lineáris regresszió

Hipotézisfüggvény változó esetén:

Vektoros alakban:

Költségfüggvény változó esetén:

Feature scaling

Az input változók azonos nagyságrenre hozása

  • intervallumra min-max skálázás
  • sztenderdizálás (ez preferált)

Klasszifikáció

Példa: kategorizáljuk a fényképeket a rajta szereplő állatok szerint.

Pl. "kutya" = 1, "macska" = 2, "papagáj" = 3

Ekkor a regresszióval ez a baj: macska = 0.5 * "kutya" + 0.5 * "papagáj"

Ehelyett valószínűséget fogunk becsülni

  • Mennyi a valószínűsége, hogy egy mintaelem az adott kategóriába tartozik?

Bináris klasszifikáció

A becslés folytonos érték, és mivel valószínűséget becslünk, a címkék gyakorlatban folytonos értékek, így megpróbálkozhatunk lineáris regresszióval.

Sigmoid függvény

A lineáris regresszió nem ideális klasszifikációs feladatokhoz, mert nagyon érzékeny a kiugró értékekre.

Használhatunk inkébb sigmoid függvényt:

Logisztikus regresszió:

Logisztikus regresszió

Itt már a mean squared error költségfüggvény nem lesz konvex, ha a az új -et behelyettesítjük.

Itt inkább ezt használjuk (cross entropy):

Ezután használhatjuk a gradiens módszert.

Források