Többváltozós lineáris regresszió, klasszifikáció, logisztikus regresszió
Több input-változós lineáris regresszió
Hipotézisfüggvény változó esetén:
Vektoros alakban:
Költségfüggvény változó esetén:
Feature scaling
Az input változók azonos nagyságrenre hozása
- intervallumra min-max skálázás
- sztenderdizálás (ez preferált)
Klasszifikáció
Példa: kategorizáljuk a fényképeket a rajta szereplő állatok szerint.
Pl. "kutya" = 1, "macska" = 2, "papagáj" = 3
Ekkor a regresszióval ez a baj: macska = 0.5 * "kutya" + 0.5 * "papagáj"
Ehelyett valószínűséget fogunk becsülni
- Mennyi a valószínűsége, hogy egy mintaelem az adott kategóriába tartozik?
Bináris klasszifikáció
A becslés folytonos érték, és mivel valószínűséget becslünk, a címkék gyakorlatban folytonos értékek, így megpróbálkozhatunk lineáris regresszióval.
Sigmoid függvény
A lineáris regresszió nem ideális klasszifikációs feladatokhoz, mert nagyon érzékeny a kiugró értékekre.
Használhatunk inkébb sigmoid függvényt:
Logisztikus regresszió:
Logisztikus regresszió
Itt már a mean squared error költségfüggvény nem lesz konvex, ha a az új -et behelyettesítjük.
Itt inkább ezt használjuk (cross entropy):
Ezután használhatjuk a gradiens módszert.