Skip to content

感知机

  • 二分类的线性分类模型
  • 模型:f(x)=sign(w·x+b)w,权值向量(weight vector);b,偏置(bias)。对应于输入空间中的分离超平面。
    • 损失函数:对应于所有点到分离超平面的总距离。
    • L(w,b)=yi(w·xi+b)
  • 策略:最小化损失函数
  • 算法:基于随机梯度下降法对损失函数的最优化算法。
    • 学习率0<η1
    • 原始形式
      • wk=wk1+ηyixi
      • bk=bk1+ηyi
    • 对偶形式
      • αi=niη
  • 收敛性(Novikoff定理):当训练数据集线性可分时。扩展权值向量w^=(wT,b)T,输入向量扩展x^=(x,1)i=1,2,...N
    • (1) 存在||w^opt||=1,使超平面w^opt·x^=wopt·x+bopt=0将训练数据集完全正确分开,且存在γ>0,使yi(w^opt·x^)=yi(woptxi+b)γ
    • (2) 误分类次数k满足: k(Rγ)2,其中R=max{||xi^||}
    • 定理证明

Released under the MIT License.