∂y∂ω=e−(ωTx+b)(1+e−(ωTx+b))2x(2)
(2)
∂
y
∂
ω
=
e
−
(
ω
T
x
+
b
)
(
1
+
e
−
(
ω
T
x
+
b
)
)
2
x
∂2y∂ω∂ωT=∂∂ωT∂y∂ω=∂∂ωTe−(ωTx+b)(1+e−(ωTx+b))2x=e−(ωTx+b)(1−e−(ωTx+b))(1+e−(ωTx+b))3xxT=y(1−y)(1−2y)xxT(1)(2)(3)(3)
(1)
∂
2
y
∂
ω
∂
ω
T
=
∂
∂
ω
T
∂
y
∂
ω
(2)
=
∂
∂
ω
T
e
−
(
ω
T
x
+
b
)
(
1
+
e
−
(
ω
T
x
+
b
)
)
2
x
(3)
=
e
−
(
ω
T
x
+
b
)
(
1
−
e
−
(
ω
T
x
+
b
)
)
(
1
+
e
−
(
ω
T
x
+
b
)
)
3
x
x
T
(3)
=
y
(
1
−
y
)
(
1
−
2
y
)
x
x
T
矩阵
xxT
x
x
T
是半正定矩阵。而
y(1−y)(1−2y)
y
(
1
−
y
)
(
1
−
2
y
)
在
y∈(12,1)
y
∈
(
1
2
,
1
)
上是小于0的。所以Hessian矩阵并不能保证总是非负的,即函数(1)是非凸的。
l=∑i=1m(−yiβTx^i+ln(1+eβTx^i))(4)
(4)
l
=
∑
i
=
1
m
(
−
y
i
β
T
x
^
i
+
ln
(
1
+
e
β
T
x
^
i
)
)
∂l∂β=∑i=1m(−yix^i+eβTx^i1+eβTx^ix^i)(5)
(5)
∂
l
∂
β
=
∑
i
=
1
m
(
−
y
i
x
^
i
+
e
β
T
x
^
i
1
+
e
β
T
x
^
i
x
^
i
)
∂2l∂β∂βT=∂∂βT∂l∂β=∂∂βT∑i=1m(−yix^i+eβTx^i1+eβTx^ix^i)=∑i=1meβTx^i(1+eβTx^i)2x^ix^Ti(4)(5)(6)(6)
(6)
(4)
∂
2
l
∂
β
∂
β
T
=
∂
∂
β
T
∂
l
∂
β
(5)
=
∂
∂
β
T
∑
i
=
1
m
(
−
y
i
x
^
i
+
e
β
T
x
^
i
1
+
e
β
T
x
^
i
x
^
i
)
(6)
=
∑
i
=
1
m
e
β
T
x
^
i
(
1
+
e
β
T
x
^
i
)
2
x
^
i
x
^
i
T
因为
eβTx^i(1+eβTx^i)2>0
e
β
T
x
^
i
(
1
+
e
β
T
x
^
i
)
2
>
0
,矩阵
x^ix^Ti
x
^
i
x
^
i
T
半正定,所以
∂2l∂β∂βT
∂
2
l
∂
β
∂
β
T
也是半正定的,所以函数(4)是凸函数。
发表评论 取消回复