逻辑回归的理解与python示例

逻辑回归(2018-11-4) 注:根据唐宇迪老师视频总结,如有侵权,请联系本人
一、逻辑回归相关概念 1.1逻辑回归解决的问题
之前一章分析了线性回归的解决方法,是通过误差的高斯分布来推演出的损失函数,但是存在数据样本是否符合分布的问题,在逻辑回归中.使用了sigmoid函数将线性问题转化为非线性的二分类任务,这样的好处是不用考虑误差分布,直接通过变换进行概率求解.
1.2 sigmoid函数
表达式:

特点:

  • 自变量取值为任意实数,值域[0,1].
  • 将任意的输入映射到[0,1]的区间,物理上可以解释为由值到概率的转换.
逻辑回归的理解与python示例
文章图片
sigmiod函数 逻辑回归实现思想:
  • 定义预测函数(将线性函数代入sigmiod函数):

    其中 .这里面的就是线性回归问题中的要求得函数.
    预测函数可以看做将函数转换到[0,1]区间上,以概率分布的模式表达结果.
    所以在分类任务中,可以假设以下公式成立:


将(2),(3)式合并后得到:

1.3求解过程示例
根据(4)式求得似然函数:

再对(5)式求对数似然,目的是将复杂度较高的乘法替换为简单的加法:

  • 由于梯度是上升的,若求为最大值,则可以引入转为求梯度下降的任务.自此,就可以通过梯度下降的方法获得近似解了.
求解过程:

【逻辑回归的理解与python示例】在中对求偏导:
逻辑回归的理解与python示例
文章图片

下面详细对的求导过程做解释:
  • 对于分数类导数,求导公式为:
  • 由于


    所以对求导的过程如下:
    逻辑回归的理解与python示例
    文章图片

    然而
所以,结合(7),(11),(12)式,得出下式结论:
逻辑回归的理解与python示例
文章图片

其中,
公式化简后,就可以使用梯度下降的方法对参数进行迭代更新,最终获得一个最优的

其中 是步长,(13)式的结论是梯度下降的方向,最后求解的最优解.
1.4python实例 数据:考试成绩,每组两门课,如果被录取则标记为1,未录取则为0.
目的:根据已有数据评估新数据是否会被录取.
思想:在已有数据上进行逻辑回归训练,获得理想的值.
数据:
成绩1 成绩2 是否录取
34.623660 78.024693 0
30.286711 43.894998 0
35.847409 72.902198 0
60.182599 86.308552 1
79.032736 75.344376 1
简单起见,只取了代码中的五组数据,仅做示范.
step 1 构造sigmoid函数(根据(0)式)
def sigmoid(z): return 1 / (1 + np.exp(-z))

step 2 构造预测函数(根据(1)式)
def model(X, theta):return sigmoid(np.dot(X, theta.T))

step 3 构造损失函数(根据(1)式)
def cost(X, y, theta): left = np.multiply(-y, np.log(model(X, theta))) #print(left.shape) right = np.multiply(1 - y, np.log(1 - model(X, theta))) #print(right.shape) return np.sum(left - right) / (len(X))

step 4 求出的梯度方向(根据(13)式)
def gradient(X, y, theta): grad = np.zeros(theta.shape) error = (model(X, theta)- y).ravel()for j in range(len(theta.ravel())): term = np.multiply(error, X[:,j]) grad[0, j] = np.sum(term) / len(X)return grad

step 5 运用梯度下降方法求得最优解(根据(14式))
def descent(data, theta,y,thresh,alpha): #梯度下降求解 i = 0 # 迭代次数 costs = [cost(data, y, theta)] # 损失值while True: grad = gradient(data, y, theta) theta = theta - alpha*grad # 参数更新 costs.append(cost(data, y, theta)) # 计算新的损失 i += 1 if i>thresh: break return theta, i-1, costs, grad

step6 代入数据,进行运算
data=https://www.it610.com/article/np.array([[1,34.623660,78.024693],[1,30.286711,43.894998],[1,35.847409,72.902198], [1,60.182599,86.308552],[1,79.032736,75.344376]]) y=np.array([0,0,0,1,1]).reshape(-1,1) theta=np.array([[0.5,0.5,0]]) theta, iter, costs, grad= descent(data, theta,y, 100, 0.00001)

    推荐阅读