- A+
所属分类:python基础入门
混淆矩阵
二分类问题的混淆矩阵
以癌症为例,0代表未患病,1代表患病,有10000个人:
癌症问题的混淆矩阵
精准率和召唤率
代码实现
scikitlearn中的精准率和召回率
调和平均值F1_score
调和平均数具有以下几个主要特点:
①调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。
②只要有一个标志值为0,就不能计算调和平均数。
调用sikit-learn中的f1_score
Precision-Recall的平衡
一般来说,决策边界为theta.T*x_b=0,即计算出p>0.5时分类为1,如果我们手动改变这个threshold,就可以平移这个决策边界,改变精准率和召回率
精准率和召回率曲线
可以用precisions-recalls曲线与坐标轴围成的面积衡量模型的好坏
使用scikit-learn绘制Precision-Recall曲线
横轴fpr,纵轴tpr
ROC曲线围成的面积越大,说明模型越好,不过ROC曲线没有Precision-Recall曲线那样对偏斜的数据的敏感性
多分类问题
scikit-learn中处理多分类问题的准确率
多分类问题的混淆矩阵
多分类问题的混淆矩阵解读方式与二分类问题一致,第i行第j列的值就是真值为i、预测值为j的元素的数量
颜色越亮的地方代表数值越高
绘制错误率矩阵
plt.matshow(err_matrix,cmap=plt.cm.gray)plt.show()
亮度越高的地方代表错误率越高
那么你看懂了嘛
我的微信公众号
爱真理,得永生! 爱在灵灵久博客,网罗天下,福利大家!