首页 存档 技术 查看内容

机器学习算法应用中常用技巧-2

2018-3-30 13:00 |来自: 互联网 285 0

摘要: 7. 降维-PCA n_components为降到多少维,用原数据fit后,再用transform转换成降维后的数据。 8. 聚类-选择类别数 用 silhouette coefficient 计算每个数据到中心点的距离,-1 (dissimilar) to 1 (similar) 根据 ...

7. 降维-PCA

n_components为降到多少维,用原数据fit后,再用transform转换成降维后的数据。


8. 聚类-选择类别数

用 silhouette coefficient 计算每个数据到中心点的距离,-1 (dissimilar) to 1 (similar) 根据这个系数来评价聚类算法的优劣。


选择分数最大的个数作为聚类的类别数。



9. 恢复维度

例如数据,先经过 log,又经过 PCA降维, 要恢复回去,先用 pca.inverse_transform,再用 np.exp



数据变化:




10. 自定义accuracy

分类问题可以自己写accuracy的函数





全球人工智能近期经典文章推荐


声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除


路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部