7. 降维-PCAn_components为降到多少维,用原数据fit后,再用transform转换成降维后的数据。 8. 聚类-选择类别数用 silhouette coefficient 计算每个数据到中心点的距离,-1 (dissimilar) to 1 (similar) 根据这个系数来评价聚类算法的优劣。 选择分数最大的个数作为聚类的类别数。
9. 恢复维度例如数据,先经过 log,又经过 PCA降维, 要恢复回去,先用 pca.inverse_transform,再用 np.exp 数据变化:
10. 自定义accuracy分类问题可以自己写accuracy的函数
全球人工智能近期经典文章推荐 |