测量群集性能
现实世界的数据不是自然地组织成许多独特的群集。 由于这个原因,要想象和推断推理并不容易。 这就是为什么需要测量聚类性能及其质量。 它可以在轮廓分析的帮助下完成。
轮廓分析
该方法可用于通过测量群集之间的距离来检查聚类的质量。 基本上,它提供了一种通过给出轮廓分数来评估像集群数量这样的参数的方法。 此分数是衡量一个群集中每个点与相邻群集中的点的距离的度量。
分析轮廓分数得分范围为[-1,1]。 以下是对这个分数的分析 -
得分为+1分 - 得分接近+1表示样本距离相邻集群很远。
得分为0分 - 得分0表示样本与两个相邻群集之间的决策边界处于或非常接近。
得分为-1分 - 得分为负分数表示样本已分配到错误的群集。
计算轮廓分数
在本节中,我们将学习如何计算轮廓分数。
轮廓分数可以通过使用以下公式来计算 -
//更多请阅读:https://www.yiibai.com/ai_with_python/ai_with_python_unsupervised_learning_clustering.html
|