SciPy - fclusterdata() 方法
SciPy fclusterdata() 方法基于层次聚类执行距离矩阵运算并形成平面聚类。
平面聚类基于识别其特征的无监督机器学习。例如 - 在生物实验室中,不同类型的细胞指定其特征。
语法
以下是 SciPy fclusterdata() 方法的语法 −
fclusterdata(inp_data, t = int_value, criterion = 'metric_name')
参数
此方法接受以下参数 −
- inp_data:此参数存储给定输入数组的值。
- t = int_value:此参数指定如何切割层次树以创建平面簇。
- criterion = 'name':此参数用于设置不同的标准,如距离、病房等。这些可以用字符串表示。
返回值
此方法返回 n 维数组。请注意,标准用于形成平面集群。
示例 1
以下是展示 SciPy fclusterdata() 方法用法的基本示例。
from scipy.cluster.hierarchy import fclusterdata import numpy as np inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]]) res_clusters = fclusterdata(inp_data, t = 1.5, criterion='distance') print(res_clusters)
输出
上述代码产生以下结果 −
[1 3 4 5 2]
示例 2
此程序说明了链接方法,即ward(最小化簇的方差),并将 maxclust 设置为根据给定输入指定 3 个簇的标准。
from scipy.cluster.hierarchy import fclusterdata import numpy as np inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]]) res_clusters = fclusterdata(inp_data, t = 3, criterion='maxclust', method='ward') print(res_clusters)
输出
上述代码产生以下结果 −
[1 2 2 3 1]
示例 3
此示例将标准设置为不一致,将度量设置为余弦,以确定高维数据,可用于创建聚类,并将结果矩阵生成为不一致程度较小的值。
from scipy.cluster.hierarchy import fclusterdata import numpy as np inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]]) res_clusters = fclusterdata(inp_data, t=1.15, criterion='inconsistent', metric='cosine') print(res_clusters)
输出
上述代码产生以下结果 −
[1 1 1 1 1]