SciPy - fclusterdata() 方法

SciPy fclusterdata() 方法基于层次聚类执行距离矩阵运算并形成平面聚类。

平面聚类基于识别其特征的无监督机器学习。例如 - 在生物实验室中,不同类型的细胞指定其特征。

语法

以下是 SciPy fclusterdata() 方法的语法 −

fclusterdata(inp_data, t = int_value, criterion = 'metric_name')

参数

此方法接受以下参数 −

  • inp_data:此参数存储给定输入数组的值。
  • t = int_value:此参数指定如何切割层次树以创建平面簇。
  • criterion = 'name':此参数用于设置不同的标准,如距离、病房等。这些可以用字符串表示。

返回值

此方法返回 n 维数组。请注意,标准用于形成平面集群。

示例 1

以下是展示 SciPy fclusterdata() 方法用法的基本示例。

from scipy.cluster.hierarchy import fclusterdata
import numpy as np

inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]])
res_clusters = fclusterdata(inp_data, t = 1.5, criterion='distance')
print(res_clusters)

输出

上述代码产生以下结果 −

[1 3 4 5 2]

示例 2

此程序说明了链接方法,即ward(最小化簇的方差),并将 maxclust 设置为根据给定输入指定 3 个簇的标准。

from scipy.cluster.hierarchy import fclusterdata
import numpy as np

inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]])
res_clusters = fclusterdata(inp_data, t = 3, criterion='maxclust', method='ward')
print(res_clusters)

输出

上述代码产生以下结果 −

[1 2 2 3 1]

示例 3

此示例将标准设置为不一致,将度量设置为余弦,以确定高维数据,可用于创建聚类,并将结果矩阵生成为不一致程度较小的值。

from scipy.cluster.hierarchy import fclusterdata
import numpy as np

inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]])
res_clusters = fclusterdata(inp_data, t=1.15, criterion='inconsistent', metric='cosine')
print(res_clusters)

输出

上述代码产生以下结果 −

[1 1 1 1 1]

scipy_reference.html