SciPy - fclusterdata() 方法

SciPy fclusterdata() 方法基于层次聚类执行距离矩阵运算并形成平面聚类。

平面聚类基于识别其特征的无监督机器学习。例如 - 在生物实验室中，不同类型的细胞指定其特征。

语法

以下是 SciPy fclusterdata() 方法的语法 −

fclusterdata(inp_data, t = int_value, criterion = 'metric_name')

参数

此方法接受以下参数 −

inp_data:此参数存储给定输入数组的值。
t = int_value:此参数指定如何切割层次树以创建平面簇。
criterion = 'name':此参数用于设置不同的标准，如距离、病房等。这些可以用字符串表示。

返回值

此方法返回 n 维数组。请注意，标准用于形成平面集群。

示例 1

以下是展示 SciPy fclusterdata() 方法用法的基本示例。

from scipy.cluster.hierarchy import fclusterdata
import numpy as np

inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]])
res_clusters = fclusterdata(inp_data, t = 1.5, criterion='distance')
print(res_clusters)

输出

上述代码产生以下结果 −

[1 3 4 5 2]

示例 2

此程序说明了链接方法，即ward(最小化簇的方差)，并将 maxclust 设置为根据给定输入指定 3 个簇的标准。

from scipy.cluster.hierarchy import fclusterdata
import numpy as np

inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]])
res_clusters = fclusterdata(inp_data, t = 3, criterion='maxclust', method='ward')
print(res_clusters)

输出

上述代码产生以下结果 −

[1 2 2 3 1]

示例 3

此示例将标准设置为不一致，将度量设置为余弦，以确定高维数据，可用于创建聚类，并将结果矩阵生成为不一致程度较小的值。

from scipy.cluster.hierarchy import fclusterdata
import numpy as np

inp_data = np.array([[10, 20], [30, 40], [50, 60], [70, 80], [10, 0]])
res_clusters = fclusterdata(inp_data, t=1.15, criterion='inconsistent', metric='cosine')
print(res_clusters)