在R语言中,我们使用`cluster`包来进行聚类分析,并使用`ggplot2`包进行可视化展示。以下是一个简单的示例:
首先,我们需要加载必要的库:
```R
# 加载所需的库
library(cluster)
library(ggplot2)
```
然后,我们使用`kmeans`函数进行聚类分析。假设我们有一组数据,我们想要将其分为3个聚类:
```R
# 创建数据
- data <
- data.frame(Age = c(18, 25, 30, 40, 45, 50),
Income = c(50000, 60000, 70000, 80000, 90000, 100000))
# 进行聚类分析
- cluster_result <
- kmeans(data, centers = 3)
```
在这个例子中,`kmeans`函数的`centers`参数设置为3,表示我们将数据分为3个聚类。
接下来,我们可以使用`plot`函数绘制聚类结果的散点图:
```R
# 可视化聚类结果
plot(cluster_result$cluster, data[, -1])
```
在这个例子中,`plot`函数的第一个参数是聚类结果的标签(即每个样本的聚类),第二个参数是数据框中的变量(即我们的数据集)。`-1`表示我们不关心这个变量。
最后,我们可以使用`ggplot`函数将散点图转换为热力图:
```R
# 将散点图转换为热力图
- p <
- ggplot(data, aes(x=Age, y=Income)) + geom_point() + theme_minimal()
p + geom_tile(color="white", fill="#f3f3f3") + labs(title="Heatmap of KMeans Clustering", x="Age", y="Income")
```
在这个例子中,我们使用了`geom_tile`函数来生成热力图。`color="white"`表示颜色为白色,`fill="#f3f3f3"`表示填充色为浅灰色。
以上就是在R语言中实现聚类分析和可视化展示的基本步骤。