首页

产品与服务

价格开放API 资讯中心帮助中心

400-800-9260

首页 / 产品运营 / 如何用聚类模型（k-means）做数据分析？

长链接缩短

微信外链

抖音卡片

活码系统

跳小程序

企微助手

广告加粉回传

链接域名

3durl.cn 绑定自有域名

专业的短链接生成工具

链接域名

3durl.cn 绑定自有域名

短网址有效期

如何用聚类模型（k-means）做数据分析？

更新时间：2025-8-23 05:46:54 作者：爱短链

编者按：由于数据对各行各业的人来说越来越重要，近年来有越来越多的数据分析方法。

在本文中，作者介绍了聚类模型，看看如何使用聚类模型（k-means）做数据分析。

在日常工作中，数据分析的方法经常被使用。

聚类模型看起来很简单，但实际上非常重要；作者分享了如何使用聚类模型进行数据分析。

让我们一起学习。

k-means无监督学习算法的内涵是观察无标签数据集，自动发现隐藏结构和层次，在无标签数据中寻找隐藏规律。

聚类模型在数据分析中的应用：它不仅可以作为一个单独的过程，也可以作为其他分析任务的前置探索，如分类。

比如我们想探索一下我们产品站有哪些社交行为群体，一开始拍脑门可能不容易。

此时，用户可以根据用户属性和行为进行聚类，每个群体可以根据结果定义为一种社会群体。

基于这些类别培训的后续分类模型，可以在标记后进行个性化的推荐和操作。

一、k-means算法与距离 K-means聚类的目标是按照一定的标准将n个观测数据点划分为k个聚类，数据点根据相似性进行划分。

每个聚类都有一个纹理，这是一个平均值得到聚类中所有点的位置，每个观测点都属于最近的纹理所代表的聚类。

模型最终会选择n个观测点到其聚类质心距离平方和(损失函数)最小的聚类方式作为模型输出，K-means在聚类分析中，特征变量需要数值变量来计算距离。

我们用距离来测量两个样本的相似性。

距离的本质是将两个具有多维特征数据的样本的比较映射成一个数字，可以通过这个数字的大小来衡量距离。

几种常见的距离计算方法：欧几里的距离-直线距离，不适合高维数据，对某一维度的大值差更敏感；曼哈顿距离——也被称为出租车距离，用标准坐标系上两点的绝对轴距总和，只计算水平或垂直距离，对某一维度的大值差不敏感； Hamming距离-可用于测量含有分类值的向量之间的距离；余弦距离——通过计算两个向量的夹角余弦值来评估相似度，适用于结果与数据中特征的比值无关的案例。

k-means本质是每次将质心移动到群中的所有点means在距离的基础上，它不是基于距离，而是基于最小化方差和。

方差正好是欧几里得的距离平方。

如果使用其他距离，但仍然最小化方差和，整个算法将无法收敛，因此k-means使用欧几里得的方法。

二、k-means算法原理第一步：数据归一化、离群处理后，随机选择k个聚类质心，k下一节的详细选择；第二步：将所有数据点关联划分为最接近自己的纹理，并在此基础上划分聚类；第三步：将纹理移动到包含所有数据点的当前分类聚类的中心(means)；重复第二步和第三步n次，直到所有点到其聚类质地的距离平方和最小。

多次随机：选择几种类型，然后开始根据不同的随机初始质地（第一步）尝试随机选择几种聚类质地：尝试1:第一步→第二步→第三步 … (重复2、3步~10次)→聚类方式1 尝试2：第一步→第二步→第三步 … (重复2、3步~10次)→聚类方式2 … 在所有的试验结果中，选择所有距离平方和(方差和)最小的聚类方法。

三、k值选择方法 K值的选择是k-means算法的重要一步，K价值选择方法包括肘部法则、头部拍摄法、gap statistic本文主要介绍肘部法则和轮廓系数gap statistic两种常用方法。

1. 肘部法则我们可以尝试不同的K值，将不同K值对应的损失函数画成折线，横轴为K值，纵轴为距离平方和定义的损失函数，距离平方和随K的增加而减小。

当K=5时，有一个拐点，就像人的肘部一样，当k

上一篇：那些思路清奇的增长方法…… 下一篇：B端数据运营，都是怎么做的？

相关搜索

创建短链接

注册与登录首先，访问爱短链的官方网站，点击右上角的“注册”按钮，填写相关信息完成注册。注册成功后，使用账号和密码登录到平台后台。登录过程简单快捷，支持微信扫码和手机验证码等多种方式。获取长链接在准备创建短链接之前，你需要先获取想要缩短的长链接。例如，在微信公众号后台，打开需要生成短链接的文章，将该文章的长链接复制到剪贴板中。生成短链接登录爱短链平台后，你会看到后台界面提供了多种功能选项。点击“短链”功能，将刚刚复制的长链接粘贴到指定的输入框中。爱短链还允许用户绑定自己的域名，使短链接更具个性化和辨识度。设置完成后，点击“生成短链接”按钮，平台会立即为你生成对应的短链接。使用短链接短链接生成后，你可以将其复制并粘贴到公众号推文中需要添加链接的位置，如正文内容、阅读原文链接、公众号菜单栏等。在正文中插入短链接时，可以搭配一些吸引人的引导语，如“点击下方链接查看更多精彩内容”或“详情请戳[短链接]”等，以提高用户的点击率。

爱短链

2025-02-20 14:33:23

抖音链接跳转微信

抖音链接跳转微信不仅为品牌营销和个人推广提供了更多可能性，也为用户带来了更加便捷、高效的信息获取和互动体验。在未来，随着社交电商的蓬勃发展和用户需求的不断变化，抖音链接跳转微信将成为越来越多用户的首选引流方式，助力品牌营销和个人推广迈向新的高度。

爱短链

2025-01-15 16:13:31

活码二维码生成器在线

活码二维码生成器在线工具如爱短链等，操作简单，无需复杂的技术知识。用户只需在网页上打开相应的生成器平台，按照提示进行操作即可。通常，用户需要输入想要关联的信息，如网址、文本、图片、文件等，然后选择一些个性化设置，即可快速生成一个活码二维码。

爱短链

2025-01-15 16:13:31

生成短链接的工具

长链接的繁琐与不便愈发凸显，而一款优秀的短链接生成工具则成为了信息高效传播的关键。爱短链，正是这样一款脱颖而出的卓越工具，为你带来前所未有的链接管理体验。

爱短链

2025-01-15 16:13:31

跳转卡片在线生成

爱短链平台提供高效的跳转卡片在线生成功能，用户可轻松定制卡片模板，填入链接与信息，即刻生成吸引眼球的跳转卡片，适用于社交媒体、营销活动等场景，助力提升点击率与营销效果，实现精准引流。

爱短链

2025-01-15 16:13:31

最通俗易懂的短链接原理讲解

看了看，想要了解短链接算法的伙伴还是蛮多的，那么今天爱短链小编就帮大家带来详细的介绍。

爱短链

2022-05-30 15:20:34

用户喜欢

缩短链接：链接在线一键秒缩短

缩短链接是一种将长网址转换为短网址的服务，通常用于社交媒体、短信、电子邮件等场合，以便更简洁地分享链接。以下是一些在线一键缩短链接的方法和工具：

爱短链

2025-02-19 10:16:16

网址简化：1秒简化网址

网址简化，也称为URL缩短，是指将冗长的网址转换为简短、易记的链接。以下是几种快速简化网址的方法：

爱短链

2025-02-19 10:16:16

网站链接太长怎么缩短

当遇到网站链接太长需要缩短的情况时，可以采取以下几种方法：

爱短链

2025-02-18 16:04:47

h5页面跳转微信小程序

H5页面跳转微信小程序的需求普遍存在，因为微信小程序只能在微信内部访问，而H5页面可以在任何浏览器中访问，因此需要通过跳转来实现两者之间的衔接。以下是H5页面跳转微信小程序的主要方式：

爱短链

2025-02-18 16:04:46

链接缩短，教程分享，一招把链接缩短

链接缩短是一个方便用户分享和访问长链接的有效方法。以下是一招把链接缩短的详细教程：

爱短链

2025-02-18 14:15:53

微信卡片链接生成

微信卡片链接是指在微信中分享的一个特定格式的链接，通过该链接可以展示网页或内容的相关信息，并以卡片的形式呈现给接收者。以下是生成微信卡片链接的详细步骤：

爱短链

2025-02-18 09:57:08

全平台跨域跳转微信工具，助力企业全渠道获客

爱发布客服-依依

公网安备32010402001342号

苏ICP备2021048188号-3

联系客服

购买咨询

免费试用

电话联系

公众号

TOP