做最具实战的
数据科学职业社区

标签:聚类分析

R语言

R语言混合型数据聚类分析案例

wuxue阅读(1083)评论(0)

利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续型变量,这些文字并没有过多地介绍如何处理混合型数据(如同时包含连续型变量、名义型变量和顺序型变量的数据)。本文将利用 Gower 距离、...

分析与挖掘

数据挖掘也可以涂鸦吗?

数据科学网阅读(621)评论(0)

概念 监督学习、非监督学习、半监督学习、样本、基于实例的学习、词袋模型(Bag of word)、向量(Vector)、TF-IDF(词频-逆向文档频率)、特征工程、噪音、模型选择、cross_validation 交叉检验、概率图模型、数...

分析与挖掘

常见数据分析方法汇总

数据科学网阅读(733)评论(0)

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似...

Python

聚类分析实战解析与总结

数据科学网阅读(798)评论(0)

聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组,划分的原则是组内距离最小化而组间距离最大化,如下图所示: 常见的聚...

分析与挖掘

聚类分析案例之市场细分

sunshine阅读(1128)评论(1)

聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。 从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类...

分析与挖掘

一图让你1分钟了解数据分析与挖掘体系

wuxue阅读(741)评论(0)

总体上来讲,数据分析挖掘体系可分为数据预处理、分析挖掘、数据探索、数据展现和分析工具。 ▌数据预处理 •数据预处理包含数据清洗、数据集成、数据变换和数据规约几种方法。 •而数据清洗包括缺失值处理和异常值处理; •数据集成包括同名同义、异名同...

分析与挖掘

在数据分析过程中,你是否遇到这些坑?

wuxue阅读(608)评论(0)

数据分析学习的内容只多不少。说起数据分析师,可以称之为行业的IT农民工,也可被冠以IT界的行业咨询光环。在我看来,他更像是拥有扎实IT技术和宽阔行业视角的分析掌舵师。 数据分析的学习是个漫长且需要不断磨练的过程。 ▌在数据分析过程中,你是否...

分析与挖掘

数据挖掘与数据分析梳理

数据科学网阅读(967)评论(0)

一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通过自己的编程来实现需要掌握编程语言;而数...

分析与挖掘

数据挖掘常用的基本技术

数据科学网阅读(813)评论(0)

1. 统计学 统计学虽然是一门“古老的”学科,但它依然是最基本的数据挖掘技术,特别是多元统计分析,如判别分析、主成分分析、因子分析、相关分析、多元回归分析等。 2. 聚类分析和模式识别 聚类分析主要是根据事物的特征对其进行聚类或分类,即所谓...