做最具实战的
数据科学职业社区

标签:R语言

R语言

10个令人相见恨晚的R语言包

数据科学网阅读(2135)评论(0)

作者:yhat 大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。 和其他语言(比如Python和Java)相比,R可以更模...

R语言

R语言机器学习之核心包nnet

wuxue阅读(1124)评论(0)

神经网络是深度学习的基础。 本文介绍R做机器学习核心包:nnet 一、nnet包介绍 nnet包实现了前馈神经网络和多项对数线性模型。前馈神经网络是一种常用的神经网络结构,如下图所示。 前馈网络中各个神经元按接受信息的先后分为不同的组。每一...

Python

一篇文章告诉你,该学R还是Python

wuxue阅读(921)评论(0)

对于想从事数据行业的人和数据工作者来说,是学习R还是python,哪个工具更实用一直被大家争论。Martijn Theuwissen,DataCamp的教育专家详细比较了这两个工具。 ython和R是统计学中两种最流行的的编程语言,R的功能...

R语言

新手由浅入深学习R语言路线

数据科学网阅读(784)评论(0)

现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言。 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去...

R语言

R语言混合型数据聚类分析案例

wuxue阅读(1083)评论(0)

利用聚类分析,我们可以很容易地看清数据集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续型变量,这些文字并没有过多地介绍如何处理混合型数据(如同时包含连续型变量、名义型变量和顺序型变量的数据)。本文将利用 Gower 距离、...

R语言

R语言数据分析实战:数据结构(2)

lavondadyring阅读(648)评论(0)

4、数据框 由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。它与你通常在SAS、SPSS和Stata中看到的数据集类似。数据框将是你在R语言中最常处理的数据结构。 表2-1所示的病例数据集包含了数值型...

R语言

R语言数据分析实战:数据结构(1)

lavondadyring阅读(736)评论(0)

一、数据集的概念 数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。表2-1提供了一个假想的病例数据集。 不同的行业对于数据集的行和列叫法不同。统计学家称它们为观测(observation)和变量(variable),数据库分析...

Hadoop

实现R与Hadoop联合作业的三种方法

数据科学网阅读(645)评论(0)

实现R与Hadoop的联合作业,R就拥有了在分布式文件系统(HDFS)上处理大数据的能力。本文的目的就是阐述实现二者联合作业的不同技术。但同时,这几种方法也各有利弊。 为了满足用R语言处理pb量级数据的需求,我们需要把它和Hadoop联合起...

分析与挖掘

数据挖掘与数据分析梳理

数据科学网阅读(967)评论(0)

一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通过自己的编程来实现需要掌握编程语言;而数...