当前课程知识点:R语言数据分析 >  中部:执具 >  第6章 基础编程——用别人的包和函数讲述自己的故事 >  6.1 编程环境

返回《R语言数据分析》慕课在线视频课程列表

6.1 编程环境在线视频

下一节:6.2Mini案例

返回《R语言数据分析》慕课在线视频列表

6.1 编程环境课程教案、知识点、字幕

大家好

欢迎来到《R语言数据分析》课程

在咱们前面的课程里面

跟大家简单引荐了一下R语言这个工具

从今天开始我们展开讲R语言的具体知识

首先讲一下咱们R语言的知识体系

尤其是对其中的编程环境这个知识点

简单交流一下

《R语言数据分析》这门课在北邮应该

已经开设了七八轮了

基本上每一次开设的时候都有同学会问

究竟学会了哪些知识才算掌握了R语言

因为R语言本身是一个开源的工具

相对来说 没有说有一本书

将整个这个知识体系进行

非常全面系统的梳理

我们能看到很多专著 很多教材

网上能看到很多资料

但经常是相对比较零散的

那我们先看一看R语言究竟应该包含哪些内容

学会了哪些知识才算掌握了R语言

我现在借用一下亚里士多德的三段论

就是首先一个大前提

其实我们所有的计算机语言程序都是什么

都两部分

一个算法

一个数据结构

我们简单理解就是什么

一部分是实体

一部分是过程

那既然R语言也不过是计算机语言的一种

那毫无疑问

它应该也是符合这么一个逻辑的

我们其实可以通过这个逻辑来看一看

R语言的知识体系应该包含哪些部分

也就是说

假如我将R语言

视为计算机语言的一种的话

那其实我可以把其中的知识体系分成两部分

一部分是什么

一部分是实体 即数据对象

另外一部分什么 过程

就是基础编程

分成两部分

当然 对于其他语言来讲

可能数据结构 算法

这个逻辑过程可能是并列的

对于(专用于)数据分析的R语言而言

它其实数据对象所占的分量更重一点

为什么

作为一门数据分析的语言

毫无疑问

研究对象就是数据本身

在整个这个数据分析的过程中

其实数据对象在编(代)码的过程中

数据对象是最最关键的

应该讲

假如说非要给它一个比例的话

可能基础编程只占到百分之二三十的样子

然后这个数据对象的掌握可能要占到百分之七八十

我们具体看一下

这个R语言的一个知识体系

或者说我们这门课想讲解的一个内容体系

我还是把它分成两部分

一部分是基础编程

跟这个过程相关的

另外一部分什么

数据对象

与这个实体相关的

在讲基础编程的时候

我们首先会讲一下这个R的运行机制

它是怎么运行的

和我们以前比如学过的C呀

Java呀等等

其他一些高级编程语言相比

它有什么相同的地方

有什么不同的地方

就是运行机制这一块

先做一个简单交代

当然也会讲一下这个编程环境怎么配置

这也是我们今天

这次课接下来这主要的内容

在讲完这个最基本的这个运行机制

和编程环境的配置之后

我们要进入这个具体

基础编程的具体内容

首先我们会讲这个R那个代码的组成

会讲R语言编代码一个最基本的法则

是什么

就是所谓的R编程

其实是什么

用别人的包和函数 讲述你自己的故事

它由两部分组成

一个是用别人包和函数

第二个什么

讲述自己的故事

所以我们围绕这一个核心思想

在讲基础编程的时候

首先会讲 扩展包

怎么找

函数怎么调用

就是如何用别人包和函数

当然重点还是要讲述自己的故事

怎么讲自己的故事

其实写一套自己的逻辑

所以我就得掌握这里面最基本的控制流

就是顺序 分支 循环

怎么把这个逻辑表达出来

当然

函数在R语言里面也是非常非常重要的

如何编写自己的函数

包括二元操作符

本质上也是一个函数

面向对象在R里面一个最直接的体现是 泛型函数

这里面就组成了我们所谓的

基础编程的一个主体内容

在讲完这个基础编程之后

我们重点讲这个什么

数据对象

当然在R里面数据对象很多

真正需要掌握的

或者说需要重点掌握的

我们是将它分成三组六类

第一组 向量+因子

第二组 矩阵+数组

第三组 列表+数据框

应该讲 掌握了这三组六类数据对象的话

基本上数据分析的通常任务

不管是做工程项目也好

还是做科学研究也好

基本上是没有问题的

这是我们整个这个R语言的内容体系

是我们接下来课程的一个脉络

或者是一个导航

当然今天我们主要讲一下这个

运行机制和编程环境的问题

在我们前面课程里面讲到了

其实R的话

你下载完之后就是这么一个窗口

就这么一个窗口

非常简单

但这个窗口里面又能蹦出

各种各样的好的结果出来

无论是学习到的模型

识别出来的模式

发现的规律

包括这个具体的一些可视化的展示

其实都是通过什么

这么一个小窗口出来的

那究竟是怎么出来的

或者这个机制是什么

我们可以简单来看一下

其实我们写的都是什么

都是一行行的代码

所谓的脚本

因为R也好 Python也好 Matlab也好

它都是什么 都是脚本语言

就是一行行的什么 代码

将这个代码交给刚才我们看到这个小窗口

然后它就出了什么

我们看到了各种各样的结果

无论是在窗口里面直接输出的这个模型也好

还是什么

还是那些可视化的图形

所以它就是把什么

把代码放到窗口里面来

然后自动就执行了

就得到结果了

所以它这个运行过程非常简单 非常直接

毫无疑问 它和我们以前学过一些编程语言

是有一些区别的

比如说我以这个Java为例

Java的话你可能得先什么

先有这个源代码

人看懂源代码

先得编译成什么

字节码class

.class文件

然后我再交给什么

Java虚拟机 交给这个执行机构

然后再来执行

但是R的话就不是了

R就是什么

直接将什么

直接将这个代码交给这个执行机构

然后它就执行了

当然这里面在本质上讲

它其实就是一个翻译执行机构

后面它可能得变成什么

还是得变成计算机读得懂的语言

包括最后的二进制

对不对

但是这都属于 冰面以下的内容

我们不用管它

我们所能看得到

就是把代码交给这个执行机构

执行机构出结果

这是我们R执行的一个最基本的过程

所以说假如我要做R编程的话

其实我们只要有两部分就可以

第一部分我得有个地方怎么样

编这个代码

另外一部分是什么

我有R这个这个工具

来执行这个代码就可以

这也是编码

编程环境一个最基本的组成部分

首先得有一个编辑源代码的一个工具

然后一个执行源代码的一个工具

执行源代码

就是我们下载的这个R

所谓编辑源代码工具

最基本的

比如我们windows的话

我就用这个记事本就可以

只要是不带格式的纯文本的都可以作为什么

都可以作为编辑源代码的工具

当然我们假如后面要

通过这个R语言做数据分析的话

毫无疑问我们需要一些什么

比较顺手的 比较专业的

集成的开发环境

所谓的IDE 就专用的什么

R语言的数据分析工具

在我们这门课里面只推荐一个

就是RStudio

当然有很多这个开发环境

很多IDE可供选择

我们这边只推荐这个RStudio

一旦下载完之后

这个RStudio

我们看一下它其实这个环境

和我们前面那个R Console相比的话

那就差别很大了

这边 我们刚才看到这个窗口

蹦出来的小窗口

几乎就是一个丑小鸭

然后一旦通过这个RStudio来编代码的话

一看就显得比较高大上了

就不那么low了

是不是

和前面这个R Console相比

那简直就是一个天上一个地下

前面这个几乎就像那个丑小鸭

这边已经变成一个白天鹅了

但是我想说的是什么

要配置好这么一个RStudio

其实它步骤非常简单

看起来非常高大

没那么low

但其实步骤非常简单

只有两步就可以

第一步什么

第一步

先上我们这个什么www.r-project.org

就是R的官方的网站

先download R

并且一直什么

按照这个默认设置

一直安装就可以

直到OK就可以了

直到Finish

第二步是什么

上我们这个RStudio这个相应的网站

然后下载最新版的RStudio

这个当然一般我们推荐下载这个解压缩文件

解压缩之后直接

解压缩到本地

这两步完成之后

我们这个RStudio就配置完了

所以这么一个高大上的编程环境

其实配置起来非常简单

是不是 两个步骤先下载R

然后在下载RStudio就可以了

一旦下载完之后

我们打开RStudio

发现它一般由四个部分组成

由四个部分组成

当然这四个部分位置是可以调整的

我们推荐大家按照这么一种方式来布局

第一部分是什么

源代码的组织管理

因为我们写R代码的时候

都要以.R为扩展名来结束的

作为一个一个的文件

如何具体组织这个源代码

比如说哪些.R文件属于同一个项目

把它放在一起

这个时候就作为文件夹的方式放在哪

就放在我这个源代码的组织管理这一部分

这就像我们那个资源管理器是一样的

左侧就是那个路径

文件夹的一层一层那个层级

右侧这一块

是什么

是我们的主体了

是什么呢

就是我编辑源代码的地方

我们刚才讲了

因为R的执行过程其实就是什么

就是把源代码交给R Console

然后它就执行了

那好 非常重要一点

就是我需要一个地方来编辑我的源代码

这就是我们源代码编辑的一个窗口

编辑完之后

你按这个什么按这个Run这个按钮

当然你也可以定一些快捷键

直接将它什么

就在下面这个R Console里面将它执行了

编代码 执行代码

当然在执行代码过程中

里面可能有一些什么有些数据对象等等

它都在这里面列出来

比如说这里面有一个数据框的话

你一点那它又在这边显示出来

所以我们可以看得出来

这是我们RStudio编代码一个最基本的过程

首先我要建立一个.R文件

当然按照不同的项目我来组织好

然后开始写代码

然后执行代码

对吧

那这里面就是执行担代码过程中一些记录

这是我们RStudio一个最基本的功能的布局

当然这个时候我们要和前面的比较一下

就是和我的R Console相比

它究竟是什么关系

我们还是看这个RStudio

我们一旦将其中的什么这个选项 (Tools => Global Options)

这个窗口打开的话

你会发现什么

它其实是嵌进了谁

我们这个R Console

就我们下载这个R其实就在这里面

也就是说本身的RStudio在里面

它是包住了

把这个什么把这个R Console包进来了

把这个R Console包进来了

包在哪

包这个位置

就刚才我们这个R就包在这个位置

所以我们就基本理清楚了

RStudio和R Console的关系

其实什么

RStudio是一个包好的一个什么

R Console

也就是说他在这里面编辑源代码的时候

组织文件的时候

确实更加方便了

但本质上就是什么

就是一个编辑代码代码的地方

然后交给什么

R Console来执行

所以我们在安装RStudio的时候

毫无疑问应该是先安装R Console

然后再安装RStudio

因为你在安装RStudio的时候需要

在运行RStudio的时候需要把这个R Console给包进来

我们简单总结一下

就是所谓的RStudio其实相当于什么

相当于是一个记事本

再加上一个R Console

就我们刚才看到的右上部分这一块

但它比我们一般的记事本功能强大一点

因为它是个专用的代码编辑器

所以它有这个语法高亮

有代码补全

比如你输了两三个字符之后

它后面自动就联想出来了

然后自动排版

等等等等功能都有

R Console和我们前面看到的单独的R是一样的

完全没有区别

除此之外

这个主体功能有编辑代码有运行代码的功能之外

还有什么

还有比如说我们文件的组织

数据的查看 代码调试等等

它都有一些非常好的支持

这就是我们RStudio它的一个本质

咱们重新温习一下

就这个RStudio编程环境的配置

分两步从这个www.r-project.org

这个官网上download R

然后从RStudio这个官网上把RStudio下载下来

并且解压缩

有两个细节供大家参考

第一个什么

就是R Console的话

安装的R话

其实我们建议大家安装在C盘

假如我们用的是那个windows操作系统的话

安装在C盘

并且是将这个可执行文件下载下来之后

一直点击就可以了

然后RStudio的话

我们是建议下载这个免安装版

就是直接用这个zip

而不是一个可执行(的安装)文件了

而是一个可解压缩的文件

解压缩到你的什么

D盘适当的一个位置

比如说你专门建了一个什么

一个数据分析的一个路径一个目录

这种方式比较合适的

在安装那个RStudio的时候

大家一定要注意

就是相应的解压缩文件的路径里面不能有中文

并且

相应的一些配置文件里面也不能有中文

不能有中文

一旦有中文会出现什么情况

比如说这是一有中文的一个表现

是什么

你发现你点其中的一个什么

其中一个菜单

它还是空白的

整个这个界面是空白的

点完之后这边出现一个什么小点

出现一个小点

这是我们在初次使用这个RStudio的时候

因为我们中文它不是特别好处理

所以我们建议大家

在整个这个路径里面千万不要包含中文

避免出现这种问题

一般来讲我们这个安装过程都是比较傻瓜式的

就是比较容易来配置好

这个RStudio这个环境

一旦配置好之后

就是先把R下载下来之后

再把RStudio解压缩

就变成我们这么一个界面

当然在这个过程中

另外一点

就是需要大家注意的就是最好定义快捷键

定义好一个快捷键

比如我们在执行这个代码也好

尤其执行代码的时候

你不要每次都通过鼠标来点击这个Run

还是通过什么

通过快捷键

直接选定某一些代码

然后怎么样

(通过快捷键)直接执行

在下面执行了

当然这个快捷键的话

大家可以按照你自己的喜好来设置

比如说你玩游戏的时候

习惯用哪个快捷键

那你再用RStudio的时候

也可以用这个快捷键

一旦配置好之后

布局配置好了

快捷键配置好了

那基本上我们那个实验环境就配置好了

当然我们现在所谓的实验环境

跟我们以前所接触到的

比如说里面有试管有酒精灯

有其他各种各样的试剂

那是不一样的

我们从数据分析来讲

我们的环境只有一台电脑(或工作站)

再加上我们这个软件就可以

接下来我们需要的是数据

然后就是我们通过相应的算法

挖出相应的模型

相应的规则出来

这是我们所谓的开展的那个实验的工作

好 大家下课之后

自己动手把这个RStudio的环境配置好

然后我们就开始具体后面的课程的讲解了

本次课到此结束

谢谢大家

R语言数据分析课程列表:

上部:问道

-第1章 气象万千、数以等观

--第1章 气象万千、数以等观

--第1章 作业

-第2章 所谓学习、归类而已

--2.1 所谓学习、归类而已(I)

--2.2 所谓学习、归类而已(II)

--2.3 所谓学习、归类而已(III)

--2.4 所谓学习、归类而已(IV)

--第2章 作业

-第3章 格言联璧话学习

--第3章 格言联璧话学习

--第3章 作业

-第4章 源于数学、归于工程

--第4章 源于数学、归于工程

--第4章 作业

-讨论题

--如何发挥人工智能的头雁效应

中部:执具

-第5章 工欲善其事、必先利其器

--第5章 工欲善其事、必先利其器

--第5章 作业

-第6章 基础编程——用别人的包和函数讲述自己的故事

--6.1 编程环境

--6.2Mini案例

--6.3 站在巨人的肩膀上

--6.4 控制流

--6.5 函数(I)

--6.6 函数(II)

--第6章 作业

-第7章 数据对象——面向数据对象学习R语言

--7.1 向量与因子(I)

--7.2 向量与因子(II)

--7.3 矩阵与数组(I)

--7.4 矩阵与数组(II)

--7.5 列表与数据框(I)

--7.6 列表与数据框(II)

--第7章 作业

-第8章 人人都爱tidyverse

--第8章 人人都爱tidyverse

--第8章 作业

-第9章 最美不过数据框

--第9章 最美不过数据框

--第9章 作业

下部:博术

-第10章 观数以形

--10.1 一维数据空间(I)

--10.2 一维数据空间(II)

--10.3 二维数据空间

--10.4 高维数据空间

--第10章 作业

-第11章 相随相伴、谓之关联

--11.1 导引

--11.2 关联规则(I)

--11.3 关联规则(II)

--11.4 关联规则(III)

--第11章 作业

-第12章 既是世间法、自当有分别

--12.1 导引

--12.2 近邻法(I)

--12.3 近邻法(II)

--12.4 决策树(I)

--12.5 决策树(II)

--12.6 随机森林

--12.7 朴素贝叶斯

--12.8 逻辑斯蒂回归

--12.9 人工神经网络(I)

--12.10 人工神经网络(II)

--12.11 支持向量机

--第12章 作业

-第13章 方以类聚、物以群分

--13.1 导引

--13.2 划分方法

--13.3 层次方法

--第13章 作业

-第14章 庐山烟雨浙江潮

--第14章 庐山烟雨浙江潮

--第14章 作业

6.1 编程环境笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。