本文概述
- 读取文件:read.csv()
- 一览你的数据
- R中对象的类型, 类和维
读取文件:read.csv()我们可以分析股票数据的第一步是下载并将其加载到R工作区中。在工作区中加载数据集类似于在Excel中打开数据文件, 然后我们可以在其上运行可用功能。在R中, 数据表通常保存为称为数据帧的对象。
在本章中, 我们将使用从Yahoo Finance下载的名为MARUTI的股票数据。数据可从http://assets.srcmini.com/course/quantinsti/data_ch1.csv获得。数据集包含Maruti在2008年1月1日至2013年12月31日之间的每日OHLC(开盘高低盘)和交易量数据。
【R的基本编程技巧】在本练习中, 我们将从在R中定义一个名为data_maruti的新对象开始。定义新变量或对象的语法非常简单:
variable_name <
- value
其中variable_name是新对象或变量的名称, value是分配给它的值。
我们将一个.csv数据文件保存在data_maruti中。 read.csv()用于读取.csv文件并将其保存为数据帧。调用函数的语法非常简单:
function_name(object1, object2, argument1, argument2, ....)
其中function_name是函数的名称, 而object1, object1是要在其上运行函数的对象或变量。参数是你在运行函数时要给出的规范。
在本练习中, 我们将学习使用函数创建新变量。
使用说明
- 检查上载的虚拟数据框作为示例。请注意, read.csv()函数中包含三个参数:文件, 等于数据的URL, 标头, 一个逻辑值, 指示文件是否包含变量名称作为第一行(在这种情况下为TRUE)和stringsAsFactors, 用于指定是否应将表中的字符串另存为因子(在这种情况下为FALSE)。
- 创建一个新变量data_maruti, 其中包含Maruti从2008年1月1日到2013年12月31日的每日数据。确保将header指定为TRUE, 将stringAsFactors指定为FALSE。
- 最后, 使用head()函数检查已加载的数据帧的第一行。只需运行head(data_maruti)即可调用该函数。
在本练习中, 你将使用tail()函数打印数据集的最后几行或尾部。你还将发现如何查询数据集的行数和列数。
data_maruti数据框已为你加载在工作空间中。
使用说明
- 使用函数tail()打印data_maruti的最后六行。
- 使用函数nrow()打印data_maruti中的行数。
- 使用函数ncol()打印data_maruti中的列数。
在本章中使用的对象类别是矢量和数据帧。如前所述, 数据框就像excel表, 在金融计算中最常用。向量就像由相同类型的变量组成的单行或一列数据。换句话说, 数据帧由向量组成。
使用说明
分别使用函数typeof(), class()和dim()打印对象data_maruti的类型, 类和尺寸。数据框data_maruti已加载到工作空间中。
如果你想从本课程中学习更多信息, 请点击这里。
推荐阅读
- 在SQLite中修改日期函数
- R中的自相关
- 将机器学习模型转换为Python中的API
- Python地理空间数据简介
- 下划线(_)在Python中的作用
- 在R中合并数据集
- 蒙特卡洛方法简介
- Python中线性回归的要点
- SLAM+???????????????DIY????????????????????????????????????1.miiboo?????????????????????APP??????