当前位置: 首页 > 编程笔记 >

R数据框

凌照
2023-03-14
本文向大家介绍R数据框,包括了R数据框的使用技巧和注意事项,需要的朋友参考一下

示例

将数据帧子集化为较小的数据帧可以与将列表子集化相同。

> df3 <- data.frame(x = 1:3, y = c("a", "b", "c"), stringsAsFactors = FALSE)

> df3
##   x y
## 1 1 a
## 2 2 b
## 3 3 c

> df3[1]   # Subset a variable by number
##   x
## 1 1
## 2 2
## 3 3

> df3["x"]   # Subset a variable by name 
##   x
## 1 1
## 2 2
## 3 3

> is.data.frame(df3[1])
## TRUE

> is.list(df3[1])
## TRUE

可以使用双括号[[]]或美元符号运算符$将数据帧子集划分为列向量

> df3[[2]]    # Subset a variable by number using [[ ]]
## [1] "a" "b" "c"

> df3[["y"]]  # Subset a variable by name using [[ ]]
## [1] "a" "b" "c"

> df3$x    # Subset a variable by name using $
## [1] 1 2 3

> typeof(df3$x)
## "integer"

> is.vector(df3$x)
## TRUE

可以使用i和j项将数据子集为二维矩阵

> df3[1, 2]    # Subset row and column by number
## [1] "a"

> df3[1, "y"]  # Subset row by number and column by name
## [1] "a"

> df3[2, ]     # Subset entire row by number  
##   x y
## 2 2 b

> df3[ , 1]    # Subset all first variables 
## [1] 1 2 3

> df3[ , 1, drop = FALSE]
##   x
## 1 1
## 2 2
## 3 3

注意:j单独使用(列)子集可以简化为变量自己的类型,但是i单独使用子集可以返回a data.frame,因为不同的变量可能具有不同的类型和类。设置drop参数以FALSE保留数据帧。

> is.vector(df3[, 2])
## TRUE

> is.data.frame(df3[2, ])
## TRUE

> is.data.frame(df3[, 2, drop = FALSE])
## TRUE
           

 类似资料:
  • 本文向大家介绍R重塑数据,包括了R重塑数据的使用技巧和注意事项,需要的朋友参考一下 示例 数据通常在表中。通常,可以将此表格数据分为宽和长格式。在广泛的格式中,每个变量都有自己的列。 人 身高[cm] 年龄[yr] 艾莉森 178 20 鲍勃 174 45 卡尔 182 31 但是,有时使用长格式会更方便,因为所有变量都在一列中,而值在第二列中。 人 变量 值 艾莉森 身高[cm] 178 鲍勃

  • 主要内容:安装R包,准备输入数据,例子,验证文件下载许多网站为用户提供一些公开的数据。 例如,世界卫生组织(WHO)以CSV,txt和XML文件的形式提供关于健康和医疗信息的报告。 使用R程序,我们可以从这些网站以编程方式提取特定的数据。 用于从网络中废弃数据的R中的一些包是 - RCurl,XML和stringr,用于连接URL,识别文件所需的链接并将其下载到本地环境。 安装R包 需要以下包才能处理URL和链接到文件。 如果它们在R环境中不可用,

  • 主要内容:获取数据帧的结构,数据帧数据摘要,从数据帧提取数据,扩展数据帧数据帧是一个表或二维类似数组的结构,其中每列包含一个变量的值,每行包含来自每一列的一组值。 以下是数据帧的特征 - 列名称应该不为空。 行名称应该是唯一的。 存储在数据帧中的数据可以是数字,因子或字符类型。 每列应包含相同数量的数据项。 创建数据帧 当我们执行上述代码时,会产生以下结果 - 获取数据帧的结构 通过使用函数可以查看数据帧的结构,参考以下代码实现 - 当我们执行上述代码时,会产生以下结

  • 主要内容:在数据框中连接列和行,合并数据帧,拆分数据和重构数据,拆分数据,重构数据R中的数据重整是关于将数据组织成行和列的方式。 R中的大多数时间数据处理是通过将输入数据作为数据帧来完成的。 很容易从数据帧的行和列中提取数据,但是有些情况下,我们需要的格式与收到的格式不同。 R具有许多函数,用于在数据帧中拆分,合并和更改行到列,反之亦然。 在数据框中连接列和行 我们可以使用函数连接多个向量来创建数据帧。也可以使用函数合并两个数据帧。 当我们执行上述代码时,会产生以下结果 - 合

  • 主要内容:向量,列表,矩阵,数组,因子,数据帧通常,在使用任何编程语言进行编程时,需要使用各种变量来存储各种信息。变量只不过是保存存储值的内存位置。 这意味着,当您创建变量时,可以在内存中保留一些空间用来存储某些值。 可能希望存储各种数据类型的信息,如字符,宽字符,整数,浮点,双浮点,布尔等。根据变量的数据类型,操作系统会分配内存并决定在保留这些内存。 R语言与其他编程语言(如C语言和Java)相反,变量不会被声明为某些数据类型。 变量被分配

  • 我想用英超网站上的统计数据来做一个班级项目。这是网站:https://www.premierleague.com/stats/top/players/goals

  • 如何将数据X转换为Y 假设一个ID列的所有其他列都是一致的,比如Mike只能是ID为1的男性,我们怎么做呢?

  • 本文向大家介绍R检查丢失的数据,包括了R检查丢失的数据的使用技巧和注意事项,需要的朋友参考一下 示例 anyNA报告是否存在任何缺失值;而按is.na元素报告缺失值: ìs.na返回在算术运算(FALSE = 0,TRUE = 1)下被强制为整数值的逻辑向量。我们可以使用它来找出有多少个缺失值: 扩展这种方法,我们可以在数据帧上使用colSums和is.na来计算每列的NA: naniar软件包(