當在R中讀取了或創建了一個數據集后,通常我們需要對其中的一部分數據進行處理時,如何準確地提取這部分特定的數據就成為了一個頭疼的問題。幸好,R語言提供了強大的索引體系,以下我就展示一些常見的索引方法及例子吧!首先,我們可以通過以下幾種方式創建索引:
- 正整數
- 負整數
- 空格
- 邏輯值
- 名稱
栗子
首先,我們創建以下的數據框
> name <- c("A", "B", "C")
> score <- c(4, 7, 9)
> df <- data.frame(name, score)
> df
name score
1 A 4
2 B 7
3 C 9
接著,我們將通過不同的索引方法,提取其中的數據
#正整數索引類似于(i,j)的索引方法
> df[1,1]
[1] A
#負整數索引則是返回不包含負整數索引所對應的元素
> df[-1,1]
[1] B C
#空格表示返回該索引對應維度的所有元素。
> df[1, ]
name score
1 A 4
#也可以用待提取元素的名稱作為索引值,但要雙引號
> df[1, "name"]
[1] A
#邏輯值索引,相當于對該維度的每一位置進行邏輯判斷后再進行提取。
> df[1, c(T,F)]
[1] A
#對于列/行有名稱的情況,還可以用$索引某列/行
> df$score
[1] 4 7 9
如果想通過中括號取值后仍然返回數據框的格式,一種是提取的值包含多種類型的值。二是使用drop
參數:
> df[-1,1]
[1] B C
> class(df[-1,1])
[1] "factor"
> df[-1,1, drop = FALSE]
name
2 B
3 C
> class(df[-1,1, drop = FALSE])
[1] "data.frame"
此外,在list
中也有一些有意思的情況,盡管我不常用,但還是應當了解其索引的方法。list
的元素可以通過雙中括號[[]]
和單中括號[]
索引,兩者有以下區別:
list1 <- list(1:10, "a", list(TRUE, FALSE))
#雙中括號返回的是列表中的子集元素
> list1[[1]]
[1] 1 2 3 4 5 6 7 8 9 10
> sum(list1[[1]])
[1] 55
> class(list1[[1]])
[1] "integer"
#而單中括號返回的仍然是一個列表對象,R中許多函數不接受list對象
> list1[1]
[[1]]
[1] 1 2 3 4 5 6 7 8 9 10
> sum(list1[1])
Error in sum(list1[1]) : invalid 'type' (list) of argument
> class(list1[1])
[1] "list"
總而言之,使用雙中括號索引列表時,可以實實在在地獲得列表中的元素。而使用單中括號索引時,只是提取了一個子列表出來,返回的仍然是列表。
完。