R學習筆記_01_數(shù)據(jù)類型

摘要：介紹R語言中常用的數(shù)據(jù)結(jié)構(gòu)，向量、矩陣、列表、數(shù)據(jù)庫、因子等。主要是它們的創(chuàng)建、索引和簡單的運算。

數(shù)據(jù)類型

主要的數(shù)據(jù)類型：
- 數(shù)值型：numeric
- 邏輯型：logical（T/TRUE F/FALSE）
- 字符型：character
- 復數(shù)型：complex（a+bi）
- 原味型：raw（二進制數(shù)據(jù)）
- 缺省型：missing value（NA/not available）
關(guān)于數(shù)據(jù)類型的詳細介紹和操作參見另一篇課程筆記：R魔02_筆記_數(shù)據(jù)類型。

查看數(shù)據(jù)：

查看當前系統(tǒng)里的數(shù)據(jù)對象，返回變量名：ls()

辨別和轉(zhuǎn)換數(shù)據(jù)類型：

類型            辨別                轉(zhuǎn)換
character       is.character()      as.character()
complex         is.complex()        as.complex()
double          is.double()         as.double()
integer         is.integer()        as.integer()
logical         is.logical()        as.logical()
NA              is.na()             as.na()
numeric         is.numeric()        as.numeric()

數(shù)據(jù)結(jié)構(gòu)

數(shù)據(jù)結(jié)構(gòu)包括：
- 向量
- 矩陣
- 數(shù)組
- 數(shù)據(jù)框
- 因子factor/名義或等級

向量:c()

直接創(chuàng)建向量：同一向量中的數(shù)據(jù)必須是同一個類型的。

> a <- c(1, -2, 3, -4, 5, 0)
> b <- c("age","name" , "weight") 
> C <- c(TRUE, TRUE, FALSE, FALSE) 

> a <- c(2:6)     # 冒號"n:m"表示從n到m，包含n和m。
# 等價于
> a <- c(2, 3, 4, 5, 6)

> r <- c(5:1)     #逆序
> r
5 4 3 2 1 

# 冒號運算的結(jié)果其實也是個向量
> 2*1:5             #表達式中：的級別最高
[1] 2 4 6 8 10

用函數(shù)生成向量：

# 1. 生成有規(guī)律的序列 
> seq(1,10,2)                   # seq(from, to, by)，從1到10，間隔為2。
[1] 1 3 5 7 9
> seq(1, by=2, length=10)       #從1開始，間隔為2，總共要10個數(shù)。
[1] 1 3 5 7 9 11 13 15 17 19

> letters[1:30]             #生成字母序列，abcd，26個，第26之后的值為NA

# 2. 重復
> rep(c(1,2),4)                 # 向量整體4次
[1] 1 2 1 2 1 2 1 2
> rep(c(1,2),each=4)            # 按元素重復
[1] 1 1 1 1 2 2 2 2
> rep(c(1,2,3,4),c(5,3,4,2))    # 向量元素分別重復5432次。必須一樣長。
[1] 1 1 1 1 1 2 2 2 3 3 3 3 4 4

選擇向量中的元素

> a <- c(1, -2, 3, -4, 5, 0)
> a[3]
[1] 3

> a[2,3]            # 選擇兩個
[1] -2 3

> a[1:4]            # 選擇多個連續(xù)
1 -2 3 -4

> a[-2]             # 去掉第2個元素
1 3 -4 5 0

# 用向量選擇
> a[c(1,3,4)]       # 一定要有c()函數(shù)，a[1,2,3]是錯的

# 布爾
> a[a<3]            # 列出小于3的元素

用which()函數(shù)選擇

which.max(a)        #()里是向量名。返回下標。
which.min(a)
a[which.max(a)]     #返回最大值
which(a==2)         #所有等于2的元素，的位置/下標。
which(a>3)

注意：向量不能添加或刪除元素。改變向量需要重新賦值。

附：常用的向量計算函數(shù)

sum()           #求和
max()           #求最大值
min()           #求最小值
range()         #求極差（全矩）
mean()          #均值
median()        #中數(shù)
var()           #方差
sd()            #標準差
sort()          #排序，從小到大
rev()           #反向排列rev(sort())
rank()          #給出向量的秩（每個元素的排名）
prod()          #向量的連乘積
append()        #添加元素
replace()       #替換
match()         #匹配
pmatch()        #部分匹配
all()           #判斷所有
any()           #判斷部分

矩陣：matrix()默認按列生成

創(chuàng)建矩陣

> y <- matrix(1:20, nrow=5, ncol=4)
     [,1] [,2] [,3] [,4]
[1,]    1    6   11   16
[2,]    2    7   12   17
[3,]    3    8   13   18
[4,]    4    9   14   19
[5,]    5   10   15   20

> cells <- c(1,4,6,10)
> rname <- c("r1","r2")
> cname <- c("c1","c2")
> mymatrix <- matrix(cells, nrow=2, ncol=2, byrow=TRUE, dimnames=list(rname, cname))
mymatrix        #byrow=TRUE按行填充
    c1  c2
r1  1   4
r2  6   10

> diag(1:4)                 #生成對角矩陣
   [,1] [,2] [,3] [,4]
[1,] 1 0 0 0
[2,] 0 2 0 0
[3,] 0 0 3 0
[4,] 0 0 0 4
> diag(4)                   #4階單位陣
   [,1] [,2] [,3] [,4]
[1,] 1 0 0 0
[2,] 0 1 0 0
[3,] 0 0 1 0
[4,] 0 0 0 1

矩陣索引

mymatrix <- matrix(1:20, nrow=5, ncol=4)
> mymatrix[1,2]       #選擇矩陣里的元素[行, 列]
6
> mymatrix[1:2,2:3]   #第1 2行，2 3列的元素
     [,1] [,2]
[1,]    6   11
[2,]    7   12

矩陣的運算

A+10                #所有元素加10
A*2                 #所有元素乘2
A*A                 #所有元素乘自己
A%*%B               #矩陣相乘【A(m,n)的列數(shù)（column）與B(n,p)的行數(shù)（row）相同才行，得到是一個m行，p列的矩陣】
dim()               #返回行、列數(shù)（如果是array，返回每個維度的行列數(shù)
str(object)         #顯示某個對象的結(jié)構(gòu)
class(object)       #顯示某個對象的類或類型
nrow()              #返回行數(shù)
ncol()              #返回列數(shù)
solve()             #返回逆矩陣【逆矩陣：兩個矩陣相乘等于一個單位矩陣（見上）】
solve(a,b)          #a*x=b，求x。得出的是x的值。
as.matrix()         #把非矩陣的轉(zhuǎn)換成矩陣
is.matrix()         #辨別是否矩陣
diag()              #返回對角元素或生成對角矩陣
eigen()             #求特征值和特征向量
chol()              #Choleski 分解  【？？？】
svd()               #奇異值分解     【？？？】
qr()                #QR 分解        【？？？】
det()               #求行列式
t()                 #矩陣轉(zhuǎn)置
apply(X, MARGIN, FUN, ...)      #對矩陣應用函數(shù)。x：矩陣名；MARGIN：運算范圍，1/按行運算，2/按列運算；FUN：調(diào)用的函數(shù)。得到一個向量。
rbind()             #合并兩個或兩個以上的矩陣，按行合并。（列數(shù)不變
cbind()             #按列合并。（行數(shù)不變

數(shù)組:函數(shù)array()

簡單說一下。

> dim1 <- c("A1","A2")
> dim2 <- c("B1","B2","B3")
> dim3 <- c("C1","C2","C3","C4")
> z <- array(1:24, c(2, 3, 4), dimnames = list (dim1, dim2, dim3))
> z
, , C1

   B1 B2 B3
A1  1  3  5
A2  2  4  6

, , C2

   B1 B2 B3
A1  7  9 11
A2  8 10 12

, , C3

   B1 B2 B3
A1 13 15 17
A2 14 16 18

, , C4

   B1 B2 B3
A1 19 21 23
A2 20 22 24

數(shù)據(jù)框：最常見的數(shù)據(jù)結(jié)構(gòu)data.frame()

矩陣形式的數(shù)據(jù)必須是同一類型的，但數(shù)據(jù)框中各列可以是不同類型的數(shù)據(jù)。
每一列長度一致?？梢允窍蛄?、因子、數(shù)據(jù)矩陣、列表、或其他數(shù)據(jù)框。
字符向量會被強制轉(zhuǎn)換成因子

> patientID<-c(1,2,3,4)
> age<-c(25,34,28,52)
> diabetes<-c("Type1","Type2","Type1","Type1")
> status<-c("Poor","Improved","Excellent","Poor")
> patientdata<-data.frame(patientID, age, diabetes, status)
> patientdata
  patientID age diabetes    status
1         1  25    Type1      Poor
2         2  34    Type2  Improved
3         3  28    Type1 Excellent
4         4  52    Type1      Poor    

patientdata[1:2]           # 選取列
patientdata[1:2,]          # 選取行
patientdata[c("diabetes","status")]     # 用列名選取
patientdata$age                         # 用列名選取的另一種方法
table(patientdata$diabetes, patientdata$status)       # 名義變量做交叉列聯(lián)表。

使用attach()/detach()和with()：可以不用寫數(shù)據(jù)框的名字，直接用數(shù)據(jù)庫中列名。

attach(patientdata)
summary(age)
detach(patientdata)

with(patientdata,{
    summary(age)
    })

因子factor()

分類數(shù)據(jù)
factor(data, levels, labels,...)

# factors把字符型的名義變量 變?yōu)?用數(shù)字代表類別。常用于離散型數(shù)據(jù)。
patientID<-c(1,2,3,4)
age<-c(25,34,28,52)
diabetes<-c("Type1","Type2","Type1","Type1")
status<-c("Poor","Improved","Excellent","Poor")
diabetes<-factor(diabetes); diabetes
status<-factor(status, order=T, levels = c("Poor", "Improved","Excellent"));status          
# order = T，有序性因子，按字母排序。用levels設定順序。
patientdata<-data.frame(patientID, age, diabetes, status)
str(patientdata)                  # 查看dataframe
summary(patientdata)

列表list

list是一個對象的有序合集，包含的對象叫做components/分量。
語句list(變量1=分量1，變量2=分量2，……)
函數(shù)length()、 mode()、 names()可以分別返回列表的長度（分量的數(shù)目）、數(shù)據(jù)類型、列表里成分的名字。
元素可以不同類型。迭代。雙層中括號[[]]選擇元素，第一維是名稱，第二維才是數(shù)值。

# 創(chuàng)建列表
#1. 使用list()
> j <- list(name="Joe",salary=55000, union=T); j
$name
[1] "Joe"

$salary
[1] 55000

$union
[1] TRUE

#2. 把向量轉(zhuǎn)為列表形式
z <- vector(mode="list")  
z[["list"]] <- 3   

# 列表索引
> j$salary
[1] 55000    

j[["salary"]]           #注意單層中括號和雙層中括號的區(qū)別
j[[2]]
j[1:2]

# 增加列
j$sex<-"M"              #增加一個叫做“sex”的列

j[6:8]<-c(E,F,T);j      #增加三列，分別叫做E/F/T，位置在6到8.

# 刪除列
j$sex<-NULL;j           #sex這列就不見了

最后編輯于：2017.12.05 01:00:14

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,967評論 6贊 531
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,273評論 3贊 415
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,870評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,742評論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,527評論 6贊 407
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,010評論 1贊 322
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,108評論 3贊 440
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,250評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 48,769評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 40,656評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,853評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,371評論 5贊 358
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 44,103評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,472評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,717評論 1贊 281
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,487評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,815評論 2贊 372

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

R學習筆記_01_數(shù)據(jù)類型

R學習筆記_01_數(shù)據(jù)類型

數(shù)據(jù)類型

數(shù)據(jù)結(jié)構(gòu)

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

R學習筆記_01_數(shù)據(jù)類型

數(shù)據(jù)類型

數(shù)據(jù)結(jié)構(gòu)

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频