搜尋感興趣的網誌

所有文章連結

2022年3月22日 星期二

R Packages Introduce dplyr | R包介紹dplyr

 


數據在進行整頓的階段,都會用到一些R Packages來協助程序,dplyr包裡面使用各組動詞進行數據操作,以下為較常使用的基本函數 :

 

`mutate()` : 以現有的欄位加入新的欄位與變量值。

mutate文章連結 >> 請點我

 

`selete()` : 可以根據欄位名做選擇。

 selete文章連結 >> 請點我


`filter() : 篩選個欄位的值,可以添加大於小於、邏輯判斷等。

 filter文章連結 >> 請點我


`summarise()``summary()` : 統計欄位內的值作為單個輸出摘要。

summarise文章連結 >> 請點我

 

`arrange()` : 重新進行排序,可以加入`desc()`做順序調整。

arrange文章連結 >> 請點我

 

`group_by()` : 選擇欄位作為群組。

 group_by文章連結 >> 請點我


`bind()` : 合併不同數據集。

bind文章連結 >> 請點我

 

`distinct()` : 類似base包的`unique()`,挑選出唯一的值。

distinct文章連結 >> 請點我

 

dplyr的函數可以與group_by以及%>%通道結合(除了bind()),結構上有一些相同的操作方式 :

1.      第一個參數為數據集

2.      第二個參數為變量的名稱(欄位名稱),各個變量以” , ”作為分隔。

3.      操作完會生成一個新的數據frame,可以用新變量儲存,就不會更動到原始數據集。

沒有留言:

張貼留言

其他文章

看看精選文章

納希克房價分析 | Nashik Apartment Price Analyze – 語法解析(上)

  這次 Nashik 的房價分析有上傳至 Kaggle ,有興趣的朋友可以前往閱覽, RMarkdown PDF 報告存放在 Google 雲端,程式碼則是存放於 Github ,照慣例會分享好用的函式語法,雖說基本的 Packages 與語法可能很多人都會完整的閱覽,但是實際...