在數據分析的領域,Python與R都有不少的擁護者,Python的通用性高,可以做網頁、人工智慧、APP、數據分析、甚至影響處理等等,R則是比較侷限,但是R在統計、繪圖的部分畢竟比較擅長,有些語法也顯得簡單,小雷整理了會常用到的Packages內容,除了希望能分享幫助到正在學習的朋友,也讓自己不斷的溫習,介紹的內容若是有錯誤,還希望大大能提點改進。
以下是常用的Packages,簡單做點介紹,各分類的文章連結也會寫好後陸續放上來,不定期進行更新,有在學習R語言的朋友可以當作參考。
Tidyverse包內已經整合的有(當然也可以單獨import) :
1. Dplyr : 數據操作包,plur的進階版,很重要且基本的數據操作包,包含了數據的處理、轉換函數,算是很常會到的Packages。
Dplyr文章連結 >> 請點我
2.
Readr : 數據集匯入包,tidyverse的核心包之一,用來匯入數據集,當然R的base包中也有同樣的功能。
3.
Tidyr : 數據清洗包,分析的準確,很大的程度取決於數據的乾淨程度,一點點的誤差都有可能導致分析的失準。
4.
Forcats : 因子操作包,數據整理時,有時會因為欄位的型態而不好操作、排序,因子factor的轉換與使用有時會遠比字符character來的容易。
Forcats文章連結 >> 請點我
5.
Tibble : 在創立、列印、子集的顯示與傳統數據框data.frame不同,在使用tidyverse時幾乎都會產生tibbles框架。
6.
Purrr : 專門處理函數與向量,可以使編寫的代碼具有表現力與易於編程。
7.
Stringr : 專門處理字符character的包,讓處理字符時可以變得容易許多。
Stringr文章連結 >> 請點我
8.
Ggplot2 : 最常使用的繪圖包,擁有美觀與強大的繪圖功能,也很好的結合編程與繪圖
Lubridate : 日期操作包,分析時常常會使用到日期的欄位與數值,透過lubridate可以輕鬆的進行操作與轉換。
Stats : 統計包,這也是使愛用者喜愛的原因吧,強大的統計功能,很簡單的就可以把相關的數值找出來。
Janitor : 檢查與清理包,除了檢查數據之外,也提供清洗數據的其他函數。
沒有留言:
張貼留言