搜尋感興趣的網誌

所有文章連結

2022年3月22日 星期二

數據分析R包介紹 | Data Analyze R Packages Introduce

 


在數據分析的領域,PythonR都有不少的擁護者,Python的通用性高,可以做網頁、人工智慧、APP、數據分析、甚至影響處理等等,R則是比較侷限,但是R在統計、繪圖的部分畢竟比較擅長,有些語法也顯得簡單,小雷整理了會常用到的Packages內容,除了希望能分享幫助到正在學習的朋友,也讓自己不斷的溫習,介紹的內容若是有錯誤,還希望大大能提點改進。

 

以下是常用的Packages,簡單做點介紹,各分類的文章連結也會寫好後陸續放上來,不定期進行更新,有在學習R語言的朋友可以當作參考。

 

Tidyverse包內已經整合的有(當然也可以單獨import) :

1.      Dplyr : 數據操作包,plur的進階版,很重要且基本的數據操作包,包含了數據的處理、轉換函數,算是很常會到的Packages

Dplyr文章連結 >> 請點我

 

2.      Readr : 數據集匯入包,tidyverse的核心包之一,用來匯入數據集,當然Rbase包中也有同樣的功能。

 

3.      Tidyr : 數據清洗包,分析的準確,很大的程度取決於數據的乾淨程度,一點點的誤差都有可能導致分析的失準。

 

4.      Forcats : 因子操作包,數據整理時,有時會因為欄位的型態而不好操作、排序,因子factor的轉換與使用有時會遠比字符character來的容易。

Forcats文章連結 >> 請點我

 

5.      Tibble : 在創立、列印、子集的顯示與傳統數據框data.frame不同,在使用tidyverse時幾乎都會產生tibbles框架。

 

6.      Purrr : 專門處理函數與向量,可以使編寫的代碼具有表現力與易於編程。

 

7.      Stringr : 專門處理字符character的包,讓處理字符時可以變得容易許多。

Stringr文章連結 >> 請點我

 

8.      Ggplot2 : 最常使用的繪圖包,擁有美觀與強大的繪圖功能,也很好的結合編程與繪圖

 

Lubridate : 日期操作包,分析時常常會使用到日期的欄位與數值,透過lubridate可以輕鬆的進行操作與轉換。

 

Stats : 統計包,這也是使愛用者喜愛的原因吧,強大的統計功能,很簡單的就可以把相關的數值找出來。

 

Janitor : 檢查與清理包,除了檢查數據之外,也提供清洗數據的其他函數。


沒有留言:

張貼留言

其他文章

看看精選文章

納希克房價分析 | Nashik Apartment Price Analyze – 語法解析(上)

  這次 Nashik 的房價分析有上傳至 Kaggle ,有興趣的朋友可以前往閱覽, RMarkdown PDF 報告存放在 Google 雲端,程式碼則是存放於 Github ,照慣例會分享好用的函式語法,雖說基本的 Packages 與語法可能很多人都會完整的閱覽,但是實際...