轉(zhuǎn)帖|使用教程|編輯:龔雪|2017-04-14 10:29:53.000|閱讀 521 次
概述:如果你是一個(gè)機(jī)器學(xué)習(xí)的初學(xué)者,本系列文章將教你用R語言開啟機(jī)器學(xué)習(xí)之旅
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
文|陸勤
你是否想要用R做機(jī)器學(xué)習(xí),但又苦惱于怎么開始做?
在這篇文章里你將會(huì)用R完成你的第一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目。
在這個(gè)逐步教程里,你需要做:
1 下載和安裝R并且獲取用做機(jī)器學(xué)習(xí)非常有用的R包。
2 導(dǎo)入一個(gè)數(shù)據(jù)集并且用統(tǒng)計(jì)分析和數(shù)據(jù)可視化來理解它的結(jié)構(gòu)。
3 創(chuàng)建5個(gè)機(jī)器學(xué)習(xí)模型,選擇最好和建立精度是可靠的置信。
如果你是一個(gè)機(jī)器學(xué)習(xí)新手,而且還在找一個(gè)你最終會(huì)選擇的方案來學(xué)習(xí)機(jī)器學(xué)習(xí)的話,這個(gè)教程就是針對(duì)你設(shè)計(jì)的。
讓我們現(xiàn)在開始吧。
怎樣用R開始你的機(jī)器學(xué)習(xí)?
學(xué)習(xí)機(jī)器學(xué)習(xí)最好的方法就是設(shè)計(jì)并實(shí)現(xiàn)一系列小項(xiàng)目。
初學(xué)R的時(shí)候你可能回覺得這有點(diǎn)可怕
R在編寫腳本時(shí)所提供的語法結(jié)構(gòu)是比較奇怪的。這里有幾百個(gè)R包和幾千個(gè)函數(shù)讓你選擇,給每個(gè)任務(wù)提供了多種解決方法,所以這會(huì)讓你感到有點(diǎn)吃不消。
所以說,在R上開始機(jī)器學(xué)習(xí)最好的方法就是要完成一個(gè)項(xiàng)目。
1 這需要你安裝并開始學(xué)習(xí)使用R(至少會(huì)一點(diǎn)點(diǎn))。
2 它能給你更開闊的視角來理解如何一步步進(jìn)行機(jī)器學(xué)習(xí)。
3 它會(huì)給你自信,來源于你完成一個(gè)小項(xiàng)目的成就感。
入門的人需要完成一個(gè)端對(duì)端的項(xiàng)目
光看書或課程會(huì)讓你覺得很吃不消,它們給你提供的是一系列的解決方法和代碼段,但是,你永遠(yuǎn)都不知道怎樣把他們綜合起來使用。
當(dāng)你要把機(jī)器學(xué)習(xí)運(yùn)用到你的數(shù)據(jù)集的時(shí)候,其實(shí)你就是在做一個(gè)項(xiàng)目。
一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目可能不是線性的,但是,有些有用的方法你可以按順序的遵循:
1 定義問題
2 準(zhǔn)備好數(shù)據(jù)
3 評(píng)估算法
4 改良結(jié)果
5 展示最終結(jié)果
如果你想要了解更多關(guān)于機(jī)器學(xué)習(xí)的步驟,你可以查閱,這一清單對(duì)這個(gè)過程講的更詳細(xì)。
與一個(gè)新的平臺(tái)或工具達(dá)成協(xié)議的最好方法就是完成端對(duì)端的機(jī)器學(xué)習(xí)項(xiàng)目,并按照之前給的步驟執(zhí)行。也就是說,從載入數(shù)據(jù)開始,然后匯總你的數(shù)據(jù),接下來評(píng)估你的算法,同時(shí)改良你的結(jié)果,并在最后作適當(dāng)?shù)恼故尽?
如果你是這么做的話,你就會(huì)在你處理完數(shù)據(jù)以后,有了一個(gè)模板來對(duì)新的數(shù)據(jù)集進(jìn)行研究。你甚至還可以通過數(shù)據(jù)展示和改良相關(guān)的結(jié)果來填補(bǔ)你先前做任務(wù)的時(shí)候留下來的空缺。一旦你這么做了,你就會(huì)有信心了。
利用新的工具進(jìn)行小項(xiàng)目的最好方法就是首先從iris的分類數(shù)據(jù)集開始。
這是一個(gè)好的項(xiàng)目,因?yàn)樗?jiǎn)單明了。
1 里面的屬性是數(shù)字,所以,你會(huì)覺得導(dǎo)入和處理數(shù)據(jù)會(huì)非常上手。
2 這是一個(gè)分類問題,或許能允許你使用簡(jiǎn)單的監(jiān)督學(xué)習(xí)算法進(jìn)行練習(xí)。
3 這是一個(gè)多級(jí)分類問題(多含義),而它需要一些特別的方法來處理。
4 它只有4個(gè)屬性和150行數(shù)據(jù),說明這對(duì)于內(nèi)存來說很小,而且處理起來很快(一張A4紙大小那樣)。 5 所有的數(shù)字屬性都在同一個(gè)單元,它們的規(guī)模也相同,它不需要轉(zhuǎn)化成特別的形式或者使用特殊的定位。
在R中讓我們開始您的Helloworld機(jī)器學(xué)習(xí)項(xiàng)目。
在這一部分的內(nèi)容中,我們要完成一個(gè)小的端到端機(jī)器學(xué)習(xí)項(xiàng)目。 這里,我們?yōu)g覽一下我們接下來要干什么:
1 安裝R平臺(tái)
2 載入數(shù)據(jù)
3 匯總數(shù)據(jù)集
4 對(duì)數(shù)據(jù)集進(jìn)行可視化操作
5 評(píng)估一些算法
6 做一些相關(guān)預(yù)測(cè)
慢慢來,認(rèn)真的落實(shí)好每一步。
你可以嘗試自己寫代碼,或者從別的地方復(fù)制相關(guān)的代碼來提高工作效率。
如果你的系統(tǒng)還沒有R平臺(tái),那就現(xiàn)在安裝一個(gè)吧。
更新:這個(gè)教程是根據(jù)R 3.2.3版寫的,所以,如果你的版本比較舊,那么,你就需要更新一下了。
我不想在這里講太多的細(xì)節(jié),其他文章已經(jīng)講的很清楚了。這已經(jīng)講的直接明了,尤其你是一名開發(fā)人員的時(shí)候。
這里,你要遵循幾個(gè)步驟:
1 下載R
2 安裝R
3 開始使用R
4 下載相關(guān)R包
你可以從下載R。
當(dāng)你點(diǎn)擊這個(gè)下載鏈接時(shí),你需要選擇鏡像。你可以根據(jù)你的操作系統(tǒng)選擇R,如Windows、OSX或者Linux。
安裝R很容易的,而且我也相信你可以解決。這里沒有其它特別的要求。如果你在安裝R的時(shí)候遇到什么問題需要求助的話,你可以看一下
你可以在操作系統(tǒng)上看到的選擇任意菜單系統(tǒng)使用R。
對(duì)于我而已,我更喜歡命令行。
打開你的命令行,改變(或者創(chuàng)建)你的項(xiàng)目目錄,并且在命令行輸入以下代碼: R
您應(yīng)該在一個(gè)新的窗口或者您的終端上看到一個(gè)像如下的屏幕截圖:
安裝我們今天要使用的R包。這些包是第三方附加組件或者可以在R使用的庫。
install.packages(“caret”)
更新:我們也許需要其它包,但是caret會(huì)問到我們是否要安裝它。如果你對(duì)于這些包有什么疑問的話,你可以先安裝caret包,然后你可以輸入下面的代碼來看一下你需要什么包:
install.packages(“caret”,dependencies=c(“Depends”, “Suggests”)) 現(xiàn)在,我們加載一下caret包,然后開始在我們的教程里使用這個(gè)包。
library(caret)
caret包給上百個(gè)機(jī)器學(xué)習(xí)算法提供了相應(yīng)接口,并給數(shù)據(jù)可視化、數(shù)據(jù)采樣、模型調(diào)整以模型比較這些功能提供了便利的方法。我們必須要在R里有進(jìn)行機(jī)器學(xué)習(xí)的工具。
如果你想要了解更多關(guān)于caret這個(gè)R包的內(nèi)容,查閱一下這篇文章。
英文鏈接:
更多行業(yè)資訊,更新鮮的技術(shù)動(dòng)態(tài),盡在。
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@ke049m.cn