翻譯|使用教程|編輯:陳津勇|2019-10-29 10:31:37.413|閱讀 1078 次
概述:?在本教程中,您將使用自動(dòng)化機(jī)器學(xué)習(xí)在Power BI中創(chuàng)建和應(yīng)用二進(jìn)制預(yù)測(cè)模型。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
本教程包括創(chuàng)建Power BI數(shù)據(jù)流的指導(dǎo),以及使用數(shù)據(jù)流中定義的實(shí)體直接在Power BI中培訓(xùn)和驗(yàn)證機(jī)器學(xué)習(xí)模型。然后,我們使用該模型對(duì)新數(shù)據(jù)進(jìn)行評(píng)分以生成預(yù)測(cè)。
首先,您將創(chuàng)建一個(gè)Binary Prediction機(jī)器學(xué)習(xí)模型,根據(jù)在線購(gòu)物者的一組在線會(huì)話屬性來(lái)預(yù)測(cè)他們的購(gòu)買意圖。本練習(xí)使用基準(zhǔn)機(jī)器學(xué)習(xí)數(shù)據(jù)集。一旦一個(gè)模型被訓(xùn)練,Power BI將自動(dòng)生成一個(gè)解釋模型結(jié)果的驗(yàn)證報(bào)告。然后您可以查看驗(yàn)證報(bào)告,并將模型應(yīng)用到您的數(shù)據(jù)中進(jìn)行評(píng)分。
學(xué)習(xí)本教程前,請(qǐng)下載Power BI Desktop或Power BI Pro,以便同步操作加深學(xué)習(xí)印象。
下載Power BI Desktop 下載Power BI Pro
本教程包括以下步驟:
使用輸入數(shù)據(jù)創(chuàng)建數(shù)據(jù)流
創(chuàng)建和訓(xùn)練機(jī)器學(xué)習(xí)模型
查看模型驗(yàn)證報(bào)告
將模型應(yīng)用于數(shù)據(jù)流實(shí)體
使用Power BI報(bào)表中模型的評(píng)分輸出
使用輸入數(shù)據(jù)創(chuàng)建數(shù)據(jù)流
本教程的第一部分是使用輸入數(shù)據(jù)創(chuàng)建數(shù)據(jù)流。如以下各節(jié)所示,該過(guò)程采取了一些步驟,從獲取數(shù)據(jù)開(kāi)始。
獲取數(shù)據(jù)
創(chuàng)建數(shù)據(jù)流的第一步是準(zhǔn)備好數(shù)據(jù)源。在我們的案例中,我們使用來(lái)自一系列在線會(huì)話的機(jī)器學(xué)習(xí)數(shù)據(jù)集,其中一些最終達(dá)到了購(gòu)買目的。數(shù)據(jù)集包含一組關(guān)于這些會(huì)話的屬性,我們將使用它們來(lái)訓(xùn)練我們的模型。
您可以從UC Irvine網(wǎng)站下載數(shù)據(jù)集。就本教程而言,我們還可以通過(guò)提供此功能。
創(chuàng)建實(shí)體
要在數(shù)據(jù)流中創(chuàng)建實(shí)體,請(qǐng)登錄Power BI服務(wù),并導(dǎo)航到啟用了AI的專用容量的工作區(qū)。
如果還沒(méi)有工作區(qū),可以通過(guò)在Power BI服務(wù)的左側(cè)導(dǎo)航菜單中選擇“工作區(qū)”來(lái)創(chuàng)建一個(gè)工作區(qū),然后在出現(xiàn)的面板底部選擇“創(chuàng)建應(yīng)用程序工作區(qū) ”。這將在右側(cè)打開(kāi)一個(gè)面板,以輸入工作區(qū)詳細(xì)信息。輸入工作空間名稱,然后選擇高級(jí)。使用單選按鈕確認(rèn)工作空間使用“專用容量”,并且已將其分配給已打開(kāi)AI的專用容量實(shí)例。然后選擇保存。
創(chuàng)建工作空間后,可以選擇“歡迎”屏幕右下角的“ 跳過(guò) ”,如下圖所示。
選擇工作區(qū)右上方的Create按鈕,然后選擇Dataflow。
選擇添加新實(shí)體。這將在瀏覽器中啟動(dòng)Power Query編輯器。
選擇Text/CSV File作為數(shù)據(jù)源,如下圖所示。
在接下來(lái)出現(xiàn)的“ 連接到數(shù)據(jù)源”頁(yè)面中,將以下指向online_shoppers_intention.csv的鏈接粘貼到“ 文件路徑”或“ URL”框中,然后選擇“ 下一步”:
//raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv
Power Query Editor顯示CSV文件中數(shù)據(jù)的預(yù)覽。您可以通過(guò)更改右側(cè)窗格中“名稱”框中的值,將查詢重命名為更友好的名稱。例如,您可以將查詢名稱更改為Online Visitors。
Power Query會(huì)自動(dòng)推斷列的類型。您可以通過(guò)單擊列標(biāo)題頂部的屬性類型圖標(biāo)來(lái)更改列類型。在此示例中,我們將“收入”列的類型更改為“真/假”。
選擇“保存并關(guān)閉”按鈕以關(guān)閉Power Query Editor。提供數(shù)據(jù)流的名稱,然后在對(duì)話框上選擇“保存 ”,如下圖所示。
創(chuàng)建和訓(xùn)練機(jī)器學(xué)習(xí)模型
要添加機(jī)器學(xué)習(xí)模型,請(qǐng)?jiān)凇皠?dòng)作”列表中為包含您的訓(xùn)練數(shù)據(jù)和標(biāo)簽信息的基本實(shí)體選擇“應(yīng)用ML模型”按鈕,然后選擇“添加機(jī)器學(xué)習(xí)模型”。
創(chuàng)建機(jī)器學(xué)習(xí)模型的第一步是識(shí)別歷史數(shù)據(jù),包括您想要預(yù)測(cè)的結(jié)果字段。模型將通過(guò)學(xué)習(xí)這些數(shù)據(jù)來(lái)創(chuàng)建。
對(duì)于我們使用的數(shù)據(jù)集,這是收入字段。選擇Revenue作為“輸出字段”值,然后選擇Next。
接下來(lái),我們必須選擇要?jiǎng)?chuàng)建的機(jī)器學(xué)習(xí)模型的類型。Power BI分析您已經(jīng)確定的結(jié)果字段中的值,并建議可以創(chuàng)建哪些類型的機(jī)器學(xué)習(xí)模型來(lái)預(yù)測(cè)該字段。
在本例中,由于我們正在預(yù)測(cè)用戶是否會(huì)購(gòu)買的二進(jìn)制結(jié)果,因此建議使用二進(jìn)制預(yù)測(cè)。因?yàn)槲覀儗?duì)預(yù)測(cè)用戶購(gòu)買感興趣,所以選擇True作為您最感興趣的收入結(jié)果。此外,您可以為自動(dòng)生成的報(bào)告中使用的結(jié)果提供友好的標(biāo)簽,該報(bào)告將總結(jié)模型驗(yàn)證的結(jié)果。然后選擇Next。
接下來(lái),Power BI對(duì)您的數(shù)據(jù)樣本進(jìn)行初步掃描,并提出可能產(chǎn)生更準(zhǔn)確預(yù)測(cè)的輸入建議。如果Power BI不建議使用該字段,則會(huì)在其旁邊提供說(shuō)明。您可以選擇更改選擇,以僅包括您要模型研究的字段,或者可以通過(guò)選擇實(shí)體名稱旁邊的復(fù)選框來(lái)選擇所有字段。選擇下一步接受輸入。
在最后一步,我們必須為模型提供一個(gè)名稱。將模型命名為“購(gòu)買意圖預(yù)測(cè)”。您可以選擇減少培訓(xùn)時(shí)間以查看快速結(jié)果,也可以選擇增加培訓(xùn)時(shí)間以獲得最佳模型。然后選擇保存并訓(xùn)練以開(kāi)始訓(xùn)練模型。
培訓(xùn)過(guò)程將首先對(duì)歷史數(shù)據(jù)進(jìn)行采樣和標(biāo)準(zhǔn)化,然后將數(shù)據(jù)集劃分為兩個(gè)新實(shí)體,即購(gòu)買意向預(yù)測(cè)培訓(xùn)數(shù)據(jù)和購(gòu)買意向預(yù)測(cè)測(cè)試數(shù)據(jù)。
根據(jù)數(shù)據(jù)集的大小,訓(xùn)練過(guò)程可能需要幾分鐘到上一個(gè)屏幕選擇的訓(xùn)練時(shí)間。此時(shí),您可以在數(shù)據(jù)流的“ 機(jī)器學(xué)習(xí)模型”選項(xiàng)卡中看到該模型。就緒狀態(tài)表示該模型已排隊(duì)等待訓(xùn)練或正在訓(xùn)練中。
您可以通過(guò)數(shù)據(jù)流的狀態(tài)來(lái)確認(rèn)正在對(duì)模型進(jìn)行訓(xùn)練和驗(yàn)證。這將在工作區(qū)的Dataflows選項(xiàng)卡中顯示為正在進(jìn)行的數(shù)據(jù)刷新。
模型訓(xùn)練完成后,數(shù)據(jù)流將顯示更新的刷新時(shí)間。您可以通過(guò)導(dǎo)航到數(shù)據(jù)流中的“機(jī)器學(xué)習(xí)模型”選項(xiàng)卡來(lái)確認(rèn)模型已訓(xùn)練。您創(chuàng)建的模型應(yīng)顯示為“已訓(xùn)練”狀態(tài),并且“最后一次訓(xùn)練時(shí)間”現(xiàn)在應(yīng)該更新了。
查看模型驗(yàn)證報(bào)告
要查看模型驗(yàn)證報(bào)告,請(qǐng)?jiān)跈C(jī)器學(xué)習(xí)模型選項(xiàng)卡中,選擇模型的“操作”列中的“查看培訓(xùn)報(bào)告”按鈕。該報(bào)告描述了您的機(jī)器學(xué)習(xí)模型可能如何執(zhí)行。
在報(bào)告的“ 模型性能”頁(yè)面中,選擇“查看最重要的預(yù)測(cè)變量”以查看模型的最重要的預(yù)測(cè)變量。您可以選擇一個(gè)預(yù)測(cè)變量,以查看結(jié)果分布如何與該預(yù)測(cè)變量關(guān)聯(lián)。
您可以使用“模型性能”頁(yè)面上的“概率閾值”切片器來(lái)檢查其對(duì)模型的“精確度”和“調(diào)用”的影響。
報(bào)告的其他頁(yè)面描述了該模型的統(tǒng)計(jì)性能指標(biāo)。
該報(bào)告還包括“培訓(xùn)詳細(xì)信息”頁(yè)面,該頁(yè)面描述了運(yùn)行的不同迭代,如何從輸入中提取特征以及所使用的最終模型的超參數(shù)。
將模型應(yīng)用于數(shù)據(jù)流實(shí)體
選擇報(bào)告頂部的“應(yīng)用模型”按鈕以調(diào)用此模型。在“應(yīng)用”對(duì)話框中,可以指定目標(biāo)實(shí)體,該目標(biāo)實(shí)體具有應(yīng)該將模型應(yīng)用于其的源數(shù)據(jù)。
出現(xiàn)提示時(shí),您必須刷新數(shù)據(jù)流才能預(yù)覽模型的結(jié)果。
應(yīng)用模型將創(chuàng)建兩個(gè)新實(shí)體,后綴分別為<model_name>和<model_name>。在我們的案例中,將模型應(yīng)用于“在線訪問(wèn)者”實(shí)體將創(chuàng)建“在線訪問(wèn)者豐富的購(gòu)買意圖預(yù)測(cè)”,其中包括該模型的預(yù)測(cè)輸出;以及“在線訪問(wèn)者豐富的購(gòu)買意圖預(yù)測(cè)”說(shuō)明,其中包含針對(duì)該預(yù)測(cè)的特定記錄最高影響者。
應(yīng)用二進(jìn)制預(yù)測(cè)模型將添加四列,其中包含預(yù)測(cè)的結(jié)果、概率得分、預(yù)測(cè)的最高記錄特定影響者以及解釋索引,每列均以指定的列名作為前綴。
數(shù)據(jù)流刷新完成后,您可以選擇“在線訪問(wèn)者充實(shí)的購(gòu)買意圖預(yù)測(cè)”實(shí)體來(lái)查看結(jié)果。
在Power BI報(bào)表中使用模型的評(píng)分輸出
要使用機(jī)器學(xué)習(xí)模型的評(píng)分輸出,可以使用數(shù)據(jù)流連接器從Power BI桌面連接到數(shù)據(jù)流?,F(xiàn)在,可以使用“在線訪問(wèn)者豐富的購(gòu)買意圖預(yù)測(cè)”實(shí)體將來(lái)自模型的預(yù)測(cè)合并到Power BI報(bào)表中。
*想要獲得Power BI Desktop、Power BI Pro更多資源或正版授權(quán)的朋友,可以咨詢了解哦~
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@ke049m.cn
文章轉(zhuǎn)載自: