亚洲第一国产,老熟女毛茸茸浓毛,日韩亚洲精品视频

Pandas教程：Python數(shù)據(jù)框架的10個常見問題

翻譯|使用教程|編輯：鮑佳佳|2021-03-04 10:40:31.320|閱讀 134 次

概述：當您開始使用Python進行數(shù)據(jù)分析和數(shù)據(jù)科學(xué)時，Pandas是您將學(xué)習(xí)的第一個庫之一。其可幫助您處理數(shù)據(jù)集，轉(zhuǎn)換和清理數(shù)據(jù)以及獲取統(tǒng)計信息。在本教程中，我們將回答人們在使用熊貓時遇到的10個最常見的問題。

# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>

相關(guān)鏈接：

PyCharm是一種Python IDE，其帶有一整套可以幫助用戶在使用Python語言開發(fā)時提高其效率的工具。此外，該IDE提供了一些高級功能，以用于Django框架下的專業(yè)Web開發(fā)。PyCharm現(xiàn)已加入在線訂購，點擊此處了解價格詳情。

點擊下載PyCharm最新試用版

Pandas教程：Python數(shù)據(jù)框架的10個常見問題

當您開始使用Python進行數(shù)據(jù)分析和數(shù)據(jù)科學(xué)時，Pandas是您將學(xué)習(xí)的第一個庫之一。其可幫助您處理數(shù)據(jù)集，轉(zhuǎn)換和清理數(shù)據(jù)以及獲取統(tǒng)計信息。

Pandas教程：有關(guān)Python數(shù)據(jù)幀的10個常見問題

在本教程中，我們將回答人們在使用熊貓時遇到的10個最常見的問題。

數(shù)據(jù)集

在本教程的第一部分中，我們將使用包含城市人口樣本數(shù)據(jù)以及有關(guān)土地面積和人口密度的一些信息的數(shù)據(jù)集。

Pandas Loc和iloc

pandas.loc[] 有助于通過標簽或布爾數(shù)組切片訪問一組行和列。

讓我們選擇墨西哥城的人口。

下面我們僅打印墨西哥城的人口。

使用，.iloc[]您可以使用數(shù)字整數(shù)索引選擇列。

請記住以下幾點：

平原:用于選擇行/列中的所有數(shù)據(jù)。
0:2 將選擇行/列0和1。不包括2。
-1 將選擇最后一個元素。

重命名列

接下來，我們將重命名這些列，以使它們將來更易于訪問。

有幾種方法可以做到這一點：

直接分配df.columns一個列名稱數(shù)組。
用df.rename重命名特定列。

在pandas DataFrame中選擇多個列

讓我們將DataFrame分為兩個包含以下內(nèi)容的DataFrame：

城市，國家和人口。
城市，區(qū)域和密度。

我們可以通過幾種方式做到這一點：

通過使用.iloc[:, 0:3]，其中括號中的第一個參數(shù)選擇所有行，第二個參數(shù)選擇列0，列1和列2。
通過將DataFrame切片為double[]并輸入要選擇的列名。

熊貓按列合并兩個表

接下來，我們將垂直連接我們創(chuàng)建的兩個表。這些表具有相同的City列，因此我們將使用該pd.merge函數(shù)來連接兩個表。

該left_on和right_on參數(shù)指示列名在第一和第二個表合并上。

使用pandas更改pandas中的列類型

與數(shù)據(jù)幀的工作進一步，我們需要轉(zhuǎn)變Population，Area以及Density從字符串列轉(zhuǎn)換為數(shù)字。

為此，我們將：

創(chuàng)建一個函數(shù)，to_int()它將帶有'，'符號的字符串轉(zhuǎn)換為整數(shù)。
將apply函數(shù)與lambda表達式一起使用。

分組并變成一個DataFrame

現(xiàn)在，讓我們對DataFrame進行分組，Country并計算此數(shù)據(jù)樣本中每個國家/地區(qū)的人口。
困難之pd.groupby處在于它返回一個groupby對象，而不是DataFrame。在下面的示例中，我們將展示如何從groupby對象創(chuàng)建DataFrame。

我們將對進行分組Country，同時計算Population和Area列的總和。我們將刪除密度列，因為我們不再需要它。