freeCodeCamp/curriculum/challenges/chinese-traditional/08-data-analysis-with-python/data-analysis-with-python-p.../demographic-data-analyzer.md

4.6 KiB
Raw Blame History

id title challengeType forumTopicId dashedName
5e46f7e5ac417301a38fb929 人口統計數據分析器 10 462367 demographic-data-analyzer

--description--

你將使用我們在 Replit 的初始化項目來完成這個項目。

我們仍在開發 Python 課程的交互式教學部分。 目前,你可以在 YouTube 上通過 freeCodeCamp.org 上傳的一些視頻學習這個項目相關的知識。

--instructions--

在這個挑戰中,你必須使用 Pandas 對人口統計進行分析。 你將獲得從 1994 年人口普查數據庫中提取的人口統計數據數據集。 以下是數據的示例:

|    |   age | workclass        |   fnlwgt | education   |   education-num | marital-status     | occupation        | relationship   | race   | sex    |   capital-gain |   capital-loss |   hours-per-week | native-country   | salary   |
|---:|------:|:-----------------|---------:|:------------|----------------:|:-------------------|:------------------|:---------------|:-------|:-------|---------------:|---------------:|-----------------:|:-----------------|:---------|
|  0 |    39 | State-gov        |    77516 | Bachelors   |              13 | Never-married      | Adm-clerical      | Not-in-family  | White  | Male   |           2174 |              0 |               40 | United-States    | <=50K    |
|  1 |    50 | Self-emp-not-inc |    83311 | Bachelors   |              13 | Married-civ-spouse | Exec-managerial   | Husband        | White  | Male   |              0 |              0 |               13 | United-States    | <=50K    |
|  2 |    38 | Private          |   215646 | HS-grad     |               9 | Divorced           | Handlers-cleaners | Not-in-family  | White  | Male   |              0 |              0 |               40 | United-States    | <=50K    |
|  3 |    53 | Private          |   234721 | 11th        |               7 | Married-civ-spouse | Handlers-cleaners | Husband        | Black  | Male   |              0 |              0 |               40 | United-States    | <=50K    |
|  4 |    28 | Private          |   338409 | Bachelors   |              13 | Married-civ-spouse | Prof-specialty    | Wife           | Black  | Female |              0 |              0 |               40 | Cuba             | <=50K    |

你必須使用 Pandas 來回答以下問題:

  • 這個數據集中每個種族有多少人? 這應該是一個以種族名稱作爲索引標籤的 Pandas 系列。 race 欄)
  • 男性的平均年齡是多少?
  • 擁有學士學位的人的百分比是多少?
  • 受過高等教育(Bachelors, Masters, or Doctorate)收入超過 50K 的人佔多大比例?
  • 沒有受過高等教育的人的收入超過 50K 的比例是多少?
  • 一個人每週最少工作多少小時?
  • 每週工作最少小時數的人中有多少人的工資超過 50K
  • 哪個國家/地區的收入 >50K 的人口比例最高,該比例是多少?
  • 確定印度收入 >50K 的人最受歡迎的職業。

使用文件 demographic_data_analyzer 中的啓動代碼。 更新代碼以便將所有設置爲“None”的變量設置爲適當的計算或代碼。 將所有小數四捨五入到最接近的十分之一。

單元測試是在 test_module.py 下爲你編寫的。

開發

對於開發,你可以使用 main.py 來測試你的函數。 單擊“運行”按鈕,main.py 將運行。

測試

爲了你的方便,我們將測試從 test_module.py 導入到 main.py。 只要你點擊“運行”按鈕,測試就會自動運行。

提交

複製項目的 URL 並將其提交給 freeCodeCamp。

數據集源

Dua, D. and Graff, C. (2019). UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science.

--hints--

它應該通過所有的 Python 測試。


--solutions--

  # Python challenges don't need solutions,
  # because they would need to be tested against a full working project.
  # Please check our contributing guidelines to learn more.