2021-05-05 17:13:49 +00:00
|
|
|
---
|
|
|
|
id: 5e9a093a74c4063ca6f7c15f
|
2021-07-16 05:33:16 +00:00
|
|
|
title: 數據 清理重複項
|
2021-05-05 17:13:49 +00:00
|
|
|
challengeType: 11
|
|
|
|
videoId: kj7QqjXhH6A
|
2021-10-03 19:24:27 +00:00
|
|
|
bilibiliIds:
|
|
|
|
aid: 675611672
|
|
|
|
bvid: BV1VU4y1A7tu
|
|
|
|
cid: 409019368
|
2021-05-05 17:13:49 +00:00
|
|
|
dashedName: data-cleaning-duplicates
|
|
|
|
---
|
|
|
|
|
|
|
|
# --description--
|
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
*在視頻中我們使用的編輯器工具是在 notebook.ai 這個平臺,你也可以選擇用其他的平臺,比如說 Google Colab 也是一個不錯的選擇。*
|
2021-05-05 17:13:49 +00:00
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
以下有更多的資料:
|
2021-05-05 17:13:49 +00:00
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
- [在 GitHub 平臺的 Notebooks](https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp)
|
|
|
|
- [如何使用 Google Colab 來打開 GitHub 上的 Notebooks](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
|
2021-05-05 17:13:49 +00:00
|
|
|
|
|
|
|
# --question--
|
|
|
|
|
|
|
|
## --text--
|
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
Python 方法 `.duplicated()` 將針對你的 DataFrame 返回一個儲存着布爾值的 Series。 `True` 是行的返回值:
|
2021-05-05 17:13:49 +00:00
|
|
|
|
|
|
|
## --answers--
|
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
包含一個重複值,並且它表示了在這一行這一重複值第一次出現。
|
2021-05-05 17:13:49 +00:00
|
|
|
|
|
|
|
---
|
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
包含一個重複值,並且它表示了在這一行這一重複值至少第二次出現。
|
2021-05-05 17:13:49 +00:00
|
|
|
|
|
|
|
---
|
|
|
|
|
2021-07-16 05:33:16 +00:00
|
|
|
包含一個重複值,並且它表示了在這一行這一重複值第一次或第二次出現。
|
2021-05-05 17:13:49 +00:00
|
|
|
|
|
|
|
## --video-solution--
|
|
|
|
|
|
|
|
2
|
|
|
|
|