40 lines
1.0 KiB
Markdown
40 lines
1.0 KiB
Markdown
---
|
|
id: 5e9a093a74c4063ca6f7c15f
|
|
title: Pulizia di dati duplicati
|
|
challengeType: 11
|
|
videoId: kj7QqjXhH6A
|
|
dashedName: data-cleaning-duplicates
|
|
---
|
|
|
|
# --description--
|
|
|
|
*Invece di usare notebooks.ai come mostrato nel video, puoi usare Google Colab.*
|
|
|
|
Altre risorse:
|
|
|
|
- [Notebook su GitHub](https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp)
|
|
- [Come aprire Notebooks da GitHub usando Google Colab.](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
|
|
|
|
# --question--
|
|
|
|
## --text--
|
|
|
|
Il metodo di Python `.duplicated()` restituisce una serie booleana per il tuo DataFrame. `True` è restuito per righe che:
|
|
|
|
## --answers--
|
|
|
|
contengono un duplicato, dove il valore della riga contiene la prima occorrenza del valore.
|
|
|
|
---
|
|
|
|
contengono un duplicato, dove il valore per quella riga è almeno la seconda occorrenza di quel valore.
|
|
|
|
---
|
|
|
|
contengono un duplicato, dove il valore per quella riga è la prima oppure la seconda occorrenza.
|
|
|
|
## --video-solution--
|
|
|
|
2
|
|
|