Joining Data with pandas

Il corso “Joining Data with pandas” è stato un’opportunità per approfondire le gli strumenti necessari per combinare e lavorare con dati provenienti da diverse fonti utilizzando la libreria Pandas, una capacità fondamentale per qualsiasi aspirante Data Scientist.
Durante questo corso, ho acquisito una solida padronanza nell’elaborazione di dati attraverso la combinazione, l’organizzazione, il join e la trasformazione di DataFrame utilizzando pandas.

Il corso è stato strutturato in quattro moduli distinti:

Modulo 1: Data Merging Basics In questo modulo, ho imparato come unire dati eterogenei utilizzando inner joins. Ho scoperto come combinare informazioni da diverse fonti per svelare informazioni che avrebbero potuto restare nascoste. Inoltre, ho acquisito una comprensione approfondita delle relazioni tra le fonti di dati, come le relazioni uno-a-uno o uno-a-molti, e come queste relazioni possano influenzare il risultato finale.

Modulo 2: Merging Tables With Different Join Types Questo modulo mi ha permesso di portare le mie competenze nei join a un livello superiore. Ho lavorato con dati relativi ai film provenienti da TMDb, apprendendo i concetti di left, right e outer joins. Inoltre, ho scoperto come unire una tabella a se stessa e come eseguire il merge basandosi sull’indice di un DataFrame.

Modulo 3: Advanced Merging and Concatenating Nel terzo modulo, ho appreso tecniche avanzate di filtraggio, compresi semi-joins e anti-joins. Ho imparato anche come unire DataFrame in modo verticale, utilizzando la funzione pandas.concat per creare nuovi dataset. Inoltre, ho acquisito competenze cruciali per la validazione delle strutture dati combinate, considerando la complessità e la varietà dei dati reali.

Modulo 4: Merging Ordered and Time-Series Data Nel capitolo finale, ho affrontato dati ordinali e sere storiche, applicando metodi specializzati di pandas per unire dati finanziari ed economici reali provenienti dalla città di Chicago. Inoltre, ho imparato come interrogare tabelle risultanti utilizzando un formato simile a SQL (con la funzione QUERY e come eseguire l’operazione di unpivot dei dati utilizzando il metodo melt.

Al termine di questo corso, ho consolidato le mie competenze nella manipolazione e nell’unione di dati con pandas, aumentando notevolmente la mia capacità di analizzare dati complessi provenienti da diverse fonti.

Chiudi
Giuseppe Legrottaglie © Copyright 2021. All rights reserved.
Chiudi