Introduction à Pandas

Pandas est l’élément central de l’écosystème Python pour la data science. Le succès récent de Python dans l’analyse de données tient beaucoup à Pandas qui a permis d’importer la logique SQL dans le langage Python. Pandas embarque énormément de fonctionalités qui permettent d’avoir des chaînes de traitement efficaces pour traiter des données de volumétrie moyenne (jusqu’à quelques Gigas). Au-delà de cette volumétrie, il faudra se tourner vers d’autres solutions (DuckDB, Dask, Polars, Spark…).


Lino Galiana

Date de publication


La partie Pandas a évolué récemment. Vous pouvez retrouver les contenus liés à Pandas dans les chapitres suivants:

  author = {Galiana, Lino},
  title = {Python pour la data science},
  date = {2023},
  url = {},
  doi = {10.5281/zenodo.8229676},
  langid = {fr}
Veuillez citer ce travail comme suit :
Galiana, Lino. 2023. Python pour la data science.