La création de graphiques avec Python

Premier pas

Python est modulaire. Pour créer des graphiques, vous devez installer « Matplotlib ». Pour ce faire, à l’invite du Terminal, vous devez taper :

pip install matplotlib

C’est l’une des bibliothèques de Python les plus utilisés dans le domaine de l’analyse des données pour représenter un graphique en 2D.

Premier graphique!

Tout d’abord, importons le module pyplot.  En début de fichier .py, vous allez inscrire :

import matplotlib.pyplot as plt

La commande Show permet d’ouvrir une fenêtre et d’afficher un graphique dans une fenêtre. Par défaut, le graphique est vide. La commande Close permet de fermer la fenêtre qui est ouverte. La commande Plot permet de tracer un graphique.

 

Finalement, voici notre premier code :

import matplotlib.pyplot as plt
plt.plot([0,1,2])
plt.show()
plt.close()

Permet d’obtenir la droite passant par les points A(0, 0), B(1, 1) et C(2, 2).

 

Référence :   www.matplotlib.org

L’analyse, la modélisation de données et Python

Python a besoin de l’installation du module Pandas pour effectuer tous le processus d’analyse et de modélisation de données.  C’est un outil très performant, très flexible et très productif.

Comment installer le module Pandas ?

Suivant votre installation de Python, il suffit de faire “pip install pandas” dans un terminal. Vous devrez accepter d’installer les libraires dont pandas a besoin, notamment numpy. Une fois pandas installé, vous devez ajouter la ligne “import pandas” dans votre script python pour pouvoir l’exécuter.

Si vous avez utilisé Anaconda ou Canopy pour l’installation de Python, l’installation du module Pandas peut être différent. Vous devrez lire les spécifications de la version de Python installé.

Les cadres de données

Faisons, un retour sur ce que sont les cadres de données. Les cadres de données sont un moyen de stocker les données dans grilles facilement consultables. Les lignes d’un cadre de données n’ont pas besoin de contenir les mêmes types de valeurs. Elles peuvent être numérique, caractère ou logique.

En général, un cadre de données Pandas se compose de trois composants principaux: les données, l’index et les colonnes.

Un cadre de données sont des tableaux structurés qui permettent aux utilisateurs de manipuler les données par des champs nommés.

 

 

 

Pourquoi Python ?

Python est parfait pour débuter à programmer. Vous n’avez pas besoin d’un « framework » pour voir le résultat de votre code.  Il fonctionne sur les systèmes d’exploitation courant soit Windows, Mac (OS X) ou Linux.

Python est utilisé surtout pour sa facilité à traiter les données. Donc, les actuaires, les analystes financiers et les autres professionnels aimant les chiffres seront ravis par les modules d’analyse de données à partir de fichier Excel, de Yahoo Finance ou autres sources.

INSTALLER PYTHON

Aller sur le site officiel de Python et cliquer sur « Download ». Télécharger la version correspondant à votre système d’exploitation : https://www.python.org/

PYTHON 2 ou PYTHON 3 ?

Malgré que la version Python 3 existe depuis longtemps, Python 2 est encore très utilisé. Il existe un outil de conversion du code Python 2 vers Python 3 : 2to3.py mais qui fonctionne sous Windows seulement.  Si vous n’avez pas de code Python 2 dans votre entreprise, je vous recommande la version 3 de Python.

Pour la suite, contactez-nous! Il nous fera plaisir de vous de donner une formation sur mesure selon vos besoins.