La librería Matplotlib
Matplotlib es una librería de Python especializada en la creación de gráficos en dos dimensiones.
Permite crear y personalizar los tipos de gráficos más comunes, entre ellos:
- Diagramas de barras
- Histograma
- Diagramas de sectores
- Diagramas de caja y bigotes
- Diagramas de violín
- Diagramas de dispersión o puntos
- Diagramas de lineas
- Diagramas de areas
- Diagramas de contorno
- Mapas de color
y combinaciones de todos ellos.
En la siguiente galería de gráficos pueden apreciarse todos los tipos de gráficos que pueden crearse con esta librería.
Creación de gráficos con matplotlib
Para crear un gráfico con matplotlib es habitual seguir los siguientes pasos:
-
Importar el módulo
pyplot
. -
Definir la figura que contendrá el gráfico, que es la region (ventana o página) donde se dibujará y los ejes sobre los que se dibujarán los datos. Para ello se utiliza la función
subplots()
. -
Dibujar los datos sobre los ejes. Para ello se utilizan distintas funciones dependiendo del tipo de gráfico que se quiera.
-
Personalizar el gráfico. Para ello existen multitud de funciones que permiten añadir un título, una leyenda, una rejilla, cambiar colores o personalizar los ejes.
-
Guardar el gráfico. Para ello se utiliza la función
savefig()
. -
Mostrar el gráfico. Para ello se utiliza la función
show()
.
# (1)!
# Importar el módulo pyplot con el alias plt
import matplotlib.pyplot as plt
# Crear la figura y los ejes
fig, ax = plt.subplots()
# Dibujar puntos
ax.scatter(x = [1, 2, 3], y = [3, 2, 1])
# Guardar el gráfico en formato png
plt.savefig('diagrama-dispersion.png')
# Mostrar el gráfico
plt.show()
- Debes instalar la libreria de matplotlib en tu intérprete con el siguiente comando
pip install matplotlib
.
Diagramas de dispersión o puntos
scatter(x, y)
: Dibuja un diagrama de puntos con las coordenadas de la listax
en el eje X y las coordenadas de la listay
en el eje Y.
Diagramas de líneas
plot(x, y)
: Dibuja un polígono con los vértices dados por las coordenadas de la listax
en el eje X y las coordenadas de la listay
en el eje Y.
Diagramas de areas
fill_between(x, y)
: Dibuja el area bajo el polígono con los vértices dados por las coordenadas de la listax
en el eje X y las coordenadas de la listay
en el eje Y.
Diagramas de barras verticales
bar(x, y)
: Dibuja un diagrama de barras verticales dondex
es una lista con la posición de las barras en el eje X, ey
es una lista con la altura de las barras en el eje Y.
Diagramas de barras horizontales
barh(x, y)
: Dibuja un diagrama de barras horizontales dondex
es una lista con la posición de las barras en el eje Y, ey
es una lista con la longitud de las barras en el eje X.
Histogramas
hist(x, bins)
: Dibuja un histograma con las frecuencias resultantes de agrupar los datos de la listax
en las clases definidas por la listabins
.
Diagramas de sectores
Diagramas de caja y bigotes
Diagramas de violín
Diagramas de contorno
contourf(x, y, z)
: Dibuja un diagrama de contorno con las curvas de nivel de la superficie dada por los puntos con las coordenadas de las listasx
,y
yz
en los ejes X, Y y Z respectivamente.
Mapas de color
hist2d(x, y)
: Dibuja un mapa de color que simula un histograma bidimensional, donde los colores de los cuadrados dependen de las frecuencias de las clases de la muestra dada por las listasx
ey
.

Cambiar el aspecto de los gráficos
Los gráficos creados con Matplotlib son personalizables y puede cambiarse el aspecto de casi todos sus elementos. Los elementos que suelen modificarse más a menudo son:
- Colores
- Marcadores de puntos
- Estilo de líneas
- Títulos
- Ejes
- Leyenda
- Rejilla
Colores
Para cambiar el color de los objetos se utiliza el parámetro color = nombre-color
, donde nombre-color
es una cadena con el nombre del color de entre los colores disponibles.
Marcadores
Para cambiar la forma de los puntos marcadores se utiliza el parámetro marker = nombre-marcador
donde nombre-marcador
es una cadena con el nombre del marcador de entre los marcadores disponibles
Líneas
Para cambiar el estilo de las líneas se utiliza el parámetro linestyle = nombre-estilo
donde nombre-estilo
es una cadena con el nombre del estilo de entre los estilos disponibles
Títulos
Para añadir un título principal al gráfico se utiliza el siguiente método:
ax.set_title(titulo, loc=alineacion, fontdict=fuente)
: Añade un título con el contenido de la cadenatitulo
a los ejesax
. El parámetroloc
indica la alineación del título, que puede ser'left'
(izquierda),'center'
(centro) o'right'
(derecha), y el parámetrofontdict
indica mediante un diccionario las características de la fuente (la el tamañofontisize
, el grosorfontweight
o el colorcolor
).
Ejes
Para cambiar el aspecto de los ejes se suelen utilizar los siguientes métodos:
ax.set_xlabel(titulo)
: Añade un título con el contenido de la cadenatitulo
al eje x deax
. Se puede personalizar la alineación y la fuente con los mismos parámetros que para el título principal.ax.set_ylabel(titulo)
: Añade un título con el contenido de la cadenatitulo
al eje y deax
. Se puede personalizar la alineación y la fuente con los mismos parámetros que para el título principal.ax.set_xlim([limite-inferior, limite-superior])
: Establece los límites que se muestran en el eje x deax
.ax.set_ylim([limite-inferior, limite-superior])
: Establece los límites que se muestran en el eje y deax
.ax.set_xticks(marcas)
: Dibuja marcas en el eje x deax
en las posiciones indicadas en la listamarcas
.ax.set_yticks(marcas)
: Dibuja marcas en el eje y deax
en las posiciones indicadas en la listamarcas
.ax.set_xscale(escala)
: Establece la escala del eje x deax
, donde el parámetroescala
puede ser'linear'
(lineal) o'log'
(logarítmica).ax.set_yscale(escala)
: Establece la escala del eje y deax
, donde el parámetroescala
puede ser'linear'
(lineal) o'log'
(logarítmica).
Leyenda
Para añadir una leyenda a un gráfico se utiliza el siguiente método:
ax.legend(leyendas, loc = posición)
: Dibuja un leyenda en los ejesax
con los nombres indicados en la listaleyendas
. El parámetroloc
indica la posición en la que se dibuja la leyenda y puede ser'upper left'
(arriba izquierda),'upper center'
(arriba centro),'upper right'
(arriba derecha),'center left'
(centro izquierda),'center'
(centro),'center right'
(centro derecha),'lower left'
(abajo izquierda),'lower center'
(abajo centro),'lower right'
(abajo derecha). Se puede omitir la listaleyendas
si se indica la leyenda de cada serie en la función que la dibuja mediante el parámetrolabel
.
Rejilla
ax.grid(axis=ejes, color=color, linestyle=estilo)
: Dibuja una rejilla en los ejes de ax
. El parámetro axis
indica los ejes sobre los que se dibuja la regilla y puede ser 'x'
(eje x), 'y'
(eje y) o 'both'
(ambos). Los parámetros color
y linestyle
establecen el color y el estilo de las líneas de la rejilla, y pueden tomar los mismos valores vistos en los apartados de colores y líneas.
Múltiples gráficos
Es posible dibujar varios gráficos en distintos ejes en una misma figura organizados en forma de tabla. Para ello, cuando se inicializa la figura y los ejes, hay que pasarle a la función subplots
el número de filas y columnas de la tabla que contendrá los gráficos. Con esto los distintos ejes se organizan en un array y se puede acceder a cada uno de ellos a través de sus índices. Si se quiere que los distintos ejes compartan los mismos límites para los ejes se pueden pasar los parámetros sharex = True
para el eje x o sharey = True
para el eje y.
Integración con Pandas
Matplotlib se integra a la perfección con la librería Pandas, permitiendo dibujar gráficos a partir de los datos de las series y DataFrames de Pandas.
df.plot(kind=tipo, x=columnax, y=columnay, ax=ejes)
: Dibuja un diagrama del tipo indicado por el parámetrokind
en los ejes indicados en el parámetroax
, representando en el eje x la columna del parámetrox
y en el eje y la columna del parámetroy
. El parámetrokind
puede tomar como argumentos'line'
(lineas),'scatter'
(puntos),'bar'
(barras verticales),'barh'
(barras horizontales),'hist'
(histograma),'box'
(cajas),'density'
(densidad),'area'
(area) o'pie'
(sectores). Es posible pasar otros parámetros para indicar el color, el marcador o el estilo de línea como se vió en los apartados anteriores.
Si no se indican los parámetros x
e y
se representa el índice de las filas en el eje x y una serie por cada columna del Dataframe. Las columnas no numéricas se ignoran.