La inferencia estadística es fundamental para Data Science. En este tutorial vamos a usar seaborn y matplotlib para cargar datos reales y visualizar sus distribuciones.

1. Carga de Datos y Análisis Descriptivo

Vamos a cargar el dataset de propinas (tips) y ver su comportamiento básico.


import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# Cargar el dataset 'tips'
df_tips = sns.load_dataset("tips")
print("Primeras 5 filas del dataset tips:")
print(df_tips.head())
print("\nInformación de la media de propinas:")
print(f"Propina media: ${df_tips['tip'].mean():.2f}")


📊 Salida:

Primeras 5 filas del dataset tips:
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4

Información de la media de propinas:
Propina media: $3.00

2. Visualización: Histograma con Intervalo de Confianza

Ahora vamos a generar un histograma que muestre la distribución de las propinas, agregando la media.


mean_tip = df_tips['tip'].mean()

plt.figure(figsize=(10, 6))
sns.histplot(df_tips['tip'], kde=True, bins=20, color='skyblue')
plt.axvline(mean_tip, color='red', linestyle='dashed', linewidth=2, label=f'Media: {mean_tip:.2f}')
plt.title('Distribución de Propinas')
plt.xlabel('Propina ($)')
plt.ylabel('Frecuencia')
plt.legend()
plt.grid(axis='y', alpha=0.75)
plt.show()
Output de Gráfica Python

3. Relación entre Variables (Scatterplot)

Finalmente, veamos si existe una relación lineal entre el total de la cuenta y la propina.


plt.figure(figsize=(10, 6))
sns.scatterplot(x='total_bill', y='tip', data=df_tips, alpha=0.8, hue='time', palette='viridis')
plt.title('Propina vs Total de la Cuenta')
plt.xlabel('Total de la Cuenta ($)')
plt.ylabel('Propina ($)')
plt.grid(True, linestyle='--', alpha=0.7)
plt.show()
Output de Gráfica Python


🤖 Automatiza tu trading en 5 días con Python

Únete a mi Mini-Curso gratuito por email. Aprende a extraer datos reales, crear indicadores cuantitativos y hacer backtesting profesional.