// módulo 16 · laboratorio práctico

Laboratorio Google Colab

Practica código Python real con notebooks interactivos. Abre cada notebook en Google Colab, sigue los pasos guiados y marca como completado cuando termines.

Progreso del laboratorio0/5 notebooks

¿Cómo usar Google Colab?

Haz clic en "Abrir en Colab" para cada notebook. Google Colab es un entorno gratuito en la nube — no necesitas instalar nada. Solo necesitas una cuenta de Google. Ejecuta cada celda con Shift + Enter y sigue los pasos guiados.

Regresión

Básico

Regresión Lineal: Predicción de Ventas

Entrena tu primer modelo de regresión lineal con datos de ventas de una cadena retail. Aprende a preparar datos, entrenar el modelo y evaluar con RMSE y R².

30 min

PASOS GUIADOS

01Importar librerías: pandas, numpy, sklearn
02Cargar y explorar el dataset de ventas
03Separar variables X (features) e y (target)
04Dividir en train/test con train_test_split
05Instanciar y entrenar: model.fit(X_train, y_train)
06Evaluar: RMSE y R² con model.score()
07Visualizar predicciones vs valores reales

pandasscikit-learnLinearRegressionRMSER²

Abrir en Colab

Clasificación

Intermedio

Clasificación: Detección de Fraude

Construye un clasificador Random Forest para detectar transacciones fraudulentas. Evalúa con accuracy, precision, recall y la matriz de confusión.

45 min

PASOS GUIADOS

01Cargar dataset de transacciones bancarias
02Analizar el desbalance de clases (fraude vs normal)
03Aplicar SMOTE para balancear clases
04Entrenar RandomForestClassifier
05Evaluar con classification_report()
06Visualizar matriz de confusión con seaborn
07Interpretar trade-off precision/recall

RandomForestClassifierAccuracyPrecisionRecallConfusion Matrix

Abrir en Colab

EDA

Básico

Análisis Exploratorio de Datos (EDA)

Domina el análisis exploratorio con pandas y matplotlib. Aprende a identificar outliers, correlaciones y patrones en datos empresariales antes de modelar.

25 min

PASOS GUIADOS

01Cargar datos con pd.read_csv()
02Explorar con .info(), .describe(), .head()
03Detectar valores nulos con .isnull().sum()
04Visualizar distribuciones con histogramas
05Analizar correlaciones con heatmap
06Identificar outliers con boxplots
07Documentar hallazgos para el equipo

pandasmatplotlibseaborndescribe()corr()boxplot

Abrir en Colab

Clustering

Intermedio

Clustering: Segmentación de Clientes

Aplica K-Means para segmentar clientes por comportamiento de compra. Determina el número óptimo de clusters con el método del codo.

35 min

PASOS GUIADOS

01Preparar features de comportamiento (RFM)
02Escalar con StandardScaler
03Aplicar método del codo para k óptimo
04Entrenar KMeans con k seleccionado
05Reducir dimensionalidad con PCA para visualizar
06Interpretar cada segmento de clientes
07Proponer estrategia de marketing por segmento

KMeansElbow MethodSilhouette ScorePCAVisualización 2D

Abrir en Colab

Deep Learning

Avanzado

Redes Neuronales con TensorFlow

Construye tu primera red neuronal con Keras/TensorFlow para predecir el abandono de clientes (churn). Aprende sobre capas, funciones de activación y backpropagation.

50 min

PASOS GUIADOS

01Instalar e importar TensorFlow/Keras
02Preparar datos de churn (encoding, scaling)
03Definir arquitectura: Sequential con capas Dense
04Compilar: optimizer='adam', loss='binary_crossentropy'
05Entrenar con model.fit() y validation_split
06Visualizar curvas de loss y accuracy
07Evaluar en test set y ajustar hiperparámetros

TensorFlowKerasDense layersReLUSigmoidBackpropagation

Abrir en Colab

Comandos esenciales de Python para ML

Cargar datos

df = pd.read_csv('datos.csv')

Explorar datos

df.describe()
df.info()
df.head()

Dividir train/test

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

Entrenar modelo

model = RandomForestClassifier()
model.fit(X_train, y_train)

Evaluar clasificación

print(classification_report(y_test, y_pred))

Evaluar regresión

rmse = mean_squared_error(y_test, y_pred, squared=False)
r2 = r2_score(y_test, y_pred)