Laboratorio Google Colab
Practica código Python real con notebooks interactivos. Abre cada notebook en Google Colab, sigue los pasos guiados y marca como completado cuando termines.
Haz clic en "Abrir en Colab" para cada notebook. Google Colab es un entorno gratuito en la nube — no necesitas instalar nada. Solo necesitas una cuenta de Google. Ejecuta cada celda con Shift + Enter y sigue los pasos guiados.
Regresión Lineal: Predicción de Ventas
Entrena tu primer modelo de regresión lineal con datos de ventas de una cadena retail. Aprende a preparar datos, entrenar el modelo y evaluar con RMSE y R².
- 01Importar librerías: pandas, numpy, sklearn
- 02Cargar y explorar el dataset de ventas
- 03Separar variables X (features) e y (target)
- 04Dividir en train/test con train_test_split
- 05Instanciar y entrenar: model.fit(X_train, y_train)
- 06Evaluar: RMSE y R² con model.score()
- 07Visualizar predicciones vs valores reales
Clasificación: Detección de Fraude
Construye un clasificador Random Forest para detectar transacciones fraudulentas. Evalúa con accuracy, precision, recall y la matriz de confusión.
- 01Cargar dataset de transacciones bancarias
- 02Analizar el desbalance de clases (fraude vs normal)
- 03Aplicar SMOTE para balancear clases
- 04Entrenar RandomForestClassifier
- 05Evaluar con classification_report()
- 06Visualizar matriz de confusión con seaborn
- 07Interpretar trade-off precision/recall
Análisis Exploratorio de Datos (EDA)
Domina el análisis exploratorio con pandas y matplotlib. Aprende a identificar outliers, correlaciones y patrones en datos empresariales antes de modelar.
- 01Cargar datos con pd.read_csv()
- 02Explorar con .info(), .describe(), .head()
- 03Detectar valores nulos con .isnull().sum()
- 04Visualizar distribuciones con histogramas
- 05Analizar correlaciones con heatmap
- 06Identificar outliers con boxplots
- 07Documentar hallazgos para el equipo
Clustering: Segmentación de Clientes
Aplica K-Means para segmentar clientes por comportamiento de compra. Determina el número óptimo de clusters con el método del codo.
- 01Preparar features de comportamiento (RFM)
- 02Escalar con StandardScaler
- 03Aplicar método del codo para k óptimo
- 04Entrenar KMeans con k seleccionado
- 05Reducir dimensionalidad con PCA para visualizar
- 06Interpretar cada segmento de clientes
- 07Proponer estrategia de marketing por segmento
Redes Neuronales con TensorFlow
Construye tu primera red neuronal con Keras/TensorFlow para predecir el abandono de clientes (churn). Aprende sobre capas, funciones de activación y backpropagation.
- 01Instalar e importar TensorFlow/Keras
- 02Preparar datos de churn (encoding, scaling)
- 03Definir arquitectura: Sequential con capas Dense
- 04Compilar: optimizer='adam', loss='binary_crossentropy'
- 05Entrenar con model.fit() y validation_split
- 06Visualizar curvas de loss y accuracy
- 07Evaluar en test set y ajustar hiperparámetros
Comandos esenciales de Python para ML
df = pd.read_csv('datos.csv')df.describe() df.info() df.head()
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model = RandomForestClassifier() model.fit(X_train, y_train)
print(classification_report(y_test, y_pred))
rmse = mean_squared_error(y_test, y_pred, squared=False) r2 = r2_score(y_test, y_pred)