# ====================================
# Common imports used across regression models
# ====================================

import numpy as np
import pandas as pd

from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

from sklearn.metrics import (
    mean_squared_error,
    mean_absolute_error,
    r2_score
)

from pathlib import Path
import joblib
import matplotlib.pyplot as plt

import torch
import torch.nn as nn
import torch.optim as optim

# ====================================
# Dataset loading
# ====================================

data = fetch_california_housing(as_frame=True)

X = data.data
y = data.target

# ====================================
# Train-test split
# ====================================

X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.2,
    random_state=42
)

# ====================================
# Feature scaling
# ====================================

scaler = StandardScaler()

X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# ====================================
# Model definition
# ====================================

class RegressionNet(nn.Module):
    def __init__(self, input_dim):
        super().__init__()

        self.fc1 = nn.Linear(input_dim, 64)
        self.fc2 = nn.Linear(64, 32)
        self.out = nn.Linear(32, 1)

        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.out(x)
        return x

# ====================================
# Training setup
# ====================================

input_dim = X_train_scaled.shape[1]

model = RegressionNet(input_dim)

criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# ====================================
# Training loop
# ====================================

X_train_tensor = torch.tensor(X_train_scaled, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train.values, dtype=torch.float32).view(-1, 1)

epochs = 100
losses = []

for epoch in range(epochs):
    model.train()

    optimizer.zero_grad()

    outputs = model(X_train_tensor)
    loss = criterion(outputs, y_train_tensor)

    loss.backward()
    optimizer.step()

    losses.append(loss.item())

# ====================================
# Predictions
# ====================================

model.eval()

X_test_tensor = torch.tensor(X_test_scaled, dtype=torch.float32)

with torch.no_grad():
    y_pred_tensor = model(X_test_tensor)

y_pred = y_pred_tensor.numpy().flatten()

# ====================================
# Regression evaluation metrics
# ====================================

mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

mse, rmse, mae, r2

(0.7457036463188563,
 np.float64(0.8635413402488942),
 0.626965656223535,
 0.4309382347792724)

# ====================================
# Model persistence
# ====================================

model_dir = Path("models/supervised_learning/regression/deep_learning_pytorch")
model_dir.mkdir(parents=True, exist_ok=True)

# Save model state
torch.save(model.state_dict(), model_dir / "pytorch_regression_model.pt")

# Save scaler
joblib.dump(scaler, model_dir / "scaler.joblib")

# ====================================
# Imports
# ====================================

import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim

from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

from pathlib import Path
import joblib


# ====================================
# Dataset loading
# ====================================

data = fetch_california_housing(as_frame=True)
X = data.data
y = data.target


# ====================================
# Train-test split
# ====================================

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)


# ====================================
# Feature scaling
# ====================================

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)


# ====================================
# Model definition
# ====================================

class RegressionNet(nn.Module):
    def __init__(self, input_dim):
        super().__init__()
        self.fc1 = nn.Linear(input_dim, 64)
        self.fc2 = nn.Linear(64, 32)
        self.out = nn.Linear(32, 1)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        return self.out(x)


input_dim = X_train_scaled.shape[1]
model = RegressionNet(input_dim)


# ====================================
# Training setup
# ====================================

criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

X_train_tensor = torch.tensor(X_train_scaled, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train.values, dtype=torch.float32).view(-1, 1)


# ====================================
# Training loop
# ====================================

epochs = 100

for _ in range(epochs):
    optimizer.zero_grad()
    outputs = model(X_train_tensor)
    loss = criterion(outputs, y_train_tensor)
    loss.backward()
    optimizer.step()


# ====================================
# Predictions
# ====================================

model.eval()
X_test_tensor = torch.tensor(X_test_scaled, dtype=torch.float32)

with torch.no_grad():
    y_pred = model(X_test_tensor).numpy().flatten()


# ====================================
# Evaluation
# ====================================

mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

mse, rmse, mae, r2


# ====================================
# Model persistence
# ====================================

model_dir = Path("models/supervised_learning/regression/deep_learning_pytorch")
model_dir.mkdir(parents=True, exist_ok=True)

torch.save(model.state_dict(), model_dir / "pytorch_regression_model.pt")
joblib.dump(scaler, model_dir / "scaler.joblib")

Deep Learning – Regression (PyTorch)¶

Notebook Roadmap (standard ML-Methods)¶

How this notebook should be read¶

What is Deep Learning (in this context)?¶

What do we want to achieve?¶

Why use PyTorch for regression?¶

What you should expect from the results¶

1. Project setup and common pipeline¶

PyTorch vs scikit-learn (at a glance)¶

2. Dataset loading¶

Inputs and target¶

3. Train-test split¶

Why this step is essential¶

4. Feature scaling (why we do it)¶

Why we use standardization here¶

5. What is this model? (Deep Learning Regression – PyTorch)¶

How regression works in a neural network¶

What PyTorch adds conceptually¶

High-level learning process¶

Key takeaway¶

6. Model training (PyTorch Regression)¶

What is happening during training¶

7. Model behavior and key parameters¶

Model architecture¶

Loss function¶

Optimizer behavior¶

Training duration¶

Key takeaway¶

8. Predictions¶

What happens during prediction¶

What we have now¶

9. Model evaluation¶

How to read these results¶

Key takeaway¶

10. When to use it and when not to¶

When to use PyTorch for regression¶

When NOT to use PyTorch for regression¶

Key takeaway¶

11. Model persistence¶

What we have saved¶

Why saving the scaler matters¶

12. Mathematical formulation (deep dive)¶

Regression objective¶

Model as a function¶

Layer transformations¶

Loss function¶

Optimization¶

Final takeaway¶

13. Final summary – Code only¶