Source code for deepblink.models._models

"""Model class, to be extended by specific types of models."""
# pylint: disable=R0913

from typing import Callable, Dict, List
import datetime

import numpy as np
import tensorflow as tf

from ..datasets import Dataset
from ..datasets import SequenceDataset
from ..losses import f1_score
from ..losses import rmse

DATESTRING = datetime.datetime.now().strftime("%Y%d%m_%H%M")


[docs]class Model:
    """Base class, to be subclassed by predictors for specific type of data, e.g. spots.

    Args:
        dataset_args: Dataset arguments containing - version, cell_size, flip,
            illuminate, rotate, gaussian_noise, and translate.
        dataset_cls: Specific dataset class.
        network_args: Network arguments containing - n_channels.
        network_fn: Network function returning a built model.
        loss_fn: Loss function.
        optimizer_fn: Optimizer function.
        train_args: Training arguments containing - batch_size, epochs, learning_rate.
        pre_model: Loaded, pre-trained model to bypass a new network creation.

    Kwargs:
        batch_format_fn: Formatting function added in the specific model, e.g. spots.
        batch_augment_fn: Same as batch_format_fn for augmentation.
    """

    def __init__(
        self,
        augmentation_args: Dict,
        dataset_args: Dict,
        dataset_cls: Dataset,
        network_args: Dict,
        network_fn: Callable,
        loss_fn: Callable,
        optimizer_fn: Callable,
        train_args: Dict,
        pre_model: tf.keras.models.Model = None,
        **kwargs,
    ):
        self.name = f"{DATESTRING}_{self.__class__.__name__}_{dataset_cls.name}_{network_fn.__name__}"

        self.augmentation_args = augmentation_args
        self.batch_augment_fn = kwargs.get("batch_augment_fn", None)
        self.batch_format_fn = kwargs.get("batch_format_fn", None)
        self.dataset_args = dataset_args
        self.loss_fn = loss_fn
        self.optimizer_fn = optimizer_fn
        self.train_args = train_args
        self.has_pre_model = pre_model is not None

        if self.has_pre_model:
            self.network: tf.keras.models.Model = pre_model
        else:
            try:
                self.network = network_fn(**network_args)
            except TypeError:
                print("Default network args used.")
                self.network = network_fn()

    @property
    def metrics(self) -> list:
        """Return metrics."""
        return ["accuracy"]

[docs]    def fit(
        self, dataset: Dataset, augment_val: bool = True, callbacks: list = None,
    ) -> None:
        """Training loop."""
        if callbacks is None:
            callbacks = []

        if not self.has_pre_model:
            self.network.compile(
                loss=self.loss_fn,
                optimizer=self.optimizer_fn(float(self.train_args["learning_rate"])),
                metrics=self.metrics,
            )

        train_sequence = SequenceDataset(
            dataset.x_train,
            dataset.y_train,
            self.train_args["batch_size"],
            format_fn=self.batch_format_fn,
            augment_fn=self.batch_augment_fn,
            overfit=self.train_args["overfit"],
        )
        valid_sequence = SequenceDataset(
            dataset.x_valid,
            dataset.y_valid,
            self.train_args["batch_size"],
            format_fn=self.batch_format_fn,
            augment_fn=self.batch_augment_fn if augment_val else None,
        )

        self.network.fit(
            train_sequence,
            epochs=self.train_args["epochs"],
            callbacks=callbacks,
            validation_data=valid_sequence,
            shuffle=True,
        )

[docs]    def evaluate(self, x: np.ndarray, y: np.ndarray) -> List[float]:
        """Evaluate on images / masks and return l2 norm and f1 score."""
        if x.ndim < 4:
            x = np.expand_dims(x, -1)

        preds = self.network.predict(x)
        preds = np.float32(preds)
        y_float32 = np.float32(y)

        rmse_ = rmse(y_float32, preds) * self.dataset_args["cell_size"]
        f1_score_ = f1_score(y_float32, preds)

        return [f1_score_.numpy(), rmse_.numpy()]