Finish DynamicLazyConstraintsComponent rewrite

2025-12-06 01:18:52 -06:00 · 2021-04-06 08:19:29 -05:00
parent c6aee4f90d
commit 54c20382c9
4 changed files with 175 additions and 277 deletions
--- a/miplearn/components/component.py
+++ b/miplearn/components/component.py
@@ -106,8 +106,8 @@ class Component:
        """
        return

-    @staticmethod
    def sample_xy(
+        self,
        instance: Instance,
        sample: TrainingSample,
    ) -> Tuple[Dict, Dict]:
--- a/miplearn/components/lazy_dynamic.py
+++ b/miplearn/components/lazy_dynamic.py
@@ -3,17 +3,16 @@
 #  Released under the modified BSD license. See COPYING.md for more details.

 import logging
-import sys
-from typing import Any, Dict, List, TYPE_CHECKING, Hashable
+from typing import Dict, List, TYPE_CHECKING, Hashable, Tuple

 import numpy as np
-from tqdm.auto import tqdm

 from miplearn.classifiers import Classifier
 from miplearn.classifiers.counting import CountingClassifier
+from miplearn.classifiers.threshold import MinProbabilityThreshold, Threshold
 from miplearn.components import classifier_evaluation_dict
 from miplearn.components.component import Component
-from miplearn.extractors import InstanceFeaturesExtractor
+from miplearn.features import TrainingSample

 logger = logging.getLogger(__name__)

@@ -29,14 +28,21 @@ class DynamicLazyConstraintsComponent(Component):
    def __init__(
        self,
        classifier: Classifier = CountingClassifier(),
-        threshold: float = 0.05,
+        threshold: Threshold = MinProbabilityThreshold([0, 0.05]),
    ):
        assert isinstance(classifier, Classifier)
-        self.threshold: float = threshold
+        self.threshold_prototype: Threshold = threshold
        self.classifier_prototype: Classifier = classifier
-        self.classifiers: Dict[Any, Classifier] = {}
+        self.classifiers: Dict[Hashable, Classifier] = {}
+        self.thresholds: Dict[Hashable, Threshold] = {}
        self.known_cids: List[str] = []

+    @staticmethod
+    def enforce(cids, instance, model, solver):
+        for cid in cids:
+            cobj = instance.build_lazy_constraint(model, cid)
+            solver.internal_solver.add_constraint(cobj)
+
    def before_solve_mip(
        self,
        solver,
@@ -46,86 +52,91 @@ class DynamicLazyConstraintsComponent(Component):
        features,
        training_data,
    ):
-        instance.found_violated_lazy_constraints = []
+        training_data.lazy_enforced = set()
        logger.info("Predicting violated lazy constraints...")
-        violations = self.predict(instance)
-        logger.info("Enforcing %d lazy constraints..." % len(violations))
-        for v in violations:
-            cut = instance.build_lazy_constraint(model, v)
-            solver.internal_solver.add_constraint(cut)
+        cids = self.sample_predict(instance, training_data)
+        logger.info("Enforcing %d lazy constraints..." % len(cids))
+        self.enforce(cids, instance, model, solver)

    def iteration_cb(self, solver, instance, model):
-        logger.debug("Finding violated (dynamic) lazy constraints...")
-        violations = instance.find_violated_lazy_constraints(model)
-        if len(violations) == 0:
+        logger.debug("Finding violated lazy constraints...")
+        cids = instance.find_violated_lazy_constraints(model)
+        if len(cids) == 0:
+            logger.debug("No violations found")
            return False
-        instance.found_violated_lazy_constraints += violations
-        logger.debug("    %d violations found" % len(violations))
-        for v in violations:
-            cut = instance.build_lazy_constraint(model, v)
-            solver.internal_solver.add_constraint(cut)
-        return True
+        else:
+            instance.training_data[-1].lazy_enforced |= set(cids)
+            logger.debug("    %d violations found" % len(cids))
+            self.enforce(cids, instance, model, solver)
+            return True

-    def fit(self, training_instances):
-        logger.debug("Fitting...")
-        features = InstanceFeaturesExtractor().extract(training_instances)
+    def sample_xy_with_cids(
+        self,
+        instance: "Instance",
+        sample: TrainingSample,
+    ) -> Tuple[
+        Dict[Hashable, List[List[float]]],
+        Dict[Hashable, List[List[bool]]],
+        Dict[Hashable, List[str]],
+    ]:
+        x: Dict[Hashable, List[List[float]]] = {}
+        y: Dict[Hashable, List[List[bool]]] = {}
+        cids: Dict[Hashable, List[str]] = {}
+        for cid in self.known_cids:
+            category = instance.get_constraint_category(cid)
+            if category is None:
+                continue
+            if category not in x:
+                x[category] = []
+                y[category] = []
+                cids[category] = []
+            assert instance.features.instance is not None
+            assert instance.features.instance.user_features is not None
+            cfeatures = instance.get_constraint_features(cid)
+            assert cfeatures is not None
+            assert isinstance(cfeatures, list)
+            for ci in cfeatures:
+                assert isinstance(ci, float)
+            f = list(instance.features.instance.user_features)
+            f += cfeatures
+            x[category] += [f]
+            cids[category] += [cid]
+            if sample.lazy_enforced is not None:
+                if cid in sample.lazy_enforced:
+                    y[category] += [[False, True]]
+                else:
+                    y[category] += [[True, False]]
+        return x, y, cids

-        self.classifiers = {}
-        violation_to_instance_idx = {}
-        for (idx, instance) in enumerate(training_instances):
-            for v in instance.found_violated_lazy_constraints:
-                if isinstance(v, list):
-                    v = tuple(v)
-                if v not in self.classifiers:
-                    self.classifiers[v] = self.classifier_prototype.clone()
-                    violation_to_instance_idx[v] = []
-                violation_to_instance_idx[v] += [idx]
+    def sample_xy(
+        self,
+        instance: "Instance",
+        sample: TrainingSample,
+    ) -> Tuple[Dict, Dict]:
+        x, y, _ = self.sample_xy_with_cids(instance, sample)
+        return x, y

-        for (v, classifier) in tqdm(
-            self.classifiers.items(),
-            desc="Fit (lazy)",
-            disable=not sys.stdout.isatty(),
-        ):
-            logger.debug("Training: %s" % (str(v)))
-            label = [[True, False] for i in training_instances]
-            for idx in violation_to_instance_idx[v]:
-                label[idx] = [False, True]
-            label = np.array(label, dtype=np.bool8)
-            classifier.fit(features, label)
+    def sample_predict(
+        self,
+        instance: "Instance",
+        sample: TrainingSample,
+    ) -> List[str]:
+        pred: List[str] = []
+        x, _, cids = self.sample_xy_with_cids(instance, sample)
+        for category in x.keys():
+            assert category in self.classifiers
+            assert category in self.thresholds
+            clf = self.classifiers[category]
+            thr = self.thresholds[category]
+            nx = np.array(x[category])
+            proba = clf.predict_proba(nx)
+            t = thr.predict(nx)
+            for i in range(proba.shape[0]):
+                if proba[i][1] > t[1]:
+                    pred += [cids[category][i]]
+        return pred

-    def predict(self, instance):
-        violations = []
-        features = InstanceFeaturesExtractor().extract([instance])
-        for (v, classifier) in self.classifiers.items():
-            proba = classifier.predict_proba(features)
-            if proba[0][1] > self.threshold:
-                violations += [v]
-        return violations
-
-    def evaluate(self, instances):
-        results = {}
-        all_violations = set()
-        for instance in instances:
-            all_violations |= set(instance.found_violated_lazy_constraints)
-        for idx in tqdm(
-            range(len(instances)),
-            desc="Evaluate (lazy)",
-            disable=not sys.stdout.isatty(),
-        ):
-            instance = instances[idx]
-            condition_positive = set(instance.found_violated_lazy_constraints)
-            condition_negative = all_violations - condition_positive
-            pred_positive = set(self.predict(instance)) & all_violations
-            pred_negative = all_violations - pred_positive
-            tp = len(pred_positive & condition_positive)
-            tn = len(pred_negative & condition_negative)
-            fp = len(pred_positive & condition_negative)
-            fn = len(pred_negative & condition_positive)
-            results[idx] = classifier_evaluation_dict(tp, tn, fp, fn)
-        return results
-
-    def fit_new(self, training_instances: List["Instance"]) -> None:
-        # Update known_cids
+    def fit(self, training_instances: List["Instance"]) -> None:
        self.known_cids.clear()
        for instance in training_instances:
            for sample in instance.training_data:
@@ -133,40 +144,57 @@ class DynamicLazyConstraintsComponent(Component):
                    continue
                self.known_cids += list(sample.lazy_enforced)
        self.known_cids = sorted(set(self.known_cids))
+        super().fit(training_instances)

-        # Build x and y matrices
-        x: Dict[Hashable, List[List[float]]] = {}
-        y: Dict[Hashable, List[List[bool]]] = {}
-        for instance in training_instances:
-            for sample in instance.training_data:
-                if sample.lazy_enforced is None:
-                    continue
-                for cid in self.known_cids:
-                    category = instance.get_constraint_category(cid)
-                    if category is None:
-                        continue
-                    if category not in x:
-                        x[category] = []
-                        y[category] = []
-                    assert instance.features.instance is not None
-                    assert instance.features.instance.user_features is not None
-                    cfeatures = instance.get_constraint_features(cid)
-                    assert cfeatures is not None
-                    assert isinstance(cfeatures, list)
-                    for ci in cfeatures:
-                        assert isinstance(ci, float)
-                    f = list(instance.features.instance.user_features)
-                    f += cfeatures
-                    x[category] += [f]
-                    if cid in sample.lazy_enforced:
-                        y[category] += [[False, True]]
-                    else:
-                        y[category] += [[True, False]]
-
-        # Train classifiers
+    def fit_xy(
+        self,
+        x: Dict[Hashable, np.ndarray],
+        y: Dict[Hashable, np.ndarray],
+    ) -> None:
        for category in x.keys():
            self.classifiers[category] = self.classifier_prototype.clone()
-            self.classifiers[category].fit(
-                np.array(x[category]),
-                np.array(y[category]),
+            self.thresholds[category] = self.threshold_prototype.clone()
+            npx = np.array(x[category])
+            npy = np.array(y[category])
+            self.classifiers[category].fit(npx, npy)
+            self.thresholds[category].fit(self.classifiers[category], npx, npy)
+
+    def sample_evaluate(
+        self,
+        instance: "Instance",
+        sample: TrainingSample,
+    ) -> Dict[Hashable, Dict[str, float]]:
+        assert sample.lazy_enforced is not None
+        pred = set(self.sample_predict(instance, sample))
+        tp: Dict[Hashable, int] = {}
+        tn: Dict[Hashable, int] = {}
+        fp: Dict[Hashable, int] = {}
+        fn: Dict[Hashable, int] = {}
+        for cid in self.known_cids:
+            category = instance.get_constraint_category(cid)
+            if category is None:
+                continue
+            if category not in tp.keys():
+                tp[category] = 0
+                tn[category] = 0
+                fp[category] = 0
+                fn[category] = 0
+            if cid in pred:
+                if cid in sample.lazy_enforced:
+                    tp[category] += 1
+                else:
+                    fp[category] += 1
+            else:
+                if cid in sample.lazy_enforced:
+                    fn[category] += 1
+                else:
+                    tn[category] += 1
+        return {
+            category: classifier_evaluation_dict(
+                tp=tp[category],
+                tn=tn[category],
+                fp=fp[category],
+                fn=fn[category],
            )
+            for category in tp.keys()
+        }