Introduce mean_score and low_score, consistent aggregate computations

Signed-off-by: Christoph Auer <cau@zurich.ibm.com>
2025-07-26 20:14:47 +00:00 · 2025-05-06 16:40:02 +02:00 · 2025-05-06 16:40:02 +02:00 · 2a6537289b
commit 2a6537289b
parent f9496e4a91
3 changed files with 62 additions and 29 deletions
--- a/docling/datamodel/base_models.py
+++ b/docling/datamodel/base_models.py
@ -315,29 +315,82 @@ class QualityGrade(str, Enum):


 class PageConfidenceScores(BaseModel):
-    overall_score: ScoreValue = np.nan
-
    parse_score: ScoreValue = np.nan
    layout_score: ScoreValue = np.nan
    table_score: ScoreValue = np.nan
    ocr_score: ScoreValue = np.nan

-    @computed_field  # type: ignore
-    @property
-    def grade(self) -> QualityGrade:
-        if self.overall_score < 0.5:
+    def _score_to_grade(self, score: ScoreValue) -> QualityGrade:
+        if score < 0.5:
            return QualityGrade.POOR
-        elif self.overall_score < 0.8:
+        elif score < 0.8:
            return QualityGrade.FAIR
-        elif self.overall_score < 0.9:
+        elif score < 0.9:
            return QualityGrade.GOOD
-        elif self.overall_score >= 0.9:
+        elif score >= 0.9:
            return QualityGrade.EXCELLENT

        return QualityGrade.UNSPECIFIED

+    @computed_field  # type: ignore
+    @property
+    def mean_grade(self) -> QualityGrade:
+        return self._score_to_grade(self.mean_score)
+
+    @computed_field  # type: ignore
+    @property
+    def low_grade(self) -> QualityGrade:
+        return self._score_to_grade(self.low_score)
+
+    @computed_field  # type: ignore
+    @property
+    def mean_score(self) -> ScoreValue:
+        return ScoreValue(
+            np.nanmean(
+                [
+                    self.ocr_score,
+                    self.table_score,
+                    self.layout_score,
+                    self.parse_score,
+                ]
+            )
+        )
+
+    @computed_field  # type: ignore
+    @property
+    def low_score(self) -> ScoreValue:
+        return ScoreValue(
+            np.nanquantile(
+                [
+                    self.ocr_score,
+                    self.table_score,
+                    self.layout_score,
+                    self.parse_score,
+                ],
+                q=0.05,
+            )
+        )
+

 class ConfidenceReport(PageConfidenceScores):
    pages: Dict[int, PageConfidenceScores] = Field(
        default_factory=lambda: defaultdict(PageConfidenceScores)
    )
+
+    @computed_field  # type: ignore
+    @property
+    def mean_score(self) -> ScoreValue:
+        return ScoreValue(
+            np.nanmean(
+                [c.mean_score for c in self.pages.values()],
+            )
+        )
+
+    @computed_field  # type: ignore
+    @property
+    def low_score(self) -> ScoreValue:
+        return ScoreValue(
+            np.nanmean(
+                [c.low_score for c in self.pages.values()],
+            )
+        )
--- a/docling/models/page_assemble_model.py
+++ b/docling/models/page_assemble_model.py
@ -153,17 +153,4 @@ class PageAssembleModel(BasePageModel):
                        elements=elements, headers=headers, body=body
                    )

-                    # Aggregate page score
-                    scores = conv_res.confidence.pages[page.page_no]
-                    scores.overall_score = float(
-                        np.nanmean(
-                            [
-                                scores.ocr_score,
-                                scores.table_score,
-                                scores.layout_score,
-                                scores.parse_score,
-                            ]
-                        )
-                    )
-
                yield page
--- a/docling/pipeline/standard_pdf_pipeline.py
+++ b/docling/pipeline/standard_pdf_pipeline.py
@ -269,13 +269,6 @@ class StandardPdfPipeline(PaginatedPipeline):
                    )
                )

-                conv_res.confidence.overall_score = float(
-                    np.nanquantile(
-                        [c.overall_score for c in conv_res.confidence.pages.values()],
-                        q=0.05,  # overall score should relate to worst 5% of page scores.
-                    )
-                )
-
        return conv_res

    @classmethod